Όσα κατέγραψε ο άνθρωπος σε εικόνα τα τελευταία 150 χρόνια, τα παρήγαγε σε 12 μήνες η ΑΙ - OIafaq
Τα έργα τέχνης που δημιουργήθηκαν μέσω της ΑΙ (τεχνητής νοημοσύνης) και τα deepfakes έχουν κατακλύσει τον κόσμο. Από ευφάνταστες πλωτές κατασκευές και σουρεαλιστικά έπιπλα μέχρι την αναδημιουργία προγονικών πορτρέτων, οι αλγόριθμοι τύπου κείμενο σε είκονα (text-to-image) – π.χ. Midjourney, DALL·E 2 και Stable Diffusion – έχουν γίνει ένα νέο αγαπημένο εργαλείο για τους καλλιτέχνες. Ο συνδυασμός της ακριβής εισαγωγής προτροπών και του δημιουργικού οράματος του εκάστοτε καλλιτέχνη, οδήγησε σε εντυπωσιακά γραφικά και έργα τέχνης, τα οποία έχουν πλημμυρίσει το ίντερνετ.
Η μηχανή αναζήτησης stock εικόνων, Everypixel δημοσίευσε μια λεπτομερή αναφορά που ποσοτικοποιεί αυτό το σύγχρονο φαινόμενο: Με μια πρόχειρη εκτίμηση, σε μόλις 12 μήνες, οι αλγόριθμοι text-to-image παρήγαγαν πάνω από 150 δισεκατομμύρια εικόνες!
«Από την κυκλοφορία του DALL·E 2, κατά μέσο όρο 34 εκατομμύρια εικόνες δημιουργούνται καθημερινά», γράφει το Everypixel. Σύμφωνα με την έκθεση, ως ανθρωπότητα χρειαστήκαμε περίπου 150 χρόνια για να συγκεντρώσουμε το 10% (15 δισεκατομμύρια) αυτού του ποσού, αποδεικνύοντας την απίστευτη —και εξίσου ανησυχητική— δύναμη της μηχανικής μάθησης και του ΑΙ.
Το Everypixel υπολογίζει την επίπτωση των λογισμικών text-to-image
Η αναφορά της Everypixel συνδυάζει στατιστικά στοιχεία και γεγονότα που σχετίζονται με τέσσερα διαφορετικά λογισμικά κειμένου σε εικόνα (text-to-image): το Midjourney, το DALL·E 2, το Stable Diffusion και το Adobe Firefly. Αρχικά, το OpenAI παρουσίασε το DALL·E 2 τον Απρίλιο του 2022 πρώτα ως invitation-only πλατφόρμα (πλατφόρμα με είσοδο μόνο με πρόσκληση). Η πρόσβαση στην πλατφόρμα πήρε παράταση για αρκετούς μήνες, μέχρι που τον Σεπτέμβριο του 2022, έγινε ανοιχτή σε όλους τους χρήστες χωρίς περιορισμούς.
Μέχρι τότε, δύο εκατομμύρια εικόνες παράγονταν καθημερινά κατά μέσο όρο. Ενώ το ακριβές χρονικό πλαίσιο και η μέθοδος για τον υπολογισμό αυτού του αριθμού παραμένουν ασαφή, «υποθέτουμε ότι αυτός είναι ένας μέσος όρος, πράγμα που σημαίνει ότι έχουν δημιουργηθεί περίπου 916 εκατομμύρια εικόνες σε μια ενιαία πλατφόρμα σε 15 μήνες», μοιράζεται το Everypixel.
Ακολουθεί το Midjourney. Ξεκίνησε τον Ιούλιο του 2022, η χρήση του Midjourney στην αποκλειστική του πλατφόρμα, Discord, περιλαμβάνει περίπου 20 έως 40 εργασίες δημιουργίας εικόνας ανά δευτερόλεπτο. Διαθέτει 15 εκατομμύρια εγγεγραμμένους χρήστες και 1,5 έως 2,5 εκατομμύρια ενεργά μέλη ανά πάσα στιγμή. Χρησιμοποιώντας κατά μέσο όρο 30 εργασίες εικόνας ανά δευτερόλεπτο, ο ημερήσιος αριθμός θα μπορούσε να φτάσει τα 2,5 εκατομμύρια. Από την κυκλοφορία του, έχουν δημιουργηθεί περίπου 964 εκατομμύρια εικόνες με το Midjourney.
Εν τω μεταξύ, τον Αύγουστο του 2022, η Stability AI αποκάλυψε το μοντέλο κειμένου σε εικόνα που είναι γνωστό ως Stable Diffusion. Οι επίσημοι ιστότοποι δοκιμών για αυτό το πρόγραμμα περιλαμβάνουν το χώρο Dreamstudio και Stability AI στο Hugging Face, με πάνω από 10 εκατομμύρια χρήστες σε όλα τα κανάλια. «Αν υπολογίσουμε τους αριθμούς και τις τάσεις του Midjourney που έχουμε στη διάθεσή μας, αποδεικνύεται ότι μέσω των επίσημων καναλιών Stable Diffusion, οι χρήστες δημιουργούν 2 εκατομμύρια εικόνες σε καθημερινή βάση και στον πρώτο χρόνο κυκλοφορίας, ο αριθμός αυτός έχει φτάσει τις 690 εκατομμύρια εικόνες», αναφέρει η έκθεση.
Η πρόκληση, ωστόσο, έγκειται στην open-source φύση του κώδικα που χρησιμοποιεί το Stable Diffusion (κώδικας ανοικτής πηγής). Αυτό σημαίνει ότι η δημιουργία περιεχομένου εκτείνεται πέρα από τις επίσημες πλατφόρμες. Πολυάριθμες πλατφόρμες, εφαρμογές και υπηρεσίες που έχουν δημιουργηθεί πάνω στην τεχνολογία του Stable Diffusion περιπλέκουν περαιτέρω την ακριβή εκτίμηση καθώς απευθύνονται σε ένα μεγάλο και μη μετρήσιμο κοινό, παράγοντας περιεχόμενο που είναι δύσκολο να μετρηθεί λόγω της συνεχούς και γρήγορης ανάπτυξης.
Το Everypixel εξέτασε αποθετήρια (repositories) όπως το GitHub, το HuggingFace και το Civitai για να κατανοήσει καλύτερα αυτήν την πρόκληση. Αυτές οι πλατφόρμες φιλοξενούν χιλιάδες μοντέλα που βασίζονται στο Stable Diffusion.
[........................................................]
Κι αν το φαινόμενο των “ψεύτικων” εικόνων δεν είναι καινούργιο, τότε γιατί μας αφορά τόσο η σκοτεινή πλευρά της τεχνητής νοημοσύνης και των deepfakes; Διότι, ποτέ ξανά τέτοιες ψεύτικες εικόνες δεν έχουν εξαπλωθεί με τέτοια ταχύτητα και μαζικότητα. Ποτέ ξανά τέτοιες εικόνες δεν έκαναν τόσο πολύ κόσμο να αμφισβητήσει το αν είναι αληθινές ή όχι.
Μέσα σε λίγους μόνο μήνες, η τεχνητή νοημοσύνη έχει προχωρήσει από τις φωτορεαλιστικές εικόνες του DALL·E 2 και του Midjourney σε ακόμα περισσότερα και πιο εξελιγμένα εργαλεία, που δημιουργούν ρεαλιστικά βίντεο και ολόκληρες ταινίες.
Όλες οι ενδείξεις μαρτυρούν ότι η τεχνητή νοημοσύνη ήρθε για να μείνει – η φόρα της δε δείχνει να σταματά σύντομα. Και ενώ είναι ομολογουμένως διασκεδαστικό να πειραματίζεσαι μαζί της, είναι, αλήθεια ότι αποτελεί σημαντική απειλή – ειδικά στο πλαίσιο της παραπληροφόρησης και των fake news.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου