
Συζητάμε
με τον Αντώνη Μαυρόπουλο, συγγραφέα του βιβλίου «Τεχνητή νοημοσύνη -
Άνθρωπος, φύση, μηχανές» (εκδ. Τόπος). Τι είναι τα Μεγάλα Γλωσσικά
Μοντέλα και ποιον εξυπηρετούν; Υπό ποιες προϋποθέσεις πορεί η ΤΝ να
γίνει κοινωνικά χρήσιμη; Πώς μπορούμε να την αναπτύξουμε με τρόπο που να
ωφελεί όλη την ανθρωπότητα και να μην ενισχύει τις υφιστάμενες
ανισότητες;
Συνέντευξη στον Κ.Β. Κατσουλάρη
Η συζήτηση για την ΤΝ στον δημόσιο λόγο συχνά γίνεται υπό το φως μιας
αντίληψης τεχνοκρατικής, που αντιλαμβάνεται την τεχνολογία ως εργαλείο,
αγνοώντας τόσο τις φιλοσοφικές προεκτάσεις κάθε σημαντικής τεχνολογικής
αλλαγής και υποτιμώντας κοινωνικές και πολιτικές δυνάμεις που παίρνουν
αποφάσεις προς συγκεκριμένες κατευθύνσεις. Οι εξελίξεις στην ΤΝ δεν
είναι ένα απλό «φυσικό φαινόμενο», όπως αντιλαμβάνεται κανείς συζητώντας
με τον Αντώνη Μαυρόπουλο, έναν άνθρωπο που συνδυάζει την τεχνική γνώση
με την ικανότητα μιας ευρύτερης θέασης. Όπως το θέτει ο ίδιος, «Το
βασικό πρόβλημα δεν είναι ότι "έρχεται κάτι πανίσχυρο", αλλά ότι ήδη
συγκροτείται μια νέα ιδιωτική εξουσία που διεκδικεί να ορίζει τι είναι
αλήθεια, τι είναι γνώση και τι είναι αποδεκτός λόγος μέσα από κλειστά
συστήματα».

Ένα πρόβλημα που διαπιστώνω μιλώντας με ανθρώπους σήμερα για
την ΤΝ, και ιδιαίτερα για τα Μεγάλα Γλωσσικά Μοντέλα, είναι ότι υπάρχει
μια δυσκολία να αντιληφθούμε τι πραγματικά είναι αυτές οι μηχανές και
πώς κάνουν αυτό που κάνουν. Σαν να μας λείπουν οι κατάλληλες εικόνες ή
μεταφορές, που θα μας βοηθήσουν να τα κατανοήσουμε βαθύτερα. Μπορείτε να
βοηθήσετε;
Πιστεύω ότι χρειαζόμαστε πολλές και διαφορετικές μεταφορές για να
κατανοήσουμε καλύτερα τα Μεγάλα Γλωσσικά Μοντέλα και για να φωτίσουμε
κάποιες βαθύτερες πλευρές τους. Και έκανα μία προσπάθεια να καταγράψω
κάποιες από αυτές στο βιβλίο μου. Ο ίδιος όρος «τεχνητή νοημοσύνη» είναι
μία μάλλον παραπλανητική μεταφορά, διότι αποδίδει το ανθρώπινο
χαρακτηριστικό της νοημοσύνης σε προγράμματα που δεν έχουν τίποτα που να
δικαιολογεί αυτό τον ανθρωπομορφισμό. Προτιμώ άλλες περιεκτικές
μεταφορές. Για παράδειγμα, μου αρέσει να παρουσιάζω τα μεγάλα γλωσσικά
μοντέλα ως ένα τρόπο θέασης του κόσμου βασισμένο στις ψηφιακές σκιές της
ανθρωπότητας. Θεωρώ επίσης πολύ χρήσιμο να συζητάμε για τα Μεγάλα
Γλωσσικά Μοντέλα ως φράγματα νερού που επιδιώκουν να συγκεντρώσουν και
να αξιοποιήσουν όλες τις σταγόνες της συλλογικής διάνοιας της
ανθρωπότητας, όπως αυτές αποθέτονται καθημερινά στο διαδίκτυο και τις
εφαρμογές του. Τέλος, συζητώντας για τα Μεγάλα Γλωσσικά Μοντέλα ως ένα
διαμορφούμενο χάρτη του κόσμου και ως τη Λυδία Λίθο της εποχής μας,
μπορούμε να φέρουμε στην επιφάνεια πολλές ακόμα πλευρές που παραμένουν
αθέατες στη δημόσια συζήτηση. Στο σεμινάριο της Τετάρτης 18/2 θα εμβαθύνουμε ακόμα περισσότερο σε αυτή την κουβέντα.
Τα Μεγάλα Γλωσσικά Μοντέλα έχουν εκπαιδευτεί με τεράστιους
όγκους λόγου και τεχνικές βαθιάς μάθησης που μας δίνουν την εντύπωση ότι
μιμούνται πειστικά τον ανθρώπινο λόγο, ότι είναι σε θέση να σκεφτούν,
να παράξουν πρωτότυπο λόγο. Πόσο κοντά είμαστε σε κάτι τέτοιο;
Είναι αλήθεια ότι τα Μεγάλα Γλωσσικά Μοντέλα γίνονται όλο και
καλύτερα στο να μιμούνται πειστικά τον ανθρώπινο λόγο. Αυτό όμως δε
σημαίνει ότι μπορούν να παράγουν πρωτότυπο λόγο. Για αρχή, ας
ξεκινήσουμε λέγοντας ότι αυτό που κάνουν τα μεγάλα γλωσσικά μοντέλα
είναι να δημιουργούν λογικοφανείς προτάσεις που, κυριολεκτικά,
στερούνται κάθε νοήματος για το μοντέλο.
Στην πραγματικότητα, αυτό που κάνουν είναι μια εξαιρετικά
εκλεπτυσμένη στατιστική επεξεργασία. Δεν «σκέφτονται» και δεν έχουν
καμία αίσθηση του νοήματος πίσω από τις λέξεις που χρησιμοποιούν. Η
«πρωτοτυπία» τους είναι ουσιαστικά ένας ανασυνδυασμός (recombination)
υπαρχόντων μοτίβων από τα δεδομένα εκπαίδευσης, τα οποία ανασυνθέτουν με
περίπλοκες στατιστικές τεχνικές. Λείπει, δηλαδή, η πρόθεση (intent) και
η αναφορά(reference) στον πραγματικό κόσμο, στοιχεία που είναι
θεμελιώδη για την ανθρώπινη ομιλία και δημιουργικότητα.
Τα Μεγάλα Γλωσσικά Μοντέλα βλέπουν όλα τα κομμάτια του παζλ άσπρα,
χωρίς να τα νοηματοδοτούν με οποιονδήποτε τρόπο. Έχουν όμως πανίσχυρες
τεχνικές επεξεργασίας και υπολογιστική ισχύ που τους επιτρέπει, σε μικρό
χρόνο, να λύσουν το παζλ δοκιμάζοντας εκατομμύρια συνδυασμούς για το
πως τα διαφορετικά σχήματα ταιριάζουν μεταξύ τους.
Για να κατανοήσουμε τη διαφορά, θα χρησιμοποιήσω το παράδειγμα ενός
παζλ. Όταν ο άνθρωπος λύνει ένα παζλ, ξεκινάει δίνοντας κάποιο νόημα στα
κομμάτια. Τους αποδίδει κάποιες ιδιότητες όπως το χρώμα, η εικόνα που
έχουν, η συσχέτιση τους με άλλα βάσει χρώματος, εικόνας και σχήματος.
Αντίθετα, τα Μεγάλα Γλωσσικά Μοντέλα βλέπουν όλα τα κομμάτια του παζλ
άσπρα, χωρίς να τα νοηματοδοτούν με οποιονδήποτε τρόπο. Έχουν όμως
πανίσχυρες τεχνικές επεξεργασίας και υπολογιστική ισχύ που τους
επιτρέπει, σε μικρό χρόνο, να λύσουν το παζλ δοκιμάζοντας εκατομμύρια
συνδυασμούς για το πως τα διαφορετικά σχήματα ταιριάζουν μεταξύ τους.
Ένας άνθρωπος δεν θα δούλευε ποτέ με αυτό τον τρόπο.
Πώς κρίνετε τον όρο «στοχαστικοί παπαγάλοι», με τον οποίο τα χαρακτήρισε γνωστή Αμερικανίδα γλωσσολόγος;
Νομίζω ότι είναι ένας εύστοχος και πολύ ουσιαστικός χαρακτηρισμός. Ο
όρος «στοχαστικοί παπαγάλοι» μας υπενθυμίζει ότι η ευφράδεια δεν
συνεπάγεται κατανόηση. Ένα μοντέλο μπορεί να γράψει ένα άψογο κείμενο
για τη διαχείριση αποβλήτων ή την περιβαλλοντική νομοθεσία, χωρίς να
έχει καμία αντίληψη των φυσικών συνεπειών αυτών των εννοιών. Επιπλέον,
μας φέρνει στο μυαλό μία κοινή εμπειρία των συστηματικών χρηστών των
Μεγάλων Γλωσσικών Μοντέλων, τη λεγόμενη «κατανόηση Ποτέμκιν», όπου το
μοντέλο απαντά σωστά σε πολύπλοκες ερωτήσεις αλλά αποτυγχάνει σε απλές
λογικές συνεπαγωγές, αποδεικνύοντας ότι η γνώση του είναι επιφανειακή
και εύθραυστη. Τέλος, η θεώρηση των Μεγάλων Γλωσσικών Μοντέλων ως
«στοχαστικών παπαγάλων» μας προφυλάσσει από το να τους αποδώσουμε
ανθρώπινες ιδιότητες (ανθρωπομορφισμός) και να εμπιστευτούμε τυφλά την
κρίση τους σε κρίσιμα ζητήματα, καθώς είναι επιρρεπή σε λάθη και
αναπαραγωγή προκαταλήψεων που υπάρχουν στα δεδομένα εκπαίδευσης.

Δυο έννοιες που επανέρχονται στο στόμα των γκουρού της
τεχνολογίας είναι η Μοναδικότητα (singularity) και η Γενική Τεχνική
Νοημοσύνη (Artificial General Intelligence – AGI). Άλλοι αναφέρονται σε
αυτά με δέος, άλλοι με προσδοκία. Η υπόθεση είναι ότι η ΤΝ, καθώς
διαρκώς θα εξελίσσεται, θα φτάσει γρήγορα σε ένα σημείο που θα ξεπεράσει
τον άνθρωπο σε όλα τα πεδία, με έναν συνολικό τρόπο. Θέλετε να μας
πείτε τις σκέψεις σας γι’ αυτά τα θέματα;
Ας ξεκινήσουμε λέγοντας ότι δεν πρόκειται απλώς για τεχνολογικές
προβλέψεις, αλλά για πολιτικές επιλογές που μεταμφιέζονται ως
τεχνολογικό πεπρωμένο. Πρόκειται για έναν τεχνολογικό μεσσιανισμό που
υπόσχεται τη σωτηρία μέσω της τεχνολογίας. Αυτό το αφήγημα εξυπηρετεί
συγκεκριμένες λειτουργίες.
Αυτή η αναμενόμενη εξέλιξη της τεχνητής νοημοσύνης παρουσιάζεται ως
μία αναπόφευκτη φυσική διαδικασία, παρόμοια με τον εξελικτικό νόμο. Έτσι
αποσιωπώνται οι πραγματικές ερωτήσεις: Ποιος αποφασίζει τι θα
αναπτυχθεί; Ποιος θα το ελέγχει; Ποιος θα ωφεληθεί; Η προσδοκία της
λεγόμενης Γενικής Τεχνητής Νοημοσύνης δικαιολογεί τις επενδύσεις
τρισεκατομμυρίων δολαρίων χωρίς ορατές και χειροπιαστές προσδοκίες, τη
δημιουργία νέων μονοπωλίων, την αλόγιστη κατασπατάληση ενέργειας και
νερού αλλά και την εκμετάλλευση φθηνής εργασίας, στο όνομα μίας όλο και
απονομιμοποιημένης τεχνολογικής προόδου. Έτσι, αντί να αντιμετωπίσουμε
τις τεράστιες δομικές ανισότητες, την περιβαλλοντική κρίση, την
καταστροφή των κοινών και την εμπορευματοποίηση των πάντων, μας
προσφέρεται μια τεχνολογική λύση-πανάκεια που πάντα βρίσκεται «10 χρόνια
μακριά».
Έχουμε μία καταφανώς εσφαλμένη παραδοχή που θεωρεί ότι η ανθρώπινη
νοημοσύνη -που είναι ενσώματη, κοινωνικά διαμορφωμένη, και πολιτισμικά
εγγεγραμμένη- μπορεί να αναχθεί σε έναν υπολογιστικό αλγόριθμο.
Ωστόσο, η ίδια η έννοια της Γενικής Τεχνητής Νοημοσύνης είναι
προβληματική από φιλοσοφική και πολιτική άποψη. Από τη μία μεριά έχουμε
μία καταφανώς εσφαλμένη παραδοχή που θεωρεί ότι η ανθρώπινη νοημοσύνη
-που είναι ενσώματη, κοινωνικά διαμορφωμένη, και πολιτισμικά
εγγεγραμμένη- μπορεί να αναχθεί σε έναν υπολογιστικό αλγόριθμο. Από την
άλλη μεριά, η Γενική Τεχνητή Νοημοσύνη παρουσιάζεται ως ουδέτερη και
καθολική, ενώ στην πραγματικότητα αντικατοπτρίζει τις αξίες,
προτεραιότητες και προκαταλήψεις των (κυρίως λευκών, ανδρών και
προνομιούχων) δημιουργών της.[................................]
Αντώνης Μαυρόπουλος: «Το κοινωνικά συμφέρον είναι η τεχνητή νοημοσύνη να υιοθετείται αργά και προσεκτικά, όχι με συνθήκες Άγριας Δύσης»