Το ευφυές «κρι κρι» που μιλάει ελληνικά
Το δεύτερο μεγάλο γλωσσικό μοντέλο του, το Llama-Krikri, λανσάρει σήμερα το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου «Αθηνά»,
το μοναδικό στην Ελλάδα που έχει χτίσει μηχανές οι οποίες απαντούν σε
ερωτήματα και επιλύουν προβλήματα μιμούμενες ικανότητες του ανθρώπου.
Βέβαια το Llama-Krikri, το οποίο διαδέχθηκε το πρώτο γλωσσικό μοντέλο
του Ινστιτούτου, το Meltemi, δεν είναι του κυβισμού του DeepSeek ή του ChatGPT,
όμως κάνει ό,τι ακριβώς και αυτά. Η συζήτηση με μέλη της ομάδας που το
δημιούργησε μοιάζει με βουτιά στον συναρπαστικό κόσμο των τεχνητών
νευρωνικών δικτύων, που χειρίζονται με τρόπο θαυμαστό τη φυσική
ανθρώπινη γλώσσα.
Ξεκινώντας από το όνομα, γιατί Llama-Krikri; «Είναι ένα παιχνίδι συνειρμών. Προέκυψε από το μοντέλο βάσης που χρησιμοποιήσαμε, το μοντέλο ανοιχτού κώδικα Llama 3.1 της Meta, και το ελληνικό αντίστοιχο του συμπαθούς θηλαστικού στο οποίο το μοντέλο αυτό παραπέμπει, το κρι κρι», εξηγεί χαμογελώντας ο Βασίλης Κατσούρος, διευθυντής του Ινστιτούτου Επεξεργασίας του Λόγου.
Το Llama-Krikri είναι μικρότερο σε υπολογιστικό μέγεθος από το DeepSeek, όμως πόσο μικρότερο; «Αν το νευρωνικό δίκτυο του DeepSeek διαθέτει 671 δισεκατομμύρια παραμέτρους, εκ των οποίων ανάλογα με το περιεχόμενο της ερώτησης του χρήστη κάθε φορά ενεργοποιούνται 37 δισεκατομμύρια παράμετροι, το δικό μας μοντέλο διαθέτει 8 δισεκατομμύρια παραμέτρους», εξηγεί ο κ. Κατσούρος. Για να το πούμε απλοϊκά, αν μετασχηματίζαμε την ελληνική γλώσσα σε αριθμούς, διότι ο υπολογιστής καταλαβαίνει αριθμούς, όχι λέξεις, το Llama-Krikri περιγράφει την ελληνική γλώσσα με 8 δισ. αριθμούς. «Είναι διαφορετικού μεγέθους επένδυση. Τα υψηλού “κυβισμού” γλωσσικά μοντέλα χρειάζονται τεράστιο όγκο δεδομένων, τεράστια υπολογιστική ισχύ και πάρα πολύ χρήμα».
Ψηφιακοί βοηθοί
Μικρότερο, λοιπόν, όμως θαυματουργό. Το Llama-Krikri κάνει ό,τι και το Meltemi, αλλά πολύ καλύτερα. Τι έκανε το Meltemi; Εδωσε τη δυνατότητα στην ελληνική ακαδημαϊκή και ερευνητική κοινότητα και σε επιχειρήσεις να χτίσουν τον δικό τους ψηφιακό βοηθό. «Δεν παρέχει την υπηρεσία των απευθείας ερωτήσεων από το γενικό κοινό, όμως δίνει τη δυνατότητα σε όποιον θέλει και έχει κάποιες γνώσεις προγραμματισμού να το κατεβάσει στον υπολογιστή του, να το προσαρμόσει στις ανάγκες του, να υποβάλλει ερωτήσεις και να παίρνει πολύ γρήγορα απαντήσεις πάνω στα δεδομένα του», εξηγεί ο Σωκράτης Σοφιανόπουλος, ο οποίος μαζί με τους Προκόπη Προκοπίδη, Γιώργο Παρασκευόπουλο, Λέοντα Βουκούτη και Δημήτρη Ρούσση, όλοι συνεργαζόμενοι ερευνητές στο Ινστιτούτο Επεξεργασίας του Λόγου, δημιούργησαν το Llama-Krikri.
«Είναι
σαν να βάζεις το γλωσσικό μοντέλο να κοιτάζει τα δεδομένα που έχεις
αποθηκεύσει κάπου και να τα χρησιμοποιεί σαν “σκονάκι” για να σου δίνει
απαντήσεις». Σε άπταιστα νέα ελληνικά αλλά και αγγλικά. «Το Meltemi είχε
πολύ μεγάλη απήχηση – δεκάδες χιλιάδες downloads στο Hugging Face,
πλατφόρμα διάθεσης μοντέλων τεχνητής νοημοσύνης. Το κατέβασαν φοιτητές,
ακαδημαϊκοί, χρησιμοποιήθηκε σε πολλές εφαρμογές και ερευνητικά έργα,
τόνωσε την ερευνητική δραστηριότητα στην Ελλάδα, αλλά και την
παραγωγικότητα σε μικρομεσαίες επιχειρήσεις. Προσέφερε μια φθηνή λύση
για γρήγορη εκτέλεση έργων», λέει ο κ. Σοφιανόπουλος. Παράλληλα, το
Ινστιτούτο έχει βοηθήσει δημόσιους οργανισμούς και επιχειρήσεις να
χτίσουν τους δικούς τους ψηφιακούς βοηθούς. «Στο πλαίσιο των Ευρωπαϊκών Κόμβων Ψηφιακής Καινοτομίας
ερχόμαστε σε επαφή με επιχειρήσεις οι οποίες μας ζητούν να κάνουμε
προσαρμογές του γλωσσικού μοντέλου στις ανάγκες τους», λέει ο κ.
Κατσούρος.
[.........................]
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου