Σήμερα, η χρήση πλατφορμών GenAI, όπως το ChatGPT, το Gemini ή το DeepSeek, είναι πλέον καθημερινή. Μόνο το ChatGPT αριθμεί πάνω από 800 εκατομμύρια ενεργούς εβδομαδιαίους χρήστες παγκοσμίως, οι οποίοι γράφουν κείμενα, αναζητούν πληροφορίες, ζητούν αναλύσεις ή ιδέες. Η εμπειρία μοιάζει απλή: μια «έξυπνη» πλατφόρμα που απαντά σε ό,τι της ζητηθεί.
Πίσω από αυτή την εμπειρία, όμως, δεν βρίσκεται μία μόνο τεχνολογία, μιας και από την πρώτη κυκλοφορία του ChatGPT 3.5 το 2022 μέχρι σήμερα, προστίθενται συνεχώς νέες δυνατότητες (AI modalities) όπως και η σύνδεση με τις μηχανές αναζήτησης. Στον πυρήνα της, όμως, ειδικά όταν πρόκειται για κατανόηση και παραγωγή λόγου, λειτουργεί ένας συγκεκριμένος μηχανισμός: το Large Language Model, ή LLM.
Η συζήτηση γύρω από την τεχνητή νοημοσύνη τα τελευταία χρόνια περιστρέφεται σε μεγάλο βαθμό γύρω από αυτά τα τρία γράμματα. Τα Large Language Models έχουν περάσει από τα ερευνητικά εργαστήρια στους οργανισμούς, στα πανεπιστήμια, ακόμη και στην καθημερινή εργασία εκατομμυρίων ανθρώπων. Γράφουν, μεταφράζουν, συνοψίζουν, απαντούν, προτείνουν. Και όσο αυξάνονται οι εφαρμογές τους, τόσο εντείνεται και η σύγχυση γύρω από το τι πραγματικά είναι.
Το ερώτημα «τι είναι ένα LLM;» είναι κυρίως λειτουργικό. Γιατί από την απάντηση εξαρτάται το πώς θα τα αξιοποιήσουμε, αλλά και τι θα περιμένουμε από αυτά.
Τι σημαίνει πραγματικά ο όρος Large Language Model
Ο όρος Large Language Model περιγράφει ένα σύστημα τεχνητής νοημοσύνης που έχει εκπαιδευτεί να επεξεργάζεται και να παράγει ανθρώπινο κείμενο. Το «large» δεν είναι ένας εντυπωσιακός χαρακτηρισμός. Αναφέρεται στο μέγεθος των δεδομένων εκπαίδευσης και στον αριθμό των παραμέτρων που χρησιμοποιεί το μοντέλο για να λειτουργήσει.
Τα μοντέλα αυτά έχουν εκπαιδευτεί σε τεράστιες ποσότητες κειμένου, από βιβλία και άρθρα έως δημόσιες ιστοσελίδες και τεχνικές μελέτες. Μέσα από αυτή τη διαδικασία δεν αποθηκεύουν γνώσεις όπως ένας άνθρωπος. Αντίθετα, αποθηκεύουν τις στατιστικές σχέσεις μεταξύ λέξεων, προτάσεων και εννοιών. “Μαθαίνουν” δηλαδή τι συσχετίσεις λέξεων χρειάζονται έτσι ώστε η γλώσσα να βγάζει νόημα.
Αυτό που προκύπτει δεν είναι μια ντετερμινιστική βάση δεδομένων πληροφοριών. Είναι ένα σύστημα ικανό να αναπαράγει τη δομή και τη ροή του λόγου με εντυπωσιακή συνέπεια.
Η πρόβλεψη της επόμενης λέξης: Γιατί δεν είναι τόσο απλή;
Στον πυρήνα τους, τα LLMs λειτουργούν με έναν μηχανισμό που ακούγεται σχεδόν απλοϊκός: προβλέπουν την επόμενη λέξη. Εάν θέλουμε να γίνουμε συγκεκριμένοι, στην πραγματικότητα, τα μοντέλα δεν έχουν προγραμματιστεί να «αναγνωρίζουν» ακριβώς λέξεις, αλλά μικρότερες μονάδες γλώσσας που ονομάζονται tokens. Για λόγους απλότητας, χρησιμοποιείται ο όρος «λέξεις», αν και τεχνικά ο μηχανισμός λειτουργεί σε αυτό το πιο λεπτομερές επίπεδο.
Όταν ξεκινά μια πρόταση, λοιπόν, το μοντέλο υπολογίζει ποια λέξη έχει τη μεγαλύτερη πιθανότητα να ακολουθήσει, με βάση τις συσχετίσεις που έχει καταγράψει κατά την εκπαίδευσή του. Στη συνέχεια, επαναλαμβάνει την ίδια διαδικασία για κάθε επόμενη λέξη.
Η απλότητα αυτής της περιγραφής είναι παραπλανητική. Η πρόβλεψη δεν γίνεται αυθαίρετα. Το μοντέλο λαμβάνει υπόψη του ολόκληρο το προηγούμενο κείμενο, το λεγόμενο context, και υπολογίζει πιθανότητες σε ένα εξαιρετικά πολύπλοκο μαθηματικό πεδίο. Αναγνωρίζει μοτίβα, συσχετίσεις και δομές. Έτσι, για παράδειγμα, εντοπίζει ότι συγκεκριμένες έννοιες εμφανίζονται συχνά μαζί, ότι ορισμένες φράσεις υποδηλώνουν συγκεκριμένο ύφος ή πρόθεση, ότι ένα επιχείρημα έχει συγκεκριμένη λογική ακολουθία.
Δεν γνωρίζει όμως τι σημαίνουν αυτές οι έννοιες με ανθρώπινους όρους. Δεν έχει εμπειρία του κόσμου. Δεν έχει πρόθεση ή συνείδηση. Αυτό που παράγει είναι αποτέλεσμα πιθανοτήτων, όχι κατανόησης.
Γιατί μοιάζουν «έξυπνα»;
Το εντυπωσιακό αποτέλεσμα αυτής της διαδικασίας είναι ότι τα κείμενα που παράγουν τα LLMs τις περισσότερες φορές εμφανίζουν συνοχή, λογική δομή και ύφος που προσαρμόζεται στο αίτημα του χρήστη. Αυτό δημιουργεί εύλογα την εντύπωση ότι το σύστημα σκέφτεται και αντιλαμβάνεται.
Στην πραγματικότητα, αυτό που παρατηρούμε είναι η δύναμη της κλίμακας. Όταν ένα μοντέλο έχει εκπαιδευτεί σε δισεκατομμύρια παραδείγματα γλωσσικής χρήσης, μπορεί να αναπαράγει με μεγάλη ακρίβεια τα μοτίβα που χαρακτηρίζουν την ανθρώπινη επικοινωνία. Η «ευφυΐα» που αντιλαμβανόμαστε είναι η ικανότητα πρόβλεψης σε τεράστια κλίμακα.
Η διάκριση είναι σημαντική. Τα LLMs δεν διαθέτουν κρίση. Δεν ξεχωρίζουν το αληθές από το ψευδές. Παράγουν απαντήσεις που είναι πιθανές, όχι απαραίτητα ορθές.
Κατανόηση με ψυχραιμία
Σε μια περίοδο όπου η τεχνητή νοημοσύνη παρουσιάζεται άλλοτε ως πανάκεια και άλλοτε ως απειλή, η νηφάλια κατανόηση των LLMs είναι απαραίτητη. Αν τα αντιμετωπίσουμε ως συστήματα που σκέφτονται, θα απογοητευτούμε. Αν τα υποτιμήσουμε ως απλά εργαλεία αυτόματης συμπλήρωσης, θα χάσουμε την ουσία της τεχνολογικής τους σημασίας.
Τα LLMs δεν είναι νοήμονες οντότητες. Είναι όμως εξαιρετικά ισχυρές γλωσσικές μηχανές. Και σε έναν κόσμο όπου η γλώσσα αποτελεί βασικό μέσο επικοινωνίας, λήψης αποφάσεων, παραγωγής γνώσης και επιχειρησιακής λειτουργίας, αυτό από μόνο του είναι καθοριστικό.
Το πρώτο βήμα, επομένως, δεν είναι να αναρωτηθούμε αν θα αντικαταστήσουν τους ανθρώπους. Είναι να κατανοήσουμε τι πραγματικά κάνουν. Μόνο τότε μπορούμε να περάσουμε στο επόμενο ερώτημα: τι μπορούν, και τι δεν μπορούν, να προσφέρουν στην πράξη.
Το παρόν άρθρο αποτελεί μέρος της σειράς «Τι είναι τελικά τα LLMs: μια ψύχραιμη προσέγγιση» του Φίλιππου Ζακόπουλου, Managing Partner του Found.ation.


