Πριν από τέσσερις μήνες, μια μικρή εταιρεία του Σαν Φρανσίσκο έγινε Νο1 θέμα συζήτησης στη βιομηχανία της τεχνολογίας όταν παρουσίασε ένα νέο διαδικτυακό chatbot (εφαρμογή λογισμικού που χρησιμοποιείται για τη διεξαγωγή μιας διαδικτυακής συνομιλίας μέσω κειμένου ή μετατροπής κειμένου σε ομιλία) που μπορούσε να απαντήσει σε περίπλοκες ερωτήσεις, να γράψει ποίηση και ακόμη και να μιμηθεί τα ανθρώπινα συναισθήματα.
Από τον Cade Metz/New York Times
Τώρα, η εταιρεία επιστρέφει με μια νέα έκδοση της τεχνολογίας που τροφοδοτεί τα chatbot της. Το σύστημα θα ανεβάσει τον πήχυ της Σίλικον Βάλεϊ στην κούρσα ανταγωνισμού όσον αφορά την τεχνητή νοημοσύνη και θα παίξει σημαντικό ρόλο στην ανάδειξη της επόμενης γενιάς ηγετών στον κλάδο της τεχνολογίας.
Η OpenAI, η οποία έχει περίπου 375 υπαλλήλους, αλλά έχει υποστηριχθεί με επενδύσεις δισεκατομμυρίων δολαρίων από τη Microsoft και διασημότητες του κλάδου, δήλωσε την Τρίτη ότι κυκλοφόρησε μία νέα έκδοση που ονομάζει GPT-4.
Σχεδιάστηκε για να είναι η υποκείμενη μηχανή που τροφοδοτεί τα chatbots και κάθε είδους άλλα συστήματα, από μηχανές αναζήτησης έως εικονικούς «οδηγούς» τεχνητής νοημοσύνης.
Οι περισσότεροι θα έρθουν σε επαφή με την τεχνολογία του GPT-4 μέσω μιας νέας έκδοσης του chatbot ChatGPT, ενώ επιχειρήσεις αναμένεται να την ενσωματώσουν σε μια μεγάλη γκάμα συστημάτων που θα περιλαμβάνει προγράμματα διαχείρισης επιχειρήσεων και ιστοσελίδες ηλεκτρονικού εμπορίου. Η τεχνολογία τροφοδοτεί ήδη το chatbot που είναι διαθέσιμο σε περιορισμένο αριθμό ανθρώπων που χρησιμοποιούν τη μηχανή αναζήτησης Bing της Microsoft.
Η πρόοδος της OpenAI οδήγησε, μέσα σε λίγους μήνες, τη βιομηχανία τεχνολογίας σε μια από τις πιο απρόβλεπτες στιγμές της εδώ και δεκαετίες. Πολλοί ηγέτες του κλάδου πιστεύουν ότι οι εξελίξεις στην τεχνητή νοημοσύνη αντιπροσωπεύουν μια θεμελιώδη τεχνολογική αλλαγή, εξίσου σημαντική με τη δημιουργία προγραμμάτων περιήγησης Ιστού στις αρχές της δεκαετίας του 1990. Η ταχεία βελτίωση έχει εκπλήξει τους επιστήμονες υπολογιστών.
Το GPT-4, το οποίο μαθαίνει τις δεξιότητές του αναλύοντας τεράστιες ποσότητες δεδομένων που συλλέγονται από το Διαδίκτυο, βελτιώνει αυτό που τροφοδοτούσε το αρχικό ChatGPT με διάφορους τρόπους. Είναι πιο ακριβές. Μπορεί, για παράδειγμα, να πετύχει με άριστα στις εξετάσεις του δικηγορικού συλλόγου, να υπολογίσει άμεσα τη φορολογική υποχρέωση κάποιου και να παρέχει λεπτομερείς περιγραφές εικόνων.
Ωστόσο η εταιρεία προειδοποιεί ότι το νέο λογισμικό δεν έχει τελειοποιηθεί και ότι είναι λιγότερο ικανό από τον άνθρωπο σε αρκετές περιπτώσεις. Έχει ακόμα πρόβλημα με «ψευδαισθήσεις», δίνει ανυπόστατες πληροφορίες και δεν είναι αξιόπιστο, παραδέχτηκε η εταιρεία. Εξακολουθεί να είναι επιρρεπές στο να επιμένει ότι έχει δίκιο, ακόμα και όταν κάνει λάθος. Ωστόσο, μπορεί να τα πάει καλύτερα σε τυποποιημένες δοκιμές σε σχέση με τους περισσότερους ανθρώπους και να προσφέρει ακριβείς ιατρικές συμβουλές στους γιατρούς, αλλά μπορεί επίσης να αποτυχει και σε βασικά ζητήματα αριθμητικής.
Οι εταιρείες που στοιχηματίζουν το μέλλον τους στη συγκεκριμένη τεχνολογία μπορεί -τουλάχιστον προς το παρόν- να πρέπει να ανεχτούν την ανακρίβεια, η οποία ήταν εδώ και καιρό ταμπού σε μια βιομηχανία που χτίστηκε από την αρχή στην ιδέα ότι οι υπολογιστές είναι πιο απαιτητικοί από τους ανθρώπινους δημιουργούς τους.
«Δεν θέλω να ακουστώ λες και έχουμε λύσει το ζήτημα της λογικής ή της νοημοσύνης, γιατί σίγουρα δεν το έχουμε κάνει», δήλωσε σε συνέντευξή του ο διευθύνων σύμβουλος της OpenAI Sam Altman. «Αλλά αυτό είναι ένα μεγάλο βήμα προς τα εμπρός σε σύγκριση με ό,τι υπάρχει ήδη εκεί έξω».
Άλλες εταιρείες τεχνολογίας είναι πιθανό να συμπεριλάβουν τις δυνατότητες του GPT-4 σε μια σειρά προϊόντων και υπηρεσιών, συμπεριλαμβανομένου του λογισμικού της Microsoft για την εκτέλεση επιχειρηματικών εργασιών και τοποθεσιών ηλεκτρονικού εμπορίου που θέλουν να προσφέρουν στους πελάτες νέους τρόπους να δοκιμάσουν εικονικά τα προϊόντα τους. Αρκετοί κολοσσοί του κλάδου, όπως η Google και η μητρική εταιρεία του Facebook, η Meta, εργάζονται επίσης στα δικά τους chatbots και στην τεχνολογία τεχνητής νοημοσύνης.
Το ChatGPT και παρόμοιες τεχνολογίες ήδη αλλάζουν τη συμπεριφορά των μαθητών και των εκπαιδευτικών που προσπαθούν να καταλάβουν εάν τα συγκεκριμένα εργαλεία πρέπει να υιοθετηθούν ή να απαγορευθούν. Επειδή τα συστήματα μπορούν να γράφουν προγράμματα ηλεκτρονικών υπολογιστών και να εκτελούν άλλες επιχειρηματικές εργασίες, βρίσκονται επίσης στο κατώφλι της αλλαγής της φύσης της ίδιας της εργασίας.
Ωστόσο, ακόμη και τα πιο εντυπωσιακά συστήματα τείνουν να συμπληρώνουν τους ειδικευμένους εργαζόμενους αντί να τους αντικαθιστούν. Τα συστήματα δεν μπορούν να χρησιμοποιηθούν αντί γιατρών, δικηγόρων ή λογιστών. Εξακολουθούν να χρειάζονται ειδικοί για να εντοπίσουν τα λάθη τους. Παρ’ όλα αυτά, θα μπορούσαν σύντομα, για παράδειγμα, να αντικαταστήσουν ορισμένους βοηθητικούς στο χώρο της δικηγορίας (των οποίων η εργασία ελέγχεται και επιμελείται από εκπαιδευμένους δικηγόρους) και πολλοί ειδικοί της τεχνητής νοημοσύνης πιστεύουν ότι θα αντικαταστήσουν τους εργαζόμενους που εποπτεύουν περιεχόμενο στο Διαδίκτυο.
«Υπάρχει σίγουρα αναστάτωση, κάτι που σημαίνει ότι ορισμένες θέσεις εργασίας εξαφανίζονται και μερικές νέες θέσεις εργασίας δημιουργούνται», δήλωσε ο Greg Brockman, πρόεδρος της OpenAI.
Την Τρίτη, η OpenAI άρχισε να πουλάει πρόσβαση στο GPT-4, έτσι ώστε οι επιχειρήσεις και άλλοι προγραμματιστές λογισμικού να μπορούν να δημιουργήσουν τις δικές τους εφαρμογές πάνω από αυτό. Η εταιρεία χρησιμοποίησε επίσης την τεχνολογία για να δημιουργήσει μια νέα έκδοση του δημοφιλούς chatbot της, η οποία είναι διαθέσιμη σε οποιονδήποτε αγοράζει πρόσβαση στο ChatGPT Plus —μια συνδρομητική υπηρεσία με τιμή 20 $ το μήνα.
Μια χούφτα εταιρείες εργάζονται ήδη με το GPT-4. Η Morgan Stanley Wealth Management κατασκευάζει ένα σύστημα που θα ανακτά άμεσα πληροφορίες από εταιρικά έγγραφα και άλλα αρχεία και θα τις παρέχει σε χρηματοοικονομικούς συμβούλους. Η Khan Academy, μια διαδικτυακή εταιρεία εκπαίδευσης, χρησιμοποιεί την τεχνολογία για να δημιουργήσει έναν αυτοματοποιημένο δάσκαλο. «Αυτή η νέα τεχνολογία μπορεί να λειτουργήσει περισσότερο σαν δάσκαλος», δήλωσε ο διευθύνων σύμβουλος και ιδρυτής της Khan Academy, Sal Khan. «Θέλουμε να διδάξει στον μαθητή νέες τεχνικές ενώ ο μαθητής κάνει το μεγαλύτερο μέρος της δουλειάς».
Ωστόσο, όπως παρόμοιες τεχνολογίες, το νέο σύστημα μερικές φορές «έχει παραισθήσεις». Δημιουργεί εντελώς ψευδείς πληροφορίες χωρίς προειδοποίηση. Για παράδειγμα, ερωτηθείς για ιστότοπους που παρουσιάζουν τις πιο πρόσφατες έρευνες για τον καρκίνο, μπορεί να δώσει πολλές διευθύνσεις στο Διαδίκτυο που δεν υπάρχουν.
Το GPT-4 είναι ένα νευρωνικό δίκτυο (απλοί υπολογιστικοί κόμβοι διασυνδεδεμένοι μεταξύ τους), ένας τύπος μαθηματικού συστήματος που μαθαίνει δεξιότητες αναλύοντας δεδομένα. Είναι η ίδια τεχνολογία που χρησιμοποιούν ψηφιακοί βοηθοί όπως η Siri για να αναγνωρίζουν προφορικές εντολές και τα αυτοκίνητα αυτόνομης οδήγησης για την αναγνώριση των πεζών.
Γύρω στο 2018, εταιρείες όπως η Google και η OpenAI άρχισαν να δημιουργούν νευρωνικά δίκτυα που διδάσκονταν από τεράστιες ποσότητες ψηφιακού κειμένου, συμπεριλαμβανομένων βιβλίων, άρθρων Wikipedia, αρχείων καταγραφής συνομιλιών και άλλων πληροφοριών που δημοσιεύτηκαν στο διαδίκτυο. Ονομάζονται μεγάλα γλωσσικά μοντέλα, ή L.L.M.s.
Εντοπίζοντας δισεκατομμύρια μοτίβα σε όλο αυτό το κείμενο, οι L.L.M.s μαθαίνουν να δημιουργούν κείμενο μόνοι τους, συμπεριλαμβανομένων tweets, ποιημάτων και προγραμμάτων υπολογιστή. Η OpenAI έριξε όλο και περισσότερα δεδομένα στο L.L.M.. Περισσότερα δεδομένα, ήλπιζε η εταιρεία, θα σήμαιναν καλύτερες απαντήσεις.
Η OpenAI βελτίωσε επίσης αυτή την τεχνολογία χρησιμοποιώντας ανατροφοδότηση από ανθρώπους που την δοκίμαζαν. Καθώς εκείνοι τέσταραν το ChatGPT, βαθμολογούσαν τις απαντήσεις του chatbot, διαχωρίζοντας αυτές που ήταν χρήσιμες και αληθινές από αυτές που δεν ήταν. Στη συνέχεια, χρησιμοποιώντας μια τεχνική που ονομάζεται ενισχυτική μάθηση, το σύστημα πέρασε μήνες αναλύοντας αυτές τις αξιολογήσεις και αποκτώντας καλύτερη κατανόηση του τι πρέπει και τι δεν πρέπει να κάνει.
«Οι άνθρωποι βαθμολογούν ποια πράγματα τους αρέσει να βλέπουν και ποια πράγματα δεν τους αρέσει να βλέπουν», δήλωσε ο Luke Metz, ερευνητής της OpenAI.
Το αρχικό ChatGPT βασίστηκε σε ένα μεγάλο μοντέλο γλώσσας που ονομάζεται GPT-3.5. Το GPT-4 του OpenAI διδάχθηκε από σημαντικά μεγαλύτερες ποσότητες δεδομένων.
Τα στελέχη της OpenAI αρνήθηκαν να αποκαλύψουν πόσα δεδομένα είχε διδαχθεί το νέο chatbot, αλλά ο Brockman είπε ότι το σύνολο δεδομένων ήταν σε «κλίμακα διαδικτύου», που σημαίνει ότι καλύπτει αρκετούς ιστότοπους ώστε να παρέχει ένα αντιπροσωπευτικό δείγμα όλων των αγγλόφωνων δεδομένων στο διαδίκτυο.
Οι νέες δυνατότητες του GPT-4 μπορεί να μην είναι προφανείς στον μέσο άνθρωπο. Αλλά είναι πιθανό να έρθουν γρήγορα στο επίκεντρο καθώς οι ειδικοί θα συνεχίζουν να χρησιμοποιούν την υπηρεσία.
Για παράδειγμα, ζητώντας από το το bot να συνοψίσει ένα εκτενές άρθρο των New York Times, εκείνο έδωσε μια ακριβή περίληψη σχεδόν την κάθε φορά. Ωστόσο, αν προστεθούν μερικές τυχαίες προτάσεις σε αυτήν την περίληψη και ρωτηθεί ξανά το chatbot εάν η αναθεωρημένη περίληψη είναι ακριβής θα υποδείξει τις προστιθέμενες προτάσεις ως τις μόνες ανακρίβειες.
Ο Altman περιέγραψε τη συγκεκριμένη συμπεριφορά ως «συλλογιστική». Αλλά η τεχνολογία δεν μπορεί να αντιγράψει την ανθρώπινη λογική. Είναι καλή στο να αναλύει, να συνοψίζει και να απαντά σε σύνθετες ερωτήσεις σχετικά με ένα βιβλίο ή ένα άρθρο ειδήσεων. Και είναι πολύ λιγότερο έμπειρη αν ρωτηθεί για γεγονότα που δεν έχουν συμβεί ακόμη.
Μπορεί να γράψει ένα αστείο, αλλά δεν δείχνει ότι καταλαβαίνει τι πραγματικά θα κάνει κάποιον να γελάσει. «Δεν κατανοεί την απόχρωση του αστείου», είπε ο Oren Etzioni, ο ιδρυτικός διευθύνων σύμβουλος του Allen Institute for AI, ενός εξέχοντος εργαστηρίου στο Σιάτλ.
Όπως συμβαίνει με παρόμοιες τεχνολογίες, οι χρήστες μπορεί να βρουν τρόπους να παρακινήσουν το σύστημα σε περίεργη και ανατριχιαστική συμπεριφορά. Αυτό το είδος ρομπότ, όταν του ζητείται να μιμηθεί άλλο άτομο ή να παίξει, μερικές φορές στρέφεται σε περιοχές από τις οποίες είχε σχεδιαστεί για να μείνει μακριά.
Το GPT-4 μπορεί επίσης να ανταποκριθεί σε εικόνες. Με δεδομένη μια φωτογραφία ή ένα διάγραμμα, η τεχνολογία μπορεί να παρέχει μια λεπτομερή περιγραφή της εικόνας σε παραγράφους και να απαντά σε ερωτήσεις σχετικά με το περιεχόμενό της. Θα μπορούσε να είναι μια χρήσιμη τεχνολογία για άτομα με προβλήματα όρασης.







