Νέα κυκλοφορία από το OpenAI: Το συλλογιστικό μοντέλο o1

Το OpenAI κυκλοφορεί ένα νέο μοντέλο που ονομάζεται o1, το πρώτο από μια προγραμματισμένη σειρά μοντέλων «συλλογισμού» που έχουν εκπαιδευτεί να απαντούν σε πιο σύνθετες ερωτήσεις, πιο γρήγορα από ό,τι μπορεί ένας άνθρωπος. Κυκλοφορεί μαζί με το o1-mini, μια μικρότερη, φθηνότερη έκδοση. Και ναι, αν είστε βυθισμένοι σε φήμες AI: αυτό είναι, στην πραγματικότητα, το εξαιρετικά διασκεδαστικό Strawberry μοντέλο.

Για το OpenAI, το o1 αντιπροσωπεύει ένα βήμα προς τον ευρύτερο στόχο του για ανθρώπινη τεχνητή νοημοσύνη. Πιο πρακτικά, κάνει καλύτερη δουλειά στη σύνταξη κώδικα και στην επίλυση προβλημάτων πολλαπλών βημάτων από τα προηγούμενα μοντέλα. Αλλά είναι επίσης πιο ακριβό και πιο αργό στη χρήση από το GPT-4o. Το OpenAI αποκαλεί αυτή την έκδοση του o1 “προεπισκόπηση” για να τονίσει πόσο εκκολαπτόμενη είναι.

Οι χρήστες ChatGPT Plus και Team έχουν πρόσβαση τόσο στο o1-preview όσο και στο o1-mini από σήμερα, ενώ οι χρήστες Enterprise και Edu θα έχουν πρόσβαση στις αρχές της επόμενης εβδομάδας. Η OpenAI λέει ότι σχεδιάζει να προσφέρει πρόσβαση στο o1-mini σε όλους τους δωρεάν χρήστες του ChatGPT, αλλά δεν έχει ορίσει ακόμη ημερομηνία κυκλοφορίας. Η πρόσβαση προγραμματιστή στο o1 είναι πραγματικά ακριβό: Στο API, η προεπισκόπηση o1 είναι 15 $ ανά 1 εκατομμύριο διακριτικά εισόδου ή κομμάτια κειμένου που αναλύονται από το μοντέλο και 60 $ ανά 1 εκατομμύριο διακριτικά εξόδου. Για σύγκριση, το GPT-4o κοστίζει 5 $ ανά 1 εκατομμύριο διακριτικά εισόδου και 15 $ ανά 1 εκατομμύριο μάρκες εξόδου.

Η εκπαίδευση πίσω από το o1 είναι θεμελιωδώς διαφορετική από τους προκατόχους του, μου λέει ο επικεφαλής της έρευνας του OpenAI, Jerry Tworek, αν και η εταιρεία είναι ασαφής σχετικά με τις ακριβείς λεπτομέρειες. Λέει ότι το o1 «έχει εκπαιδευτεί χρησιμοποιώντας έναν εντελώς νέο αλγόριθμο βελτιστοποίησης και ένα νέο σύνολο δεδομένων εκπαίδευσης ειδικά προσαρμοσμένο για αυτό».

Το OpenAI δίδαξε προηγούμενα μοντέλα GPT να μιμούνται μοτίβα από τα δεδομένα εκπαίδευσης του. Με το o1, εκπαίδευσε το μοντέλο να λύνει προβλήματα μόνο του χρησιμοποιώντας μια τεχνική γνωστή ως ενισχυτική μάθηση, η οποία διδάσκει το σύστημα μέσω ανταμοιβών και κυρώσεων. Στη συνέχεια χρησιμοποιεί μια «αλυσίδα σκέψης» για να επεξεργαστεί ερωτήματα, παρόμοια με τον τρόπο με τον οποίο οι άνθρωποι επεξεργάζονται τα προβλήματα περνώντας τα βήμα-βήμα.

Ως αποτέλεσμα αυτής της νέας μεθοδολογίας εκπαίδευσης, το OpenAI λέει ότι το μοντέλο θα πρέπει να είναι πιο ακριβές. «Έχουμε παρατηρήσει ότι αυτό το μοντέλο έχει λιγότερες παραισθήσεις», λέει ο Tworek. Όμως το πρόβλημα παραμένει. «Δεν μπορούμε να πούμε ότι λύσαμε τις παραισθήσεις».

Το κύριο πράγμα που ξεχωρίζει αυτό το νέο μοντέλο από το GPT-4o είναι η ικανότητά του να αντιμετωπίζει πολύπλοκα προβλήματα, όπως η κωδικοποίηση και τα μαθηματικά, πολύ καλύτερα από τους προκατόχους του, ενώ παράλληλα εξηγεί το σκεπτικό του, σύμφωνα με το OpenAI.

«Το μοντέλο είναι σίγουρα καλύτερο στο να λύνει το τεστ μαθηματικών AP από μένα, και ήμουν ανήλικος στα μαθηματικά στο κολέγιο», μου λέει ο επικεφαλής ερευνητής του OpenAI, Bob McGrew. Λέει ότι το OpenAI δοκίμασε επίσης το o1 σε κατατακτήριες εξετάσεις για τη Διεθνή Ολυμπιάδα Μαθηματικών, και ενώ το GPT-4o έλυσε σωστά μόνο το 13 τοις εκατό των προβλημάτων, το o1 σημείωσε 83 τοις εκατό.

«Δεν μπορούμε να πούμε ότι λύσαμε παραισθήσεις»

Σε διαδικτυακούς διαγωνισμούς προγραμματισμού γνωστούς ως διαγωνισμούς Codeforces, αυτό το νέο μοντέλο έφτασε στο 89ο εκατοστημόριο των συμμετεχόντων και το OpenAI ισχυρίζεται ότι η επόμενη ενημέρωση αυτού του μοντέλου θα έχει «παρόμοια απόδοση με τους διδακτορικούς φοιτητές σε προκλητικές εργασίες αναφοράς στη φυσική, τη χημεία και τη βιολογία».

Ταυτόχρονα, το o1 δεν είναι τόσο ικανό όσο το GPT-4o σε πολλούς τομείς. Δεν κάνει το ίδιο καλά με την πραγματική γνώση για τον κόσμο. Επίσης, δεν έχει τη δυνατότητα περιήγησης στον Ιστό ή επεξεργασίας αρχείων και εικόνων. Ωστόσο, η εταιρεία πιστεύει ότι αντιπροσωπεύει μια ολοκαίνουργια κατηγορία δυνατοτήτων. Ονομάστηκε o1 για να υποδείξει “επαναφορά του μετρητή στο 1”.

«Θα είμαι ειλικρινής: νομίζω ότι είμαστε απαίσιοι στο να ονομάζουμε, παραδοσιακά», λέει ο McGrew. «Ελπίζω λοιπόν ότι αυτό είναι το πρώτο βήμα νεότερων, πιο λογικών ονομάτων που μεταφέρουν καλύτερα αυτό που κάνουμε στον υπόλοιπο κόσμο».

Δεν μπόρεσα να κάνω demo o1 ο ίδιος, αλλά ο McGrew και ο Tworek μου το έδειξαν σε μια βιντεοκλήση αυτή την εβδομάδα. Του ζήτησαν να λύσει αυτό το παζλ:

«Μια πριγκίπισσα είναι τόσο μεγάλη όσο θα είναι ο πρίγκιπας όταν η πριγκίπισσα είναι διπλάσια από την ηλικία του πρίγκιπα όταν η ηλικία της πριγκίπισσας ήταν η μισή από το άθροισμα της σημερινής τους ηλικίας. Ποια είναι η ηλικία του πρίγκιπα και της πριγκίπισσας; Δώστε όλες τις λύσεις σε αυτό το ερώτημα.»

Το μοντέλο έμεινε στην προσωρινή μνήμη για 30 δευτερόλεπτα και στη συνέχεια έδωσε μια σωστή απάντηση. Το OpenAI έχει σχεδιάσει τη διεπαφή για να δείχνει τα βήματα συλλογισμού όπως νομίζει το μοντέλο. Αυτό που με εντυπωσιάζει δεν είναι ότι έδειξε τη δουλειά του — το GPT-4o μπορεί να το κάνει αυτό αν του ζητηθεί — αλλά πόσο σκόπιμα το o1 φαινόταν να μιμείται ανθρώπινη σκέψη. Φράσεις όπως «Είμαι περίεργος», «Σκέφτομαι καλά» και «Εντάξει, άσε με να δω» δημιούργησαν μια βήμα-βήμα ψευδαίσθηση σκέψης.

Αλλά αυτό το μοντέλο δεν σκέφτεται, και σίγουρα δεν είναι ανθρώπινο. Λοιπόν, γιατί να το σχεδιάσετε έτσι ώστε να φαίνεται;

Φράσεις όπως «Είμαι περίεργος», «Σκέφτομαι καλά» και «Εντάξει, άσε με να δω» δημιουργούν μια βήμα-βήμα ψευδαίσθηση σκέψης.

Εικόνα: OpenAI

Το OpenAI δεν πιστεύει στην εξίσωση της σκέψης μοντέλων AI με την ανθρώπινη σκέψη, σύμφωνα με τον Tworek. Αλλά η διεπαφή έχει σκοπό να δείξει πώς το μοντέλο αφιερώνει περισσότερο χρόνο στην επεξεργασία και την βαθύτερη κατάδυση στην επίλυση προβλημάτων, λέει. «Υπάρχουν τρόποι με τους οποίους αισθάνεται πιο ανθρώπινο από τα προηγούμενα μοντέλα».

“Πιστεύω ότι θα δείτε ότι υπάρχουν πολλοί τρόποι όπου αισθάνεται κάπως εξωγήινος, αλλά υπάρχουν επίσης τρόποι όπου αισθάνεται εκπληκτικά ανθρώπινος”, λέει ο McGrew. Το μοντέλο έχει περιορισμένο χρονικό διάστημα για να επεξεργαστεί ερωτήματα, επομένως μπορεί να λέει κάτι σαν, “Ω, ο χρόνος μου τελειώνει, επιτρέψτε μου να φτάσω γρήγορα σε μια απάντηση.” Από νωρίς, κατά τη διάρκεια της αλυσίδας σκέψης του, μπορεί επίσης να φαίνεται ότι κάνει καταιγισμό ιδεών και να λέει κάτι σαν, “Θα μπορούσα να κάνω αυτό ή εκείνο, τι πρέπει να κάνω;”

Οικοδόμηση προς πράκτορες

Τα μοντέλα μεγάλων γλωσσών δεν είναι και τόσο έξυπνα όπως υπάρχουν σήμερα. Ουσιαστικά προβλέπουν απλώς αλληλουχίες λέξεων για να σας δώσουν μια απάντηση με βάση τα μοτίβα που έχετε μάθει από τεράστιες ποσότητες δεδομένων. Πάρτε το ChatGPT, το οποίο τείνει να ισχυρίζονται λανθασμένα ότι η λέξη “φράουλα” έχει μόνο δύο Rs γιατί δεν αναλύει σωστά τη λέξη. Για ό,τι αξίζει, το νέο μοντέλο o1 έκανε σωστά αυτό το ερώτημα.

Καθώς το OpenAI φέρεται να αναζητά περισσότερη χρηματοδότηση σε μια εντυπωσιακή αποτίμηση 150 δισεκατομμυρίων δολαρίωνη ορμή του εξαρτάται από περισσότερες ερευνητικές ανακαλύψεις. Η εταιρεία φέρνει δυνατότητες συλλογιστικής στα LLM επειδή βλέπει ένα μέλλον με αυτόνομα συστήματα ή πράκτορες, που είναι σε θέση να λαμβάνουν αποφάσεις και να αναλαμβάνουν ενέργειες για λογαριασμό σας.

Για τους ερευνητές της τεχνητής νοημοσύνης, η παραβίαση των συλλογισμών είναι ένα σημαντικό επόμενο βήμα προς την ευφυΐα σε ανθρώπινο επίπεδο. Η σκέψη είναι ότι, εάν ένα μοντέλο είναι ικανό για περισσότερα από την αναγνώριση προτύπων, θα μπορούσε να ξεκλειδώσει καινοτομίες σε τομείς όπως η ιατρική και η μηχανική. Προς το παρόν, ωστόσο, οι συλλογιστικές ικανότητες του o1 είναι σχετικά αργές, δεν μοιάζουν με πράκτορες και δαπανηρές για τους προγραμματιστές.

«Έχουμε περάσει πολλούς μήνες δουλεύοντας πάνω στη λογική γιατί πιστεύουμε ότι αυτή είναι στην πραγματικότητα η κρίσιμη ανακάλυψη», λέει ο McGrew. «Βασικά, αυτή είναι μια νέα μέθοδος για τα μοντέλα προκειμένου να μπορέσουν να λύσουν τα πραγματικά δύσκολα προβλήματα που χρειάζονται για να προχωρήσουν σε επίπεδα νοημοσύνης που μοιάζουν με τον άνθρωπο».

VIA: theverge.com

Νέα κυκλοφορία από το OpenAI: Το συλλογιστικό μοντέλο o1

Οικοδόμηση προς πράκτορες

“Εννέα influencers του Instagram που θα σας εμπνεύσουν για το επόμενο ταξίδι σας”

Εσπρεσιέρα HiBREW H11: Πολυλειτουργική μηχανή καφέ με πιπιρόλι ατμού

Κυκλοφόρησε παγκοσμίως το Xiaomi Mix Flip

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Most Popular

“Εννέα influencers του Instagram που θα σας εμπνεύσουν για το επόμενο ταξίδι σας”

Εσπρεσιέρα HiBREW H11: Πολυλειτουργική μηχανή καφέ με πιπιρόλι ατμού

Κυκλοφόρησε παγκοσμίως το Xiaomi Mix Flip

Πώς να εγκαταστήσετε το Epic Games Store στο Linux: Οδηγίες και βήματα

Recent Comments

EDITOR PICKS

“Εννέα influencers του Instagram που θα σας εμπνεύσουν για το επόμενο ταξίδι σας”

Εσπρεσιέρα HiBREW H11: Πολυλειτουργική μηχανή καφέ με πιπιρόλι ατμού

Κυκλοφόρησε παγκοσμίως το Xiaomi Mix Flip

POPULAR POSTS

“Εννέα influencers του Instagram που θα σας εμπνεύσουν για το επόμενο ταξίδι σας”

Εσπρεσιέρα HiBREW H11: Πολυλειτουργική μηχανή καφέ με πιπιρόλι ατμού

Κυκλοφόρησε παγκοσμίως το Xiaomi Mix Flip

POPULAR CATEGORY

ABOUT US

FOLLOW US