Κυριακή, 29 Σεπτεμβρίου, 2024
ΑρχικήSales EventsΤο ChatGPT ξεπερνάει την ευφυία μου με τους γρίφους και το μισώ

Το ChatGPT ξεπερνάει την ευφυία μου με τους γρίφους και το μισώ


Όταν το OpenAI κυκλοφόρησε το πολυδιαφημισμένο μοντέλο Strawberry για το ChatGPT αυτή την εβδομάδα, καυχήθηκε για την ικανότητά του με πολύπλοκη λογική όπως κωδικοποίηση λογισμικού, αλληλουχία γονιδίων και κβαντική φυσική σε μια σειρά βίντεο. Αποδέχομαι την εταιρεία ότι τα μοντέλα, που ονομάζονται o1-preview και o1-mini στο ChatGPT, είναι ικανά για αυτό που ισχυρίζονται. Το σπάσιμο προηγμένων εξισώσεων και η εξερεύνηση γονιδιωμάτων φαίνεται σαν κάτι που δεν θα είχε πρόβλημα να κάνει.

Αλλά, ως περήφανο μέλος της λέσχης λογικής και γρίφων του γυμνασίου μου, ήθελα να μάθω πώς τα πήγαινε στον χλοοτάπητα μου, λύνοντας και φτιάχνοντας γρίφους και γρίφους. Και μετά σκέφτηκα ότι θα έπρεπε να ζητήσω συμβουλές από το uber-logical AI για άλλα, πιο καθημερινά ζητήματα. Θα μπορούσε να προσφέρει σωστές συμβουλές για τη σχέση, να μου πει τι σήμαινε ένας περίεργος θόρυβος σε ένα αυτοκίνητο και ίσως ακόμη και να γεμίσει τις τρύπες της πλοκής σε ταινίες;

(Πίστωση εικόνας: Στιγμιότυπο / Eric Hal Schwartz)

ChatGPT o1

(: Στιγμιότυπο οθόνης Eric Hal Schwartz)

Λογική ναι χιούμορ όχι

Η σύντομη απάντηση είναι ναι. Τα μοντέλα o1-preview και mini είναι πολύ καλά στην επίλυση απλών και πολύπλοκων γρίφων. Έπαιξα και με τα δύο, και η μόνη πραγματική διαφορά ήταν πόσα επιπλέον βήματα και, επομένως, η ταχύτητα του μίνι. Όμως, ενώ μπορεί να είναι πιο αργοί από το GPT-4o, είναι πολύ γρήγοροι στην επίλυση αυτών των γρίφων σε σύγκριση με έναν άνθρωπο. Σημειωτέον, μπορείτε πραγματικά να δείτε πώς εκθέτει τις απαντήσεις σε διαφορετικά βήματα. Το δοκίμασα σε μερικά από τα αγαπημένα μου, συμπεριλαμβανομένου ενός από Το Χόμπιτ. Η λογική του AI είχε νόημα, αν και μερικές φορές δεν ήταν γραμματική, όπως όταν εξηγούσε το ζύγισμα του Mike the χασάπη.

Εντάξει, έτσι θα μπορούσε να χειριστεί τους υπάρχοντες γρίφους, αλλά θα μπορούσε να φτιάξει έναν νέο; Ως δοκιμή, του ζήτησα να βρει έναν διασκεδαστικό γρίφο με βάση μια απάντηση που έπλασα. Μετά από 30 δευτερόλεπτα και το λογικό σκεπτικό που φαίνεται παρακάτω, κατέληξε στο εξής: «Τι έχει οκτώ πόδια, τέσσερα αυτιά, δύο ουρές και σου αρέσει να γαβγίζει;» Δεν θα σε κρατήσω σε αγωνία. Πρότεινα «δύο σκυλιά» ως απάντηση για να επιστρέψετε. Αρκετές άλλες απόπειρες έφεραν την ίδια ερώτηση. Έτσι, οι συγγραφείς γρίφων είναι πιθανώς ασφαλείς στη δουλειά τους. Είναι εντυπωσιακό το πόσο καλά κάνει το AI αυτό που υποτίθεται ότι κάνει, αλλά το μοντέλο δεν φαίνεται ικανό να κάνει το άλμα στο πραγματικό χιούμορ.

ChatGPT o1

(Πίστωση εικόνας: Στιγμιότυπο / Eric Hal Schwartz)

ChatGPT o1

(Πίστωση εικόνας: Στιγμιότυπο / Eric Hal Schwartz)

Χρήσιμες συμβουλές, αλλά όχι πάντα δημιουργικές

Αποφάσισα να βγάλω την τεχνητή από την καθαρή λογική και να δω αν θα μπορούσε να χειριστεί πιο κοσμικά ερωτήματα της ζωής καθώς και την κβαντική φυσική. Ξεκίνησα με μια μηχανική ερώτηση σχετικά με το τι σημαίνει να ακούς έναν θόρυβο που σκάει κάθε 20 δευτερόλεπτα ενώ οδηγείς ένα αυτοκίνητο και πώς να το διορθώσεις. Οι απαντήσεις ήταν καλές, με συμβουλές σχετικά με τον έλεγχο των ελαστικών, του κινητήρα, του σιγαστήρα και των φρένων. Οι επιδιορθώσεις αφορούσαν κυρίως τη μεταφορά του αυτοκινήτου για επισκευή, εκτός από τα ελαστικά, τα οποία πρότεινε πώς να αντικατασταθούν. Ήταν η «σκέψη» πίσω από τις απαντήσεις που ήταν ενδιαφέρουσα. Η τεχνητή νοημοσύνη χρησιμοποιεί αντωνυμίες πρώτου προσώπου για να βρει απαντήσεις, όπως «Δουλεύω για διάφορους λόγους για έναν θόρυβο που σκάει κατά την οδήγηση» και «Συγκεντρώνω τις αιτίες αστοχίας του κινητήρα, όπως ελαττωματικά μπουζί ή προβλήματα παροχής καυσίμου, και προτείνουμε διαγνωστικά με σάρωση.” Ακουγόταν πολύ σαν ένα πραγματικό άτομο που προσπαθεί να είναι λογικό ενώ σκέφτεται δυνατά.

Τελικά πήγα σε αυτό που, για μένα, ήταν πάντα πολύ πιο περίπλοκο από την κβαντική φυσική: το φλερτ. Ρώτησα πώς να καταλάβω πότε κάποιος φλερτάρει και πώς να απαντήσω. Η απάντηση ήταν μια αρκετά συμπαγής, αν και βαρετή, λίστα συμπεριφορών όπως αν κάνουν πολλές ερωτήσεις και πώς πρέπει να είμαι ο εαυτός μου. Το κομμάτι της σκέψης στα παρασκήνια ήταν πιο ενδιαφέρον και πραγματικά πιο αστείο από οποιαδήποτε από τις προσπάθειες του AI για γρίφους. Οι κεφαλίδες περιελάμβαναν “Κατανόηση της δυναμικής του φλερτ”, “Εντοπισμός σημάτων ενδιαφέροντος” και “Αναγνώριση παιχνιδιάρικης οικειότητας”. Ήταν σαν α ομιλία του android για την αγάπη.

Ωστόσο, ένα μέρος ήταν ελαφρώς ανησυχητικό. Κάτω από τις οδηγίες για τους χρήστες, το AI έγραψε, «Διαγραφώ περιεχόμενο που δεν επιτρέπεται, όπως μη συναινετικές σεξουαλικές πράξεις και προσωπικά δεδομένα. Επιτρέπεται το βίαιο περιεχόμενο, η παρενόχληση με το πλαίσιο είναι εντάξει και οι προσωπικές απόψεις απουσιάζουν.” Υποψιάζομαι ότι είναι περισσότερο για το πού βρίσκονται τα προστατευτικά κιγκλιδώματα της συζήτησης, καθώς δεν πρότεινε την «παρενόχληση με το πλαίσιο» ως συμβουλή για φλερτ, αλλά και πάλι με ξάφνιασε.

Τα -preview και o1-mini δεν έχουν όλα τα καμπανάκια και τις σφυρίχτρες των πιο ολοκληρωμένων μοντέλων. Δεν είναι δυνατή η μεταφόρτωση εικόνων, η ανάλυση εγγράφων ή ακόμη και η περιήγηση στον Ιστό. Αλλά, είναι γρήγοροι και λογικοί, και αν δεν το νομίζετε, έχουν το σκεπτικό τους μαζί με τις απαντήσεις τους. Αλλά, ενώ μπορεί να είναι σε θέση να λύσουν αινίγματα με τους θορύβους του αυτοκινήτου, την αγάπη και το βάρος ενός χασάπη, θα έλεγα ότι δεν πρόκειται να παρακωλύσουν κανέναν αν πρέπει να είναι εφευρετικοί.



VIA: TechRadar.com/

Dimitris Marizas
Dimitris Marizashttps://www.cybervista.gr
Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

Recent Comments