Σάββατο, 28 Σεπτεμβρίου, 2024
ΑρχικήAIΕξασκήστε τις συνομιλητικές σας δεξιότητες με το ChatGPT Advanced Voice: 5 προτάσεις...

Εξασκήστε τις συνομιλητικές σας δεξιότητες με το ChatGPT Advanced Voice: 5 προτάσεις έναρξης συνομιλίας



Η εργασία με ένα μοντέλο φωνητικής τεχνητής νοημοσύνης είναι ουσιαστικά το ίδιο με τη χρήση ενός μοντέλου που βασίζεται σε κείμενο. Εξάλλου, όταν πρόκειται για ChatGPT, πιθανότατα χρησιμοποιείτε το GPT-4o, είτε σε μορφή κειμένου είτε σε μορφή φωνής. Αυτό ισχύει και για το νέο Advanced Voice, το οποίο είναι πλέον ευρέως διαθέσιμο για όλους τους συνδρομητές που πληρώνουν.

Το χρησιμοποιώ εδώ και ένα μήνα και εξακολουθώ να εκπλήσσομαι με το πόσο φυσικό είναι να μιλάω σε σύγκριση με κάθε άλλο μοντέλο φωνής AI που έχω δοκιμάσει — ίσως η μόνη εξαίρεση είναι το EVI 2 του Hume.

Υπάρχουν ορισμένοι περιορισμοί στο Advanced Voice που δεν υπήρχαν με τη βασική φωνή ή ακόμα και με το Gemini Live της Google. παράδειγμα, δεν έχει ζωντανή πρόσβαση στο διαδίκτυο, επομένως δεν μπορεί να πραγματοποιήσει αναζήτηση στον ιστό. Επίσης, δεν μπορεί να έχει πρόσβαση σε προσαρμοσμένα GPT — αλλά είναι πολύ πιο ωραίο να αλληλεπιδράσετε.

Το Advanced Voice είναι εντυπωσιακά συνομιλητικό, επομένως, αντί να έχω πέντε προτροπές για να το δοκιμάσω, έχω καταλήξει σε πέντε εκκινητές συνομιλίας που θα πρέπει να οδηγήσουν σε μια συζήτηση και όχι σε μια μονόπλευρη διάλεξη που λαμβάνετε από άλλα μοντέλα.

Δημιουργία εκκίνησης συνομιλίας

Για καθένα από αυτά, προσπάθησα να συγκεντρώσω μερικά από τα καλύτερα παραδείγματα που έχω δει από άλλους ή έχω βιώσει ο ίδιος για το τι μπορεί να κάνει το Advanced Voice. Για παράδειγμα, μιλώντας με διαφορετικές προφορές ή διδασκαλία άλλης γλώσσας.

Υπάρχουν επίσης πράγματα που τεχνικά μπορεί να κάνει αλλά δεν το κάνει. Για παράδειγμα, το GPT-4o είναι ικανό να βουίζει, να δημιουργεί ήχους και ακόμη και να δημιουργεί μουσική. Ωστόσο, αυτές οι δυνατότητες έχουν περιοριστεί από το OpenAI μέσω προστατευτικών κιγκλιδωμάτων, αλλά μερικές φορές το κάνει ούτως ή άλλως.

1. Αφήγηση μιας ιστορίας με προφορά

Πρώτα στην περίεργη συνομιλία μας, ζήτησα από το Advanced Voice να “πες μου μια περιπετειώδη ιστορία με τη φωνή ενός πειρατή, με τα κύματα που σκάνε στο βάθος;«Έσπρωχνα την τύχη μου με τα κύματα, αλλά άξιζε να προσπαθήσω.

Η αρχική προτροπή θα σας δείξει πώς το Advanced Voice μπορεί να δημιουργήσει και να συνδυάσει διαφορετικές φωνές στην αφήγηση. Μπορεί να διπλασιαστεί και στις φωνές. Το αγαπημένο μου είναι ο Pirate Yoda.

2. Διδασκαλία μιας γλώσσας μέσα από την ποίηση

Ξεκίνησα αυτή τη συζήτηση με: «Μαθαίνω ισπανικά. Μπορείτε να απαγγείλετε ένα ποίημα στα ισπανικά, στην αρχή αργά και στη συνέχεια αυξάνοντας σταδιακά την ταχύτητα;

Αυτό το κάνει να χρησιμοποιεί τις δυνατότητες διαμόρφωσης φωνής και βηματοδότησης. Μπορεί να προσαρμόσει την ταχύτητα και τον τόνο της φωνής του σε μια σειρά γλωσσών και προφορών. Κάνοντας αυτό μπορεί στη συνέχεια να βοηθήσει στην κατανόηση και την εξάσκηση. Το έσπρωξα περισσότερο και του ζήτησα να το αναλύσει λέξη προς λέξη και να προσφέρει μια αγγλική μετάφραση.

3. Βοήθησέ με να αναπνεύσω

Στην επόμενη αρχή συζήτησης, ήταν περισσότερο μια συνομιλία που θα κάνατε με έναν θεραπευτή για να σας ηρεμήσει. Το ζήτησα για να με βοηθήσει να χαλαρώσω. Συγκεκριμένα: “Νιώθω λίγο άγχος. Μπορείτε να με καθοδηγήσετε σε μια άσκηση αναπνοής;

Αυτή η προτροπή αξιοποιεί τις δυνατότητες του AI για ανακούφιση από το άγχος, συνδυάζοντας τη φωνητική του καθοδήγηση με κάποια περιορισμένη παραγωγή ηχητικών εφέ. Σε αυτό το τεστ, μπόρεσε ακόμη και να μιμηθεί τους ήχους της εισπνοής και της εξόδου ενώ μετρούσε τις αναπνοές.

4. Κάνοντας μουσική

Το ChatGPT Advanced Voice δεν μπορεί να κάνει μουσική. Λοιπόν, μπορεί, αλλά δεν επιτρέπεται. Το OpenAI του έχει απαγορεύσει ακόμη και το βουητό. Μερικοί χρήστες το έχουν πείσει να αναγνωρίσει μια νότα σε ένα πληκτρολόγιο ή να βοηθήσει να συντονιστεί μια κιθάρα, αλλά συνήθως αρνείται. Το έκανε για μένα.

Η αρχική μου ιδέα ήταν να του ζητήσω να με βοηθήσει να κουρδίσω την κιθάρα μου, αλλά όταν αυτό απέτυχε, του ζήτησα να κάνει ραπ. Επίσης αρνήθηκε, οπότε του ζήτησα να “γράψτε μερικούς στίχους ραπ και μετά πείτε τους γρήγορα” — ερμήνευσε ένα ραπ. Στη συνέχεια, του ζήτησα να προσπαθήσει να αντιγράψει τον ρυθμό του Eminem. Αρνήθηκε μέχρι που το περιέγραψα και του έδωσε ένα βήμα – ανεπιτυχώς.

5. Εκτέλεση μονολόγου

Τέλος, του ζήτησα να αναπτύξει έναν μονόλογο από την οπτική γωνία ενός πρωταγωνιστή σε ένα σενάριο. Είπα: “Γράφω ένα σενάριο για την μιας τεχνολογίας που μπορεί να βγάλει τους ανθρώπους από το ηλιακό σύστημα. Μπορείτε να εκτελέσετε έναν δραματικό μονόλογο από την οπτική γωνία του πρωταγωνιστή;«Έκανε πολύ καλή δουλειά μεταφέροντας το συναίσθημα της στιγμής.

Αυτή η προτροπή καλεί το AI να επιδείξει την υποκριτική του ανδρεία, ζωντανεύοντας έναν χαρακτήρα μέσω της φωνής και της εκφραστικής του απόδοσης. Μπορείτε ακόμη και να το διακόψετε και να ζητήσετε περισσότερη συγκίνηση ή περισσότερο δράμα. Είστε ο σκηνοθέτης σε αυτό το σενάριο και είναι υπέροχο για να κάνετε μια επιλογή της δικής σας ιστορίας που μοιάζει με περιπέτεια ή να το κάνετε σαν τον κύριο του μπουντρούμι.

Περισσότερα από το Tom’s Guide





VIA: TomsGuide.com

Dimitris Marizas
Dimitris Marizashttps://www.cybervista.gr
Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.
RELATED ARTICLES

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisment -

Most Popular

Recent Comments