Η Anthropic ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων AI: ενός αναβαθμισμένου Claude 3.5 Sonnet και ενός νέου Claude 3.5 Haiku. Το αναβαθμισμένο Claude 3.5 Sonnet προσφέρει γενικές βελτιώσεις, με σημαντικά κέρδη στις δυνατότητες κωδικοποίησης. Το νέο Claude 3.5 Haiku φέρνει προηγμένα χαρακτηριστικά τεχνητής νοημοσύνης σε προσιτή τιμή, που ταιριάζει με τις επιδόσεις του προηγούμενου κορυφαίου μοντέλου της Anthropic, Claude 3 Opus, ενώ διατηρεί παρόμοια ταχύτητα και κόστος με τον προκάτοχό του.
Claude 3.5 Σονέτο
Το αναβαθμισμένο Claude 3.5 Sonnet βασίζεται στην επιτυχία του προκατόχου του με βελτιωμένη απόδοση σε διάφορες εργασίες, ειδικά στην κωδικοποίηση. Η Anthropic τόνισε ότι το Claude 3.5 Sonnet ηγείται σε εργασίες μηχανικής λογισμικού, παρουσιάζοντας αξιοσημείωτες βελτιώσεις σε σημεία αναφοράς όπως SWE-πάγκος Επαληθεύτηκεόπου βελτιώθηκε από 33,4% σε 49,0%, ξεπερνώντας άλλα μοντέλα της αγοράς.
Το μοντέλο είχε επίσης καλή απόδοση στη χρήση πρακτόρων, βελτιώνοντας τις βαθμολογίες στο TAU-πάγκος από 62,6% σε 69,2% στον τομέα λιανικής και από 36,0% σε 46,0% στον τομέα των αεροπορικών εταιρειών. Σύμφωνα με τους πρώτους δοκιμαστές όπως το GitLab και το Cognition, αυτές οι αναβαθμίσεις αντιπροσωπεύουν ένα σημαντικό άλμα προς τα εμπρός για την κωδικοποίηση και τον αυτοματισμό που βασίζεται σε AI, με καλύτερες δυνατότητες συλλογιστικής και ελάχιστη πρόσθετη καθυστέρηση.
Claude 3,5 Χαϊκού
Το Claude 3.5 Haiku έχει σχεδιαστεί για να προσφέρει κορυφαίες επιδόσεις διατηρώντας παράλληλα το κόστος σε χαμηλά επίπεδα. Το μοντέλο έχει υψηλή βαθμολογία σε σημεία αναφοράς όπως το SWE-bench Verified, επιτυγχάνοντας 40,6%, το οποίο ξεπερνά πολλούς πράκτορες που χρησιμοποιούν άλλα μοντέλα αιχμής, συμπεριλαμβανομένων των αρχικών Claude 3.5 Sonnet και GPT-4o. Το μοντέλο στοχεύει να εξυπηρετήσει εφαρμογές που χρειάζονται γρήγορη, αξιόπιστη τεχνητή νοημοσύνη, όπως προϊόντα που αντιμετωπίζουν οι χρήστες και εργασίες που απαιτούν εξατομικευμένες εμπειρίες.
Η Anthropic θα κυκλοφορήσει το Claude 3.5 Haiku αργότερα αυτόν τον μήνα, αρχικά διαθέσιμο ως μοντέλο μόνο κειμένου με σχέδια για υποστήριξη εισαγωγής εικόνας στο μέλλον. Θα είναι διαθέσιμο μέσω του API της Anthropic, του Amazon Bedrock και του Vertex AI του Google Cloud.
Το Claude AI της Anthropic είναι τώρα στο iPad σας
Η χρήση υπολογιστή είναι διαθέσιμη ως πειραματική δημόσια έκδοση beta
Το Anthropic έχει επίσης εισήχθη μια νέα πειραματική λειτουργία που ονομάζεται “χρήση υπολογιστή”, διαθέσιμη σε δημόσια έκδοση beta. Οι προγραμματιστές μπορούν να κατευθύνουν το Claude 3.5 Sonnet να χρησιμοποιεί υπολογιστές σαν άνθρωπος—κοιτάζοντας οθόνες, μετακινώντας τους δρομείς και πληκτρολογώντας. Αυτή η δυνατότητα είναι ακόμα πειραματική, με ορισμένους περιορισμούς, αλλά προγραμματιστές όπως το Replit και η The Browser Company έχουν ήδη αρχίσει να διερευνούν πώς θα μπορούσε να αυτοματοποιήσει πολύπλοκες διαδικασίες που περιλαμβάνουν πολλά βήματα.
Αυτή η δυνατότητα στοχεύει να διδάξει την τεχνητή νοημοσύνη γενικές δεξιότητες υπολογιστή, καθιστώντας την πιο ευέλικτη στην ολοκλήρωση εργασιών που προηγουμένως απαιτούσαν προσαρμοσμένα εργαλεία. Οι προγραμματιστές μπορούν να έχουν πρόσβαση σε αυτήν την έκδοση beta μέσω του API της Anthropic και άλλων μεγάλων πλατφορμών cloud. Ενώ τα πρώτα αποτελέσματα είναι πολλά υποσχόμενα, η Anthropic αναγνωρίζει ότι η τεχνολογία εξακολουθεί να αναπτύσσεται, με προκλήσεις στην εκτέλεση ορισμένων κοινών εργασιών υπολογιστή, όπως η κύλιση και η μεταφορά.
Εταιρείες όπως η Asana, η Canva, η Cognition και η DoorDash πειραματίζονται με τα νέα χαρακτηριστικά, διερευνώντας τις δυνατότητες της τεχνητής νοημοσύνης να αυτοματοποιεί διαδικασίες που παραδοσιακά απαιτούσαν ανθρώπινη συνεισφορά. Οι πρώιμες δοκιμές από το Ινστιτούτο Ασφάλειας AI των ΗΠΑ και το Ινστιτούτο Ασφάλειας του Ηνωμένου Βασιλείου διαπίστωσαν ότι το ενημερωμένο Claude 3.5 Sonnet πληροί τα πρότυπα ασφαλείας της Anthropic και είναι κατάλληλο για δημόσια χρήση.
Η Anthropic αντιμετωπίζει επίσης πιθανούς κινδύνους που σχετίζονται με την ικανότητα του AI να αλληλεπιδρά με υπολογιστές. Για να διασφαλίσει την υπεύθυνη ανάπτυξη, η εταιρεία έχει εφαρμόσει νέα μέτρα ασφαλείας για τον εντοπισμό της κακής χρήσης, συμπεριλαμβανομένων των ταξινομητών για τον εντοπισμό δυνητικά επιβλαβών ενεργειών. Η Anthropic ενθαρρύνει τους προγραμματιστές να χρησιμοποιούν τη δυνατότητα beta για εργασίες χαμηλού κινδύνου όσο η τεχνολογία ωριμάζει.
Η κυκλοφορία από την Anthropic του αναβαθμισμένου Claude 3.5 Sonnet και Claude 3.5 Haiku υπογραμμίζει την ώθηση της εταιρείας να επεκτείνει τις δυνατότητες AI διατηρώντας παράλληλα πρότυπα ασφαλείας. Η προσθήκη δυνατοτήτων πειραματικής χρήσης υπολογιστή αντιπροσωπεύει ένα νέο βήμα προς τα εμπρός στις δυνατότητες της τεχνητής νοημοσύνης να εκτελεί εργασίες γενικού σκοπού, δίνοντας στους προγραμματιστές νέες δυνατότητες εξερεύνησης.
Πιστώσεις εικόνας: Ανθρωπικό
VIA: DataConomy.com