Σε έναν κόσμο που κυριαρχείται από φουσκωμένα μοντέλα AI που ζουν στο σύννεφο, το Mistral AI ανατρέπει το σενάριο. Η γαλλική startup μόλις εξαπέλυσε δύο νέα μοντέλα — Ministral 3B και 8B — που έχουν σχεδιαστεί για να λειτουργούν σε συσκευές edge.
Les Ministraux: Ministral 3B και 8B
Οι νέες προσφορές της Mistral, που ονομάζονται «Les Ministraux», μπορεί να ακούγονται σαν μια γαλλική ταινία τέχνης, αλλά αυτά τα μοντέλα είναι έτοιμη να ταρακουνήσουν τον κόσμο της τεχνητής νοημοσύνης. Με μόλις 3 δισεκατομμύρια και 8 δισεκατομμύρια παραμέτρους αντίστοιχα, η οικογένεια Ministraux έχει να κάνει με την αποτελεσματικότητα. Ξεχάστε αυτά τα μοντέλα τεχνητής νοημοσύνης που απαιτούν πόρους που απαιτούν ένα κέντρο δεδομένων για να λειτουργήσει.
«Οι πιο καινοτόμοι πελάτες και συνεργάτες μας ζητούν ολοένα και περισσότερο τοπικό συμπέρασμα για κρίσιμες εφαρμογές, πρώτα απ’ όλα για το απόρρητο», εξήγησε ο Mistral.
Μήκος περιβάλλοντος όπως ποτέ άλλοτε
Εδώ είναι που γίνεται πολύ πικάντικο: τόσο τα μοντέλα 3B όσο και 8B μπορούν να χειριστούν ένα παράθυρο περιβάλλοντος 128.000 μάρκες. Αυτό ισοδυναμεί με ένα βιβλίο 50 σελίδων. Για σύγκριση, ακόμη και το GPT-4 Turbo του OpenAI έχει περίπου τον ίδιο αριθμό διακριτικών, και αυτό δεν είναι μικρό κατόρθωμα.
Με αυτό το είδος χωρητικότητας, τα μοντέλα Ministraux δεν ξεπερνούν απλώς τον προκάτοχό τους, το Mistral 7B — τρώνε επίσης τα μοντέλα Gemma 2 2B της Google και τα μοντέλα Llama της Meta για πρωινό.
Σύμφωνα με τα κριτήρια αναφοράς της ίδιας της Mistral, το μοντέλο 3Β σημείωσε 60,9 στην αξιολόγηση της κατανόησης γλώσσας πολλαπλών εργασιών, αφήνοντας ανταγωνιστές όπως το Llama 3.2 3B και το Gemma 2 2B να στερούνται 56,2 και 52,4 αντίστοιχα.
Δεν είναι κακό για ένα “μικρότερο” μοντέλο, σωστά;
Ενώ όλοι οι άλλοι στον κόσμο της τεχνητής νοημοσύνης προσπαθούν να φτιάξουν μεγαλύτερα, χειρότερα μοντέλα που καταβροχθίζουν ενέργεια, το Mistral παίζει ένα διαφορετικό παιχνίδι. Με την εκτέλεση σε τοπικές συσκευές, το Les Ministraux έκοψε την ανάγκη για τεράστιους διακομιστές cloud και, με αυτόν τον τρόπο, προσφέρει μια πολύ πιο φιλική προς το περιβάλλον επιλογή. Είναι μια κίνηση που ευθυγραμμίζεται απόλυτα με την αυξανόμενη πίεση στις εταιρείες τεχνολογίας να έχουν μεγαλύτερη περιβαλλοντική συνείδηση. Η τεχνητή νοημοσύνη μπορεί να είναι το μέλλον, αλλά κανείς δεν θέλει αυτό το μέλλον να έρθει σε βάρος του πλανήτη.
Υπάρχει επίσης η γωνία απορρήτου. Καθώς όλα εκτελούνται τοπικά, τα δεδομένα σας παραμένουν στη συσκευή σας, κάτι που αποτελεί τεράστια νίκη για κλάδους όπως η υγειονομική περίθαλψη και η χρηματοδότηση που βρίσκονται όλο και περισσότερο στο μικροσκόπιο για τον τρόπο με τον οποίο χειρίζονται ευαίσθητες πληροφορίες. Μπορείτε να το σκεφτείτε ως τεχνητή νοημοσύνη χωρίς την κατασκοπεία—μια αναζωογονητική αλλαγή σε έναν κόσμο όπου κάθε εφαρμογή φαίνεται να συλλέγει περισσότερα δεδομένα από την NSA.
Το γενικό σχέδιο του Mistral: Δημιουργία, διακοπή, επανάληψη
Αλλά ας μην κοροϊδεύουμε τον εαυτό μας—το Mistral δεν το κάνει μόνο για το γενικότερο καλό. Η εταιρεία, που ιδρύθηκε από τους αποφοίτους της Meta και του DeepMind της Google, δραστηριοποιείται στον τομέα της δημιουργίας κυμάτων. Έχουν ήδη συγκεντρώσει 640 εκατομμύρια δολάρια σε επιχειρηματικά κεφάλαια και επικεντρώνονται στο λέιζερ στην κατασκευή μοντέλων τεχνητής νοημοσύνης που όχι μόνο συναγωνίζονται τα GPT-4 του OpenAI και του Claude της Anthropic, αλλά και αποφέρουν κέρδος στη διαδικασία.
Και ενώ το να κερδίζεις χρήματα στον χώρο της τεχνητής νοημοσύνης είναι τόσο εύκολο όσο το να κερδίσεις το λαχείο, το Mistral δεν κάνει πίσω. Στην πραγματικότητα, άρχισαν να παράγουν έσοδα το περασμένο καλοκαίρι, τα οποία είναι περισσότερα από ό,τι μπορείτε να πείτε για πολλούς από τους ανταγωνιστές τους.
Προσφέροντας το Ministral 8B για ερευνητικούς σκοπούς και διαθέτοντας και τα δύο μοντέλα μέσω της πλατφόρμας cloud τους, La Platforme, η Mistral τοποθετείται ως το ωραίο παιδί στο μπλοκ AI—αρκετά ανοιχτό για να προσελκύσει προγραμματιστές, αλλά αρκετά έξυπνο για να δημιουργεί έσοδα από την τεχνολογία του μέσω στρατηγικών συνεργασιών. Είναι μια υβριδική προσέγγιση που αντικατοπτρίζει αυτό που έκαναν οι γίγαντες ανοιχτού κώδικα, όπως η Red Hat, στον κόσμο του Linux, ενισχύοντας την κοινότητα ενώ κρατούν τα ταμειακά μηχανήματα σε ηχητικά μηνύματα.
Πιστώσεις εικόνας: Mistral
VIA: DataConomy.com