back to top
Τετάρτη, 4 Δεκεμβρίου, 2024
ΑρχικήNewsΚινέζικο μοντέλο ΝΜ ανταγωνίζεται το GPT-3 της OpenAI

Κινέζικο μοντέλο ΝΜ ανταγωνίζεται το GPT-3 της OpenAI


Ένα κινέζικο εργαστήριο της DeepSeek αποκάλυψε το πρώτο μοντέλο τεχνητής νοημοσύνης που μπορεί να ανταγωνιστεί το ο1 της OpenAI. Όλα αυτά με τις δυσκολίες που αντιμετωπίζει η Κίνα, λόγω του αποκλεισμού της από τις αγορές ισχυρών GPUs, για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης. Η Κίνα όμως βρίσκει τρόπους να καινοτομήσει, ακόμα και χωρίς τον εξοπλισμό που χρειάζεται και αυτό από μόνο του είναι φοβερό.

Την περασμένη Τετάρτη, μια εταιρία έρευνας ΑΙ, DeepSeek, λάνσαρε το DeepSeek-R1. Σύμφωνα με την ομάδα πίσω από το έργο, πρόκειται για το πρώτο μοντέλο τεχνητής νοημοσύνης που μπορεί να ανταγωνιστεί το o1, της OpenAI, σε ότι έχει να κάνει με την συλλογιστική.

Αυτό σημαίνει πως όπως και στο o1, το μοντέλο χρειάζεται κάποιο χρόνο για να απαντήσει, αφού εξετάζει πολλές και διαφορετικές πιθανές απαντήσεις, οπότε ο χρήστης θα πρέπει να περιμένει λίγο παραπάνω για να λάβει την απάντηση.

Όμως, μέσα από δοκιμές στις επιδόσεις, το κινέζικο μοντέλο είναι άμεσα συγκρίσιμο με το μοντέλο που ανακοίνωσε η OpenAI τον Σεπτέμβριο!

Το κινέζικο μοντέλο της DeepSeek αντιμετωπίζει τα ίδια συλλογιστικά προβλήματα που παρατηρούνται και στο o1 της OpenAI, όπως απλά παιχνίδια, σαν το τρία στη σειρά. Όμως, στην παρούσα φάση, το DeepSeek-R1 μπορεί να ξεγελαστεί ώστε να ξεπεράσει τους φραγμούς ασφαλείας και να παράγει τοξικό περιεχόμενο. Για παράδειγμα, ένας χρήστης δημοσίευσε στο X πως του έδωσε μια λεπτομερή συνταγή μεθεθρεαλικής μεθόδου. Κοινώς του είπε πως να φτιάξει κρυσταλλική μεθαμφεταμίνη ή αλλιώς τα ναρκωτικά που έφτιαχναν στο Breaking Bad. Ο χρήστης του ζήτησε να δημιουργήσει τη συνταγή για να είναι αλληθοφανές το σενάριο που έγραφε και το DeepSeek απλά την έδωσε, με δολολογίες, χρόνους και όλες τις λεπτομέρειες.

Στις δοκιμές το κινέζικο μοντέλο DeepSeek-R1 ζητούσε συγγνώμη και δεν απαντούσε αν ο χρήστης ρωτούσε σχόλια για την πολιτική κατάσταση στην Κίνα. Πιθανότατα η κινέζικη κυβέρνηση έχει ασκήσει πιέσεις για να συμβαίνει αυτό και σύμφωνα με του Financial Times, το μοντέλο τεχνητής νοημοσύνης έχει μηχανισμούς λογοκρισίας, ώστε να ευθυγραμμίζεται με τις πολιτικές της χώρας.

H Σελήνη απομακρύνεται από τη Γη

H DeepSeek χρηματοδοτείται από την High-Flyer Capital Management, ένα κινέζικο επενδυτικό ταμείο, που αποσκοπεί να χρησιμοποιήσει την τεχνητή νοημοσύνη για λήψη επενδυτικών αποφάσεων. Η εταιρία παρέχει και τα clusters servers της για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης και διαθέτει 10.000 GPUs Nvidia A100, που κόστισαν 139 εκατομμύρια δολάρια. Ο στόχος της High-Flyer είναι η δημιουργία ενός AGI, μέσω του DeepSeek. Το πολύ εντυπωσιακό όμως είναι πως οι δημιουργοί της DeepSeek θέλουν να δημοσιεύσουν τον κώδικα του μοντέλου, διαθέτοντάς το σαν Open Source και να προσφέρουν ένα API.

Η Κίνα προχωρά με ταχύ ρυθμό στην τεχνητή νοημοσύνη, παρά τις προσπάθειες των Αμερικάνων να την σταματήσουν. Μάλιστα, το μοντέλο της DeepSeek είναι τόσο καλό, που οι κινέζοι ανταγωνιστές της όπως η ByteDance, η Alibaba και η Baidu, μείωσαν τις τιμές τους στα πακέτα συνδρομών για τα δικά τους μοντέλα, ενώ ορισμένοι τα διέθεσαν δωρεάν.

Μπορείτε να δοκιμάσετε το μοντέλο ΕΔΩ.





Greek Live Channels Όλα τα Ελληνικά κανάλια:
Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση;
Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο.
Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ


Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.


Dimitris Marizas
Dimitris Marizashttps://cybervista.gr
Παθιασμένος με τις νέες τεχνολογίες, με έφεση στην καινοτομία και τη δημιουργικότητα. Διαρκώς αναζητώ τρόπους αξιοποίησης της τεχνολογίας για την επίλυση προβλημάτων και τη βελτίωση της καθημερινής ζωής.
Διάφορα από την ίδια κατηγορία

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

Δημοφιλείς Άρθρα

Τελευταία Νέα