Το open-source AI μοντέλο παραγωγής video της Tencent εντυπωσιάζει!

4 Δεκεμβρίου, 2024

1325

Το open-source AI μοντέλο παραγωγής video της Tencent εντυπωσιάζει!

Στις αρχές της χρονιάς, η OpenAI παρουσίασε το Sora, ένα νέο AI μοντέλο παραγωγής βίντεο που μπορεί να δημιουργήσει ρεαλιστικές και ευφάνταστες σκηνές από προτροπές κειμένου. Αν και η OpenAI καθυστέρησε τη δημόσια κυκλοφορία του Sora, είδαμε αρκετές startups τεχνητής νοημοσύνης, συμπεριλαμβανομένων των Runway και Luma, να κυκλοφορούν τους τελευταίους μήνες τα δικά τους αντίστοιχα μοντέλα παραγωγής βίντεο.

Τώρα, ο κινεζικός γίγαντας Tencent ανακοίνωσε το HunyuanVideo, ένα υπερσύγχρονο μοντέλο παραγωγής βίντεο το οποίο είναι επίσης ανοιχτού κώδικα. Πρόκειται για το πρώτο σημαντικό open-source μοντέλο παραγωγής βίντεο με τον κώδικα εξαγωγής συμπερασμάτων και τα βάρη του μοντέλου ανοιχτά διαθέσιμα για όλους.

Η Tencent ισχυρίζεται ότι το HunyuanVideo μπορεί να παράγει βίντεο που είναι συγκρίσιμα με κορυφαία μοντέλα κλειστού κώδικα με υψηλή οπτική ποιότητα, ποικιλομορφία κίνησης, ευθυγράμμιση κειμένου-βίντεο και σταθερότητα παραγωγής. Με περισσότερες από 13 δισεκατομμύρια παραμέτρους, είναι το μεγαλύτερο μεταξύ όλων των μοντέλων παραγωγής βίντεο ανοιχτού κώδικα. Το HunyuanVideo περιλαμβάνει ένα πλαίσιο που ενσωματώνει την επιμέλεια δεδομένων, την κοινή εκπαίδευση μοντέλων εικόνας-βίντεο και μια αποτελεσματική υποδομή για την υποστήριξη εκπαίδευσης και συμπερασμού μοντέλων μεγάλης κλίμακας.

Η Tencent δοκίμασε επίσης το μοντέλο χρησιμοποιώντας επαγγελματική αξιολόγηση από ανθρώπους. Σύμφωνα με τα αποτελέσματα της αξιολόγησης, το HunyuanVideo ξεπερνά όλα τα κορυφαία μοντέλα κλειστού κώδικα, συμπεριλαμβανομένων των Runway Gen-3 και Luma 1.6.

Αντί να χρησιμοποιεί ξεχωριστά μοντέλα για τη δημιουργία κειμένου, εικόνας και βίντεο, η Tencent χρησιμοποίησε την ακόλουθη διαφορετική τεχνική για να επιτύχει καλύτερη ποιότητα βίντεο σε σύγκριση με τα υπάρχοντα μοντέλα:

Το HunyuanVideo εισάγει τον σχεδιασμό Transformer και χρησιμοποιεί έναν μηχανισμό πλήρους προσοχής για την ενοποιημένη παραγωγή εικόνας και βίντεο. Συγκεκριμένα, χρησιμοποιούμε έναν υβριδικό σχεδιασμό μοντέλου «Dual-stream to Single-stream» για τη δημιουργία βίντεο. Στη φάση διπλής ροής, τα σημεία βίντεο και κειμένου επεξεργάζονται ανεξάρτητα μέσω πολλαπλών μπλοκ Transformer, επιτρέποντας σε κάθε τρόπο να μάθει τους δικούς του κατάλληλους μηχανισμούς διαμόρφωσης χωρίς παρεμβολές. Στη φάση single-stream, συνενώνουμε τις μάρκες βίντεο και κειμένου και τις τροφοδοτούμε σε επόμενα μπλοκ Transformer για αποτελεσματική πολυτροπική συγχώνευση πληροφοριών. Αυτός ο σχεδιασμός καταγράφει τις πολύπλοκες αλληλεπιδράσεις μεταξύ οπτικών και σημασιολογικών πληροφοριών, ενισχύοντας τη συνολική απόδοση του μοντέλου.

Η κυκλοφορία του HunyuanVideo σηματοδοτεί ένα σημαντικό βήμα προς τον εκδημοκρατισμό της τεχνολογίας παραγωγής AI βίντεο.

[via]

VIA: Πηγή Άρθρου

Greek Live Channels Όλα τα Ελληνικά κανάλια:
Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση;
Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο.
Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ

Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.

Tags
ai

Προηγούμενο άρθρο

Το iPad Pro θα είναι η πρώτη συσκευή που θα λάβει την επεξεργασία τσιπ M5, αλλά αντιμετωπίζει μια μικρή καθυστέρηση, καθώς η μαζική παραγωγή έχει προγραμματιστεί για το δεύτερο εξάμηνο του 2025

Επόμενο άρθρο

Νέες φήμες ότι το αναδιπλούμενο της Apple θα είναι Fold

Διάφορα από την ίδια κατηγορία

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

Το open-source AI μοντέλο παραγωγής video της Tencent εντυπωσιάζει!

Καθώς το Bitcoin φαίνεται έτοιμο να ξεπεράσει το επίπεδο τιμής των 100.000 $, ο Πούτιν θέτει τη ρητορική ερώτηση: “Ποιος μπορεί να σταματήσει το...

D-Link DWP-1010KT: Η νέα εποχή του 5G και Wi-Fi 6

Το Gaijin’s Engine Showcase συγκρίνει το Dagor με το Unreal Engine 5 της Epic

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ Ακύρωση απάντησης

Δημοφιλείς Άρθρα

Meta: Μπλόκο σε χιλιάδες απάτες με διασημότητες έπειτα από πιέσεις της Αυστραλίας

Ο Έλον Μασκ θέλει το δικαστήριο να σταματήσει το OpenAI να γίνει κερδοσκοπικό

Η Meta ετοιμάζει παγκόσμιο υποβρύχιο καλώδιο Internet με κόστος $10 δισ.

Αυστραλία: Η Meta βάζει φρένο στο… «δόλωμα διασημοτήτων» για να περιορίσει τις οικονομικές απάτες –

Τελευταία Νέα

Καθώς το Bitcoin φαίνεται έτοιμο να ξεπεράσει το επίπεδο τιμής των 100.000 $, ο Πούτιν θέτει τη ρητορική ερώτηση: “Ποιος μπορεί να σταματήσει το...

Trailer αποκαλύπτει τους Cloak και Dagger του Marvel Rivals

The Last of Us: Season 2: Περίοδος προβολής

Πάει παντού το νέο Red Magic 10 Pro και ξεκινά από 649 ευρώ

Επιλογές Συντακτών

Tesla Model Pi: Η Αλήθεια Πίσω από τις Φήμες για το Νέο Smartphone της Tesla

Galaxy S25 Ultra: Αποκλειστικές Εικόνες & Πληροφορίες για το One UI 7

Simple Analytics: Μια Σύντομη Ματιά στο Εργαλείο Ανάλυσης που Βάζει την Ιδιωτικότητα Πρώτη

Τυχαία Άρθρα

Η νέα πίστα ξεκινά

Δείτε τον αστεροειδή που διέσχισε τη Σιβηρία και εξερράγη στον ουρανό (βίντεο)

Ο άνδρας με τον χρυσό βράχο

POPULAR CATEGORY

ABOUT US

FOLLOW US