Η Google έχει αρχίσει να παρέχει ιδιωτική πρόσβαση στα μοντέλα τεχνητής νοημοσύνης της Veo και Imagen 3. Από σήμερα, οι πελάτες του πακέτου Vertex AI Google Cloud της εταιρείας μπορούν να αρχίσουν να χρησιμοποιούν το Veo για τη δημιουργία βίντεο από μηνύματα προτροπής κειμένου και εικόνες. Στη συνέχεια, από την επόμενη εβδομάδα, η Google θα κάνει διαθέσιμο το Imagen 3, το πιο πρόσφατο πλαίσιο κειμένου σε εικόνα, στους ίδιους χρήστες.
Με την κυκλοφορία του Veo, η Google λέει ότι είναι ο πρώτος πάροχος cloud υπερκλίμακας που προσφέρει ένα μοντέλο εικόνας σε βίντεο. Σε εκείνο το σημείο, το μοντέλο Sora του OpenAI εξακολουθεί να είναι διαθέσιμο μόνο σε επιλεγμένους καλλιτέχνες, ακαδημαϊκούς και ερευνητές — αν και αυτό θα μπορούσε να αλλάξει γρήγορα με την εταιρεία πειράγματα 12 ημερών επίδειξης προϊόντων από τις 5 Δεκεμβρίου.
Για το Veo, η Google λέει ότι το μοντέλο δημιουργεί πλάνα 1080p «που είναι συνεπή και συνεπή» και μπορεί να τρέξει «πέρα από ένα λεπτό». Το εργαλείο είναι επίσης ικανό να λειτουργεί τόσο με μηνύματα κειμένου όσο και με εικόνες. Στην τελευταία περίπτωση, είναι δυνατό να χρησιμοποιηθούν είτε δημιουργημένες από AI είτε ανθρωπογενείς εικόνες ως αφετηρία για ένα βίντεο.
Κοιτάζοντας το δείγμα βίντεο που μοιράστηκε η Google, είναι προφανές ότι το Veo, όπως όλα τα μοντέλα τεχνητής νοημοσύνης, μπορεί να παλέψει με την αιτία και το αποτέλεσμα. Για παράδειγμα, στο κλιπ των marshmallows που ψήνουν, οι λιχουδιές δεν κιτρινίζουν και ανθίζουν καθώς εκτίθενται στη ζέστη της φλόγας της φωτιάς. Το τεχνούργημα είναι επίσης ένα ζήτημα, όπως φαίνεται αν κοιτάξετε προσεκτικά τα χέρια στα πλάνα της συναυλίας.
Όσον αφορά το Imagen 3, η Google λέει ότι το μοντέλο δημιουργεί «τις πιο ρεαλιστικές και υψηλότερης ποιότητας εικόνες από απλά μηνύματα κειμένου, ξεπερνώντας τις προηγούμενες εκδόσεις του Imagen σε λεπτομέρεια, φωτισμό και μείωση τεχνουργημάτων». Και εδώ, ωστόσο, δεν χρειάζεται να κοιτάξετε πολύ προσεκτικά για να δείτε ότι η Google έχει περισσότερη δουλειά να κάνει.
Στο πρώτο παράδειγμα μιας ομάδας φίλων που κάθονται στο πορτμπαγκάζ ενός αυτοκινήτου, η αρχική προτροπή περιλαμβάνει αναφορά της «φωτογράφησης με φλας», αλλά τα θέματα είναι σαφώς οπίσθιο φωτισμό. Θα μπορούσε κανείς να υποστηρίξει ότι ένα φλας χρησιμοποιήθηκε για τη δημιουργία έντονου οπίσθιου φωτισμού, αλλά αν η ιδέα πίσω από την προτροπή ήταν να δημιουργηθεί κάτι αντιπροσωπευτικό της φωτογραφίας με φλας από τη δεκαετία του 1960, αυτή η εικόνα δεν είναι αυτή.
Ωστόσο, η Google επιθυμεί να αποκτήσει περισσότερους από τους εταιρικούς πελάτες της να χρησιμοποιούν γενετική τεχνητή νοημοσύνη. Παραθέτοντας τη δική της έρευναλέει ο τεχνολογικός γίγαντας μεταξύ των εταιρειών που χρησιμοποιούν γενετική τεχνητή νοημοσύνη στην παραγωγή, το 86 τοις εκατό αναφέρει αύξηση των εσόδων. Ωστόσο, α πρόσφατη έρευνα Appen διαπιστώθηκε ότι η απόδοση της επένδυσης από έργα τεχνητής νοημοσύνης μειώθηκε κατά 4,6 ποσοστιαίες μονάδες από το 2023 έως το 2024.
Εάν αγοράσετε κάτι μέσω ενός συνδέσμου σε αυτό το άρθρο, ενδέχεται να κερδίσουμε προμήθεια.
VIA: Πηγή Άρθρου
Greek Live Channels Όλα τα Ελληνικά κανάλια:
Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση;
Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο.
Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια
Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.