Από εκεί που οι δυνατότητες του AI περιορίζονταν στη δημιουργία εικόνων μέσω prompts, τα τελευταία δυο χρόνια έχει γίνει ένα πανίσχυρο όπλο με ολοένα και πιο καινοτόμα εργαλεία να έρχονται στο φως όπως το Sora της OpenΑΙ, τα νέα εργαλεία του Google workspace και τις Premium Pages του LinkedIn. Και τώρα μαθαίνουμε ότι με ένα νέο AI εργαλείο Microsoft, ο τεχνολογικός ήγετης μπαίνει δυναμικά στο μέτωπο της τεχνητής νοημοσύνης.

Το Sora πάει το GenAI σε άλλο επίπεδο με νέα βίντεο
Ακόμη περισσότερο εντείνουν την αναμονή τα νέα βίντεο που κυκλοφόρησε το Sora και τώρα περιμένουμε να δούμε περισσότερα.

Δημιουργώντας το μέλλον

Το νέο μοντέλο AI ονόματι VASA-1 έχει τη δυνατότητα να δημιουργήσει βίντεο από μια μόνο φωτογραφία και ένα ηχητικό κλιπ ομιλίας. Τα βίντεο διαθέτουν συγχρονισμένες κινήσεις του προσώπου και των χειλιών, καθώς και "ένα μεγάλο φάσμα εκφράσεων προσώπου και φυσικών κινήσεων του κεφαλιού που συμβάλλουν στην αντίληψη της αυθεντικότητας και της ζωντάνιας".

Στη ιστοσελίδα για το AI εργαλείο Microsoft εξηγείται πώς λειτουργεί. "Οι βασικές καινοτομίες περιλαμβάνουν ένα ολιστικό μοντέλο δημιουργίας δυναμικών προσώπου και κινήσεων κεφαλής που λειτουργεί σε έναν λανθάνων χώρο προσώπου και την ανάπτυξη ενός τέτοιου εκφραστικού και αποδιαρθρωμένου λανθάνων χώρου προσώπου με τη χρήση βίντεο. Μέσω εκτεταμένων πειραμάτων, συμπεριλαμβανομένης της αξιολόγησης σε ένα σύνολο νέων μετρικών, δείχνουμε ότι η μέθοδός μας υπερτερεί σημαντικά έναντι προηγούμενων μεθόδων σε διάφορες διαστάσεις συνολικά. Η μέθοδός μας όχι μόνο παρέχει υψηλή ποιότητα βίντεο με ρεαλιστική δυναμική προσώπου και κεφαλής, αλλά υποστηρίζει επίσης την online παραγωγή βίντεο 512x512 με ταχύτητα έως και 40 FPS με αμελητέα καθυστέρηση εκκίνησης. Ανοίγει το δρόμο για engagement σε πραγματικό χρόνο με αληθοφανή άβαταρ που μιμούνται τις ανθρώπινες συμπεριφορές συνομιλίας".

0:00
/0:15

Source: Microsoft

Με άλλα λόγια, το νέο AI εργαλείο Microsoft είναι ικανό να δημιουργεί βίντεο με βάση μια μόνο εικόνα. Είναι αξιοσημείωτο ότι η Microsoft επιμένει ότι το εργαλείο είναι μια "ερευνητική επίδειξη και δεν υπάρχει σχέδιο κυκλοφορίας προϊόντος ή API". Φαινομενικά σε μια προσπάθεια να καθυσηχάσει όποιους φόβους, η εταιρεία υποδηλώνει ότι το VASA-1 δεν θα βρεθεί σύντομα στα χέρια του κοινού.

Εάν όμως ένα τέτοιο εργαλείο κυκλοφορήσει θα είναι ένα πολύ μεγάλο ατού για το eCommerce καθώς θα εκτοξεύσει την δημιουργία περιεχομένου στα πλαίσια της προώθησης καθώς και να υποστήριξει πιθανά και κάποια chatbot για την υποστήριξη πελατών δίνοντας τους ένα αληθοφανές πρόσωπο κάνοντας έτσι το κοινό να νιώθει καθυσηχασμένο.

Φυσικά, ακόμη περιμένουμε την κυκλοφορία του επίσης πολλά υποσχόμενου Sora της OpenAI ενώ πρόσφατα η Meta κυκλοφόρησε μια νέα λειτουργία για το Whatsapp που θα μετατρέπει κείμενο σε εικόνες για τις συνομιλίες.