Το Sora είναι το νέο εντυπωσιακό ΑΙ μοντέλο της OpenAI, το οποίο προσφέρει τη δυνατότητα μετατροπής κειμένου σε βίντεο (text-to-video) και τώρα, σύμφωνα με το 9 to 5 Google, η OpenAI ενημερώνει ότι το νέο αυτό μοντέλο της θα γίνει δημόσια κάποια στιγμή αργότερα μέσα στο 2024.

Το AI κερδίζει έδαφος: OpenAI και Google

Η OpenAI παρουσίασε για πρώτη φορά το Sora νωρίτερα μέσα στο έτος, ειρωνικά την ίδια μέρα που και η Google ανακοίνωσε το Gemini 1.5, που όμως αποσύρθηκε προσωρινά λόγω αντιδράσεων επί της λειτουργίας του. Τα βλέμματα στράφηκαν πάνω στο νέο αυτό text-to-video μοντέλο τεχνητής νοημοσύνης λόγω της ικανότητας του να δημιουργεί εντυπωσιακά βίντεο αφότου τροφοδοτηθεί με υποδείξεις κειμένου (γνωστά και ως prompt). Το ήδη αυτό viral εργαλείo φαίνεται να δίνει αποτελέσματα που είναι δύσκολο να διακρίνει κανείς αν είναι λαηθινά ή όχι, δίνοντας μάλιστα την αίσθηση ότι πρόκειται για πραγματικές λήψεις βίντεο.

Μέχρι στιγμής, η OpenAI δήλωσε ότι το Sora περιορίζεται σε βίντεο 60 δευτερολέπτων, αλλά τα αποτελέσματα ήταν αξιοθαύμαστα ακόμα και μέσα σε λιγα δευτερόλεπτα. Αυτό όμως είναι το μόνο αποτέλεσμα που έχουμε δει από την OpenAI, καθώς το μοντέλο δεν είναι ακόμη διαθέσιμο στο κοινό. Αυτό όμως σύντομα θα αλλάξει.

Εικαστικό με το λογότυπο του OpenAI

Πότε να αναμένουμε το Sora

Σε συνέντευξή της στην Wall Street Journal, η Mira Murati της OpenAI επιβεβαίωσε ότι το Sora πρόκειται να κυκλοφορήσει "σίγουρα φέτος" και ενδεχομένως σε "μερικούς μήνες" από τώρα.

Μέσα από τη συνέντευξη της επιβεβαίωσε επίσης ότι η OpenAI στοχεύει να επιτρέψει στους χρήστες να "επεξεργαστούν" το output ζητώντας τους απευθείας να διορθώσουν ζητήματα στα βίντεο. Επίσης, το μοντέλο δεν θα λειτουργεί με ήχο προς το παρόν.

Η πηγή από την οποία πήρε το Sora τα δεδομένα εκπαίδευσης ήταν και αυτό ένα βασικό μέρος της συνέντευξης, με την Murati να επιβεβαιώνει ότι για την εκπαίδευση του μοντέλου χρησιμοποιήθηκαν βίντεο που ήταν "δημόσια διαθέσιμα" και βίντεο με άδεια από το Shuttershock. Αξίζει να σημειώσουμε ότι πολλές, πιο συγκεκριμένες ,ερωτήσεις, όπως αν χρησιμοποιήθηκαν βίντεο από το YouTube, παρέμειναν αναπάντητες για την ώρα.

Τι είναι το Sora και πώς λειτουργεί;

Το Sora είναι ένα generative AI μοντέλο που μέσα από υποδείξεις κειμένου δημιουργεί βίντεο που να αντιστοιχεί με αυτό που περιγράφει η υπόδειξη. Ένα από τα διάσημα παραδείγματα είναι η γυναίκα που περιπλανιέται στους δρόμους του Τόκιο και μπορείτε να δείτε το παράδειγμα παρακάτω:

To βίντεο δημιουργήθηκε ακολουθώντας το εξής κείμενο:

Μια κομψή γυναίκα περπατάει σε έναν δρόμο του Τόκιο γεμάτο με ζεστό λαμπερό νέον και κινούμενες πινακίδες της πόλης. Φοράει ένα μαύρο δερμάτινο μπουφάν, ένα μακρύ κόκκινο φόρεμα και μαύρες μπότες και κρατάει μια μαύρη τσάντα. Φοράει γυαλιά ηλίου και κόκκινο κραγιόν. Περπατάει με αυτοπεποίθηση και άνεση. Ο δρόμος είναι υγρός και αντανακλαστικός, δημιουργώντας ένα εφέ καθρεφτισμού των πολύχρωμων φώτων. Διάφοροι πεζοί περπατούν.

Παρόμοια με τα AI μοντέλα που μετατρέπουν κείμενο σε σε εικόνα, όπως τα DALL-E 3, το StableDiffusion και το Midjourney, το Sora είναι ένα diffusion μοντέλο, που σημαίνει ότι ξεκινάει με το κάθε καρέ του βίντεο να αποτελείται από στατικό θόρυβο και να αξιοποιεί το machine learning για να μετατρέψει σταδιακά τις εικόνες σε κάτι που μοιάζει με την περιγραφή στην προτροπή. Το νέο αυτό μοντέλο πρωτοανακοινώθηκε το Φλεβάρη και ήδη έχει τραβήξει τα βλέμματα αναμένοντας μια πλήρους έυρους κυκλοφορία ώστε να αποκαλυφθούν οι πλήρεις δυνατότητες. Μπορείτε να δείτε περισσότερα παραδείγματα στο site της OpenAI.

Τι σημαίνει αυτό για το eCommerce;

Δεν είναι μυστικό ότι τα τελευταία χρόνια όλο και περισσότερα AI εργαλεία έχουν αναπτυχθεί για να διευκολύνουν ολοένα και περισσότερο τις online αγορές, τόσο από την πλευρά των πωλητών όσο και των αγοραστών.

Το είδαμε πρόσφατα με το Amazon και τα νέα εργαλεία του, τον βοηθό αγορών Rufus και τις AI δυνατότητες για να βοηθήσει το κοινό να ψωνίζει πιο σωστά ρούχα.

Έτσι και το Sora θα μπορούσε να αλλάξει το τρόπο με τον οποίο οι πωλητές πιθανά δημιουργούν περιεχόμενο και τριασδιάστα μοντέλα των προϊόντων τους μέσα από μια περιγραφή. Ιδίως σε κατηγορίες όπως ο ρουχισμός ή τα εργαλεία θα μπορούσε να αξιοποιηθεί για να τοποθετηθεί το προϊόν ακόμη και ίσως σε κατάσταση χρήσης.

Το μόνο σίγουρο ότι ο ρεαλισμός που αποπνέεουν τα βίντεο του Sora αφήνουν ένα ευρύ πεδίο δυνατοτήτων που μπορεί να αξιοποιηθεί για την παραγωγή περιεχομένου τόσο σε επίπεδο eshop όσο και σε επίπεδο social media αναρτήσεων. Αναμένουμε να δούμε το AI μοντέλο σε πλήρη λειτουργία ώστε να γίνει ακόμη πιο σαφές πως θα μπορούσε να επηρεάσει το κόσμο του eCommerce.