Sztuczna inteligencja rozwija się w ekspresowym tempie. Jeszcze kilka miesięcy temu filmy wideo generowane przez AI straszyły lub bawiły jakością wykonania. Najnowsze nagrania generowane przez program Sora zachwycają jakością wykonania. Zobaczcie, co potrafi nowy program do generowania plików wideo od OpenAI.
Sora - generator wideo AI
Dzięki DALL-E w przeglądarce Bing każdy może wygenerować dowolny obraz z opisu. Program wspierany przez sztuczną inteligencję od OpenAI w kilka chwil generuje dowolne grafiki i cieszy się ogromną popularnością. Najnowszy produkt od OpenAI o nazwie Sora pójdzie o krok dalej i będzie generował pliki wideo na podstawie opisów. Pierwsze próbki możliwości tego generatora znaleźć można na profilu OpenAI na platformie X i trzeba przyznać, że wyglądają one o wiele lepiej niż materiały generowane przez AI jeszcze kilka miesięcy temu jak np. słynna w sieci reklama pizzerii wygenerowana przez sztuczną inteligencję. Nowy model AI o nazwie Sora ma służyć do generowania klipów wideo na podstawie opisów tekstowych. Jak przeczytać możemy na stronie Open AI:
Model doskonale rozumie język, co pozwala mu dokładnie interpretować podpowiedzi i tworzyć fascynujące postacie wyrażające żywe emocje. Sora może także utworzyć wiele ujęć w jednym wygenerowanym filmie, które wiernie oddają charakter i styl wizualny.
Chociaż nagrania zaprezentowane przez OpenAI zachwycają, to twórcy Sory uprzedzają, że ich program nadal się rozwija i nie jest idealny:
Obecny model ma słabe strony. Może mieć trudności z dokładnym symulowaniem fizyki złożonej sceny i może nie rozumieć konkretnych przypadków przyczyny i skutku. Na przykład osoba może ugryźć ciasteczko, ale potem ciasteczko może nie mieć śladu ugryzienia. Model może także mylić szczegóły przestrzenne podpowiedzi, np. pomieszanie lewej i prawej strony, a także może mieć trudności z precyzyjnym opisem zdarzeń zachodzących w czasie, np. podążaniem określoną trajektorią kamery.
Na chwilę obecną Sora jest testowana i nie wiadomo kiedy zostanie udostępniona dla wszystkich. Zobaczcie, jak wyglądają nagrania wygenerowane przez sztuczną inteligencję. Poniższy klip powstał po wprowadzeniu polecenia:
Stylowa kobieta idzie ulicą Tokio wypełnioną ciepłymi, świecącymi neonami i animowanymi oznakowaniami miasta. Nosi czarną skórzaną kurtkę, długą czerwoną sukienkę i czarne buty i nosi czarną torebkę. Nosi okulary przeciwsłoneczne i czerwoną szminkę. Chodzi pewnie i swobodnie. Ulica jest wilgotna i odblaskowa, tworząc lustrzany efekt kolorowych świateł. Przechadza się wielu pieszych.