Wprowadzenie na rynek oprogramowania Sora opartego na technologii OpenAI otworzyło drzwi dla aplikacji do generowania wideo opartych na sztucznej inteligencji, które potrafią tworzyć krótkie klipy na podstawie komunikatów tekstowych. Teraz do walki włączył się także Google, ogłaszając na dorocznej konferencji programistów I/O własną aplikację do generowania wideo – Veo – podczas corocznej konferencji programistów I/O.
Jednak podobnie jak wiele innych nowo ogłoszonych narzędzi AI, nowy generator wideo nie jest jeszcze dostępny do użytku publicznego. Google planuje umożliwić artystom i twórcom wypróbowanie tego narzędzia za pomocą ćwiczeń crowdsourcingowych, które mogą pomóc w jego udoskonaleniu. Oto, czego jeszcze dowiedzieliśmy się o Google Veo.
Co potrafi Veo?
Google Veo może generować filmy w rozdzielczości 1080p trwające ponad minutę, a także możesz je edytować, korzystając z pisemnych instrukcji. Może zapewnić spójność wizualną ramek, a użytkownicy mogą używać pojedynczego podpowiedzi lub serii podpowiedzi tworzących narrację. Narzędzie może uwzględniać efekty kinowe, takie jak zdjęcia lotnicze, i tworzyć bardzo szczegółowe sceny.
Tworząc filmy za pomocą Veo, możesz postawić na realizm, surrealizm, a nawet animację. Poza tym umożliwia korzystanie z poleceń związanych z tworzeniem filmów i rozumie pojęcia takie jak „zdjęcia lotnicze” i „timelapse”. W porównaniu do wcześniejszych generatorów wideo AI zapowiedzianych przez Google, Veo zapewnia większą kontrolę, zapewniając jednocześnie lepszą jakość filmów.
Veo obsługuje także edycję maskowaną, która umożliwia wprowadzanie zmian w określonych sekcjach wideo. Można to zrobić, włączając obszar maski do monitu. Obrazy można także wykorzystywać wraz z podpowiedziami tekstowymi do generowania filmów.
W takim przypadku użyje dostarczonego obrazu jako odniesienia i wygeneruje film w tym samym stylu, taki jak poniższy film, który został wygenerowany przy użyciu obrazu alpak w swetrach z dzianiny i podpowiedzi Alpacas dancing to the beat
.
Jak działa Veo?
Modele wideo AI muszą prawidłowo rozumieć wyświetlane monity i łączyć te informacje z dostępnymi odniesieniami. Veo zostało zaprojektowane tak, aby wyjątkowo dobrze rozumieć język naturalny i efekty wizualne, co pozwala na dokładne generowanie filmów, w tym tych z kilkoma szczegółami.
Z tego powodu taki monit Timelapse of a common sunflower opening, dark background
może zapewnić wideo o bardzo wysokiej jakości.
Według Google Veo udoskonala inne narzędzia do generowania wideo zapowiedziane wcześniej przez firmę, takie jak Lumiere, VideoPoet, WALT itp., wykorzystując wykorzystanie skompresowanego ukrytego wideo. W przeciwieństwie do tych narzędzi Veo jest szkolony w zakresie szczegółowych napisów do filmów, co pomaga sztucznej inteligencji lepiej zrozumieć podpowiedzi.
Google twierdzi, że generator wideo opiera się na ukrytych transformatorach dyfuzyjnych, co zapewnia spójność i zapobiega migotaniu postaci i obiektów oraz przeskakiwaniu między scenami. Wykorzystuje również ukryte, czyli skompresowane reprezentacje wideo, które zwiększają jego wydajność i pomagają poprawić wydajność. Dzięki temu Veo może generować wysokiej jakości filmy w krótszym czasie.
Filmy wygenerowane za pomocą Veo zostaną oznaczone znakiem wodnym przy użyciu identyfikatora SynthID firmy Google, którego używa do identyfikacji treści generowanych przez sztuczną inteligencję, podobnie jak Sora z OpenAI w ramach standardu Coalition for Content Provenance and Authenticity (C2PA).
Ponadto istnieją procesy sprawdzania zapamiętywania i filtry bezpieczeństwa, które pomagają zmniejszyć ryzyko stronniczości, praw autorskich i prywatności. Pomimo tych technologii i procesów, Veo nadal wymaga pewnych ulepszeń, ponieważ tła wciąż mają tendencję do przesuwania się, a bardzo szczegółowe obszary nie wydają się zbyt dobrze połączone. Dlatego Google pozwala tylko kilku twórcom testować tę funkcję.
Jak korzystać z Veo?
Jak wspomniano powyżej, narzędzie Veo nie jest obecnie dostępne do użytku publicznego, a Google umożliwia wypróbowanie tego narzędzia tylko kilku wybranym twórcom. Mogą to wypróbować za pomocą VideoFX, innego eksperymentalnego narzędzia dostępnego w Laboratorium Google, w którym znajdują się wszystkie testowane produkty Google.
Jeśli jesteś twórcą i chcesz wypróbować Veo,
- Odwiedź witrynę Laboratorium Google, aby dołączyć do listy oczekujących.
- Wprowadź swoje dane i prześlij je.
- Poczekaj, aż Google sprawdzi Twoje zgłoszenie. Jeśli uzna to za odpowiednie, będziesz mógł wypróbować Veo.
Google Veo to najnowszy produkt z długiej linii generatorów wideo opartych na sztucznej inteligencji ogłoszonych przez Google i wydaje się być najpotężniejszym z dotychczasowych. Pozwala nie tylko tworzyć filmy przy użyciu różnych stylów i efektów, ale także łatwo edytować utworzone filmy.
Wyjaśniliśmy, w jaki sposób twórcy mogą zapisać się na listę oczekujących i samodzielnie wypróbować narzędzie, ale nie wiadomo, czy Veo zostanie udostępnione publicznie. Google jedynie zasugerował, że niektóre możliwości narzędzia mogą pojawić się w krótkich filmach YouTube, więc jest na co czekać.
Dodaj komentarz