Google Gemini z funkcją generowania filmów

Google poszerza możliwości swojego asystenta AI o nowy, przełomowy tryb generowania filmów. Od 15 kwietnia subskrybenci Gemini Advanced mogą tworzyć 8-sekundowe klipy wideo w jakości 720p na podstawie samych opisów tekstowych.

Google Gemini i era generatywnego wideo

Gemini, znany już z przetwarzania tekstu, obrazów i mowy, teraz pozwala użytkownikom tworzyć krótkie klipy wideo. Wystarczy jedynie dobrze sformułowany prompt. Za możliwości nowej funkcji odpowiada model Veo 2. Umożliwia on tworzenie animowanych, realistycznych scen na podstawie opisu. Filmy są generowane w poziomym formacie MP4 (16:9), mają długość do 8 sekund i rozdzielczość 720p.

Google podkreśla, że Veo 2 to „przełom” w generowaniu filmów przez AI. Model lepiej rozumie fizykę świata rzeczywistego, dynamikę ruchu postaci oraz złożoność stylów wizualnych. W efekcie użytkownicy mogą wygenerować nie tylko statyczny pejzaż czy prostą animację. Są w stanie także stworzyć np. powolne ujęcie z lotu ptaka nad morskimi klifami lub animowaną scenę z bajkowym grzybem świecącym w mroku leśnego domku.

Prosto z tekstu – do mediów społecznościowych

Proces tworzenia filmów z pomocą Veo 2 zaprojektowano tak, aby był jak najprostszy. Trzeba jedynie wybrać model z rozwijanego menu w aplikacji Gemini (dostępnej na przeglądarce lub urządzeniach mobilnych), wpisać opis i poczekać na efekt. Im dokładniejszy prompt, tym większa precyzja efektu końcowego.

Gotowe materiały można łatwo pobrać lub udostępnić na platformach społecznościowych, takich jak TikTok, Instagram czy YouTube Shorts. Funkcja błyskawicznego udostępniania dostępna jest z poziomu interfejsu Gemini. Ponadto pliki wideo są automatycznie oznaczane cyfrowym znakiem wodnym SynthID, który informuje, że wygenerowała sztuczna inteligencja.

To podejście pozwala na szybką publikację oryginalnych treści. To może być szczególnie atrakcyjne dla twórców, marketerów czy zespołów kreatywnych pracujących nad prototypami koncepcji wizualnych.

Przeczytaj także: Google tworzy Gemini dla dzieci – AI opowie bajki, pomoże w nauce i odrobi lekcje.

Whisk Animate – obrazy ożywione przez AI

Google idzie o krok dalej, udostępniając model Veo 2 także w ramach eksperymentalnej platformy Google Labs o nazwie Whisk. To narzędzie pozwala zarówno na generowanie obrazów z użyciem promptów tekstowych i obrazowych, jak i ich animację.

Funkcja Whisk Animate umożliwia przekształcenie statycznego obrazu – wygenerowanego lub zaimportowanego – w 8-sekundowe wideo. Jest to narzędzie przeznaczone dla subskrybentów Google One AI Premium i dostępne globalnie poprzez stronę labs.google/whisk.

Nowa faza wyścigu na rynku AI wideo

Wprowadzenie modelu Veo 2 w aplikacji Gemini to bezpośrednia odpowiedź Google na działania konkurencji. OpenAI rozwija Sora – własną platformę generowania wideo. Z kolei Runway, specjalizujący się w syntetycznych treściach, pozyskał właśnie 300 mln dolarów na rozwój czwartej generacji swojego generatora filmów. Google nie zamierza pozostać w tyle. Integrując Veo 2 z usługami AI, tworzy własny ekosystem kreatywnych narzędzi, który obejmuje tekst, grafikę, głos i teraz także animowane wideo.

CEO Google DeepMind, Demis Hassabis, zapowiedział również, że w przyszłości modele z rodziny Gemini zostaną mocniej zintegrowane z Veo. To pozwoli lepiej rozumieć świat fizyczny i kontekst wizualny.

Chociaż funkcja dostępna jest obecnie tylko dla użytkowników Gemini Advanced, w przyszłości może trafić do szerszego grona. Subskrypcja kosztuje 97,99 zł miesięcznie, ale można ją przetestować bezpłatnie przez 30 dni.



Porozmawiaj z nami o sztucznej inteligencji
Dołącz do grupy "AI Business" na Facebooku


Sztuczna inteligencja w biznesie - przewodnik
AI w marketingu – jak zwiększyć sprzedaż i zaangażowanie klientów?
Test Turinga: Czy AI jest już inteligentniejsze od człowieka?

Newsletter
AI Business

Bądź na bieżąco z możliwościami sztucznej inteligencji w biznesie.
Zapisz się na bezpłatny newsletter.



Najnowsze artykuły - AI sztuczna inteligencja

Send this to a friend