Choć sztucznej inteligencji daleko do dystopijnych scenariuszy, jakie znamy z „Black Mirror”, to nowe narzędzia mogą wywołać niemałą konsternację. Dzięki narzędziom do ożywiania zdjęć możemy wprawić w ruch popularne memy, fotografie z podróży, a także zdjęcia bliskich.
Technologia przetwarzania zdjęć w wideo dzięki wykorzystaniu AI ma się dobrze i staje się coraz łatwiej dostępna. Narzędzia do przetwarzania statycznych obrazów w dynamiczne filmy z dźwiękiem są intuicyjne, a do ich wygenerowania wystarczą proste prompty.
Deep Nostalgia
Witryna genealogiczna My Heritage już w 2021 roku zaoferowała swoim użytkownikom technologię Deep Nostalgia. Pozwala ona na ożywienie zdjęć rodzinnych i nadanie postaciom mimiki. Dzięki temu możemy ponownie zobaczyć uśmiechy naszych bliskich. Warunkiem jest wgranie do programu fotografii, na których widoczna jest twarz.
Dream Machine
Niedawno firma Luma Labs zaprezentowała swoje nowe narzędzie Dream Machine. Ujęcia wygenerowane przez model trwają 5 sekund i mogą mieć nawet 120 klatek. Narzędzie potrafi generować realistyczne, pełne dramatyzmu sceny. Bierze pod uwagę nie tylko postacie, ale też otoczenie i napisy.
Hedra
To narzędzie pozwala sobie na zdecydowanie większą ingerencję w przeróbkę wgranych przez nas grafik. Hedra Charakter-1 potrafi nadać zdjęciom nie tylko realistyczny ruch, ale także dźwięk zsynchronizowany z ruchem warg. Poziom ekspresji wygenerowanych w ten sposób wideo jest zadziwiający!
Talking Photo
Talking Photo to narzędzie platformy Remaker AI, które umożliwia tworzenie mówiących zdjęć. Technologia przetwarza zarówno portrety, zdjęcia grupowe, jak i fotografie postaci w plenerze, zamieniając je w mówiące awatary. Wystarczy przesłać wybrane zdjęcie i wprowadzić tekst, a narzędzie dopasuje mimikę i ruch warg postaci. Dla lepszej personalizacji można ręcznie dobrać głos i język, w którym wypowiada się awatar.
Vidnoz
Platforma Vidnoz to jedno z przodujących narzędzi, wykorzystujących sztuczną inteligencję do tworzenia filmów dla biznesu. Biblioteka Vidnoz zawiera ponad 900 gotowych szablonów, ponad 800 dostępnych awatarów i blisko 500 głosów, które są w stanie mówić w 140 językach.
SadTalker AI
SadTalker przekształca statyczne portrety w klipy w formacie MP4. To proste narzędzie do tworzenia krótkich wiadomości głosowych, którymi można podzielić się ze znajomymi. Minusem narzędzia jest to, że nie generuje głosu – wgrany przez użytkownika plik audio zostaje zsynchronizowany ze zdjęciem, które dzięki animacji staje się mówiącym awatarem. Tak przygotowane filmy mogą być wykorzystywane także do celów komercyjnych.
Gemelo
To narzędzie rodem z dystopijnego świata science-fiction! Gemelo pozwala na stworzenie swojego bliźniaka w technologii AI. Jedyne co trzeba zrobić to nagrać dwuminowe nagranie swojej dowolnej wypowiedzi i wgrać do programu. Technologia AI uczy się twarzy, mimiki i sposobu wypowiedzi, dzięki czemu w przyszłości pozwala na tworzenie personalizowanych nagrań, które można wykorzystać w komunikacji biznesowej.
D-iD
Platforma D-iD wykorzystuje AI do tworzenia cyfrowych postaci. Pozwala to na stworzenie spersonalizowanych interfejsów użytkownika, dzięki którym możemy łatwiej nawiązywać interakcję z cyfrowym światem. Wygenerowany awatar prowadzi rozmowę z użytkownikiem i nie potrzebuje do tego poleceń tekstowych. Daje to namiastkę współpracy z prawdziwą osobą – dostępną przez cały czas.
HeyGen
Założeniem HeyGen jest ułatwienie tworzenia wideo i promowanie wizualnego storytellingu. Narzędzie zamienia wprowadzony tekst w wypowiedź animowanego awatara. Do dyspozycji użytkownika jest duża baza postaci do wyboru i wiele języków, w tym polski.
Pika
Ten program został stworzony przez dwóch studentów Uniwersytetu Stanforda, według których tworzenie wideo zajmuje zbyt wiele czasu. Pierwszym miejscem dystrybucji stał się Discord. Narzędzie pozwala na ożywienie sytuacji przedstawionych na zdjęciach, a także podłożenie własnego nagrania audio.
Każde z wymienionych narzędzi daje możliwość darmowego przetestowania, co może znacznie ułatwić wybór odpowiedniego pakietu. Wirtualne awatary są w stanie coraz bardziej ułatwić pracę w takich obszarach jak np. obsługa klienta. Mają też potencjał do stania się spersonifikowanym brand hero, który swoimi wypowiedziami wspiera wartości reprezentowanej marki.