DeepMind od Google opracowała niedawno nową metodę szkoleniową dla sztucznej inteligencji, która ma nauczyć sztuczną inteligencję grać gry komputerowe. Eksperyment ten ma jednak pozwolić na rozwiązanie o wiele trudniejszego zadania, niż przejście kolejnych poziomów w grach komputerowych.
Sztuczna inteligencja ma problemy z podejmowaniem decyzji
Naukowcy z DeepMind napotkali na następujący problem: sztuczna inteligencja, podczas eksploracji wirtualnego świata, ma spory problem z podejmowaniem sekwencyjnych decyzji, które mają prowadzić do określonego celu (nagrody). O ile zaprogramowanie AI do wygrywania w grę GO (AlphaGo Deep Mind) nie stanowiło większego problemu, o tyle „wprowadzenie” sztucznej inteligencji do świata gier stosunkowo prostych platformówek, gdzie niezbędne jest zaawansowane eksplorowanie przestrzeni („Zemsta Montezumy”), stanowiło już dla AI nie lada problem.
Człowiek, grając w grę komputerową (czy idąc do sklepu / wykonując inne, stosunkowo proste czynności), raczej niezbyt długo zastanawia się dokąd pójść czy jaką kolejną decyzję podjąć. Nawet jeśli błądzi, dość szybko odnajduje ścieżkę powrotną, łączy fakty i próbuje nowych rozwiązań. W przypadku sztucznej inteligencji, każdy kolejny krok potęguję dezorientacje i mnogość kolejnych alternatyw. Przykładowo, zdobycie pierwszej nagrody w Montezuma Revenge zajmuje sztucznej inteligencji 100 kroków środowiskowych, co odpowiada kolejno aż dziesięciu krokom… do potęgi osiemnastej (1018). Programiści rozwiązują ten problem przekazując Ai ogromne zestawy specjalnie przygotowanych danych, które są tworzone w oparciu o analizę danego środowiska.
Nowa metoda i nowe możliwości
Dzięki nowej metodzie opracowanej przez DeepMind, sztuczna inteligencja „wyobraża sobie” możliwe zestawy danych w oparciu o analizę ludzkich zachowań. Dlatego właśnie sztuczna inteligencja spędza bite godziny oglądając YouTube’a, gdzie analizuje, w jaki sposób ludzie grają w daną grę, co z kolei stanowi dla niej materiał wyjściowo-porównawczy do imitowania ludzkich zachowań w danym środowisku.
Czego możemy spodziewać się po tej technologii? Jeśli uda się prawidłowo wytrenować za pomocą tej metody funkcjonale zestawy danych środowiskowych, to technologia ta może ułatwić produkcję robotów i np. eksplorowanie kosmosu ( powierzchnia Marsa) tylko w oparciu o analizę materiałów wideo i ustalonych punktów odniesienia. To samo tyczy się innych rozwiązań z pogranicza robotyki i sztucznej inteligencji. Jeśli tego typu technologię uda się skomercjalizować, to – w dużym, uproszczeniu, sztuczna inteligencja będzie się w stanie praktycznie wszystkiego nauczyć na podstawie materiału video, co znacznie uprości i umasowi proces produkcji zaawansowanej i spersonalizowanej zadaniowo technologii.