Sztuczna inteligencja potrafi przewidzieć już wiele rzeczy. Nie ukryje się przed nią także to, dokąd pójdziemy oraz co w dalszej kolejności zrobimy.
Jak możemy dowiedzieć się z opublikowanej 31 maja pracy naukowej, badawcze z Carnegie Mellon University, Google AI oraz Stanford University sprawdzili, że systemy głębokiego uczenia są w stanie przewidzieć nasze działania. W jaki sposób jest to możliwe?
Przewidywanie ścieżki ruchu i zachowań
Wraz z rozwojem algorytmów i technologii, systemy są w stanie analizować coraz większą liczbę informacji, także z materiałów wideo. Może być to pomocne na przykład w aplikacjach, które pomogą przewidzieć zachowanie pieszych i uniknąć wypadku. Z tej perspektywy niezwykle ważne jest więc prognozowanie przyszłej ścieżki pieszych, zwanej prognozą przyszłej ścieżki osoby/trajektorią.
Jak dowiadujemy się z pracy naukowej, najpierw osoba w materiale wideo jest kodowana za pomocą bogatych funkcji wizualnych, które pozwalają uchwycić ludzkie zachowania i interakcje z ich otoczeniem.
Następnie dodawane są zadania pomocnicze przewidywania lokalizacji działań w celu ułatwienia procesu wspólnego szkolenia.
Wynikowy model naukowców pokazał skuteczność owego rozwiązania zarówno na popularnym, jak i niedawnym teście porównawczym wideo na dużą skalę. Ponadto, wykazano ilościowo i jakościowo, że następny model z powodzeniem przewiduje znaczące przyszłe działania.
Analiza działań pieszego i wykorzystanie bogatych funkcji informacji umożliwiają więc uczenie systemów przewidywania przyszłych działań oraz ich lokalizacji.
Modelowanie ścieżek zachowań i działań
Przeprowadzone przez naukowców testy dowodzą, że metoda ta jest w stanie nie tylko odgadnąć przyszłą ścieżkę poruszania się, ale i wytworzyć znaczącą prognozę przyszłej aktywności. Wynik stanowi pierwszy dowód empiryczny na to, że wspólne modelowanie ścieżek i działań przynosi korzyści przyszłym przewidywaniom ścieżki.
Wykorzystanie technologii
Już teraz uważa się, że jest to kluczowy element w zrozumieniu materiałów wideo. Takie spojrzenie na informacje wizualne z przeszłości, jak deklarują naukowcy, może pomóc w przewidzeniu kolejnych działań w wielu aplikacjach wykorzystywanych np. w autonomicznych samochodach czy robotyce.
Co więcej, może wspierać bezpieczeństwo publiczne, monitorowanie ruchu i zarządzanie nim poprzez automatyczne wykrywanie aktywności w strumieniowym wideo.
Etyczne aspekty tego rozwiązania
Perspektywa zwiększenia bezpieczeństwa na drogach i rozwiązania w pewnym stopniu problemu autonomicznych samochodów brzmi niezwykle optymistycznie. Niestety rozwiązanie ma także swoje ciemne strony.
Przyszłe tego typu badania nad przewidywaniem ścieżek i aktywności mogą wiązać się z kwestiami etycznymi dotyczącymi prywatności i bezpieczeństwa. Metoda ta nie została również dotąd przetestowana dla rożnych populacji, a jak wiemy, ludzie mogą różnie zachowywać się różnie w różnych sytuacjach, a więc przewidywanie ich aktywności powinno być dostosowane także do poszczególnych populacji i ich specyfiki.