AI w systemach antyplagiatowych: Niezwykle łatwy dostęp do źródeł wiedzy i niezliczonych publikacji sprawia, że przypadki naruszania praw autorskich i kopiowania cudzych treści stają się nagminne. Z pomocą przychodzą systemy antyplagiatowe, które pozwalają skutecznie wykryć nieetyczne praktyki. Szczególnie dobrze sprawdzają się te programy, które bazują na rozwiązaniach z zakresu sztucznej inteligencji.
Standardowy mechanizm działania systemów antyplagiatowych
Proste systemy antyplagiatowe korzystają ze standardowych algorytmów pozwalających na znajdowanie najdłuższych wspólnych podciągów znakowych. Są to znaki występujące w tej samej kolejności w dwóch porównywalnych łańcuchach. Metoda ta identyfikuje znaki, nawet jeśli nie leżą obok siebie. Oznacza to, że zastosowane algorytmy zidentyfikują plagiat, nawet jeśli treści zostały nieznacznie zmodyfikowane. Nie jest to jednak rozwiązanie doskonałe, gdyż takie systemy antyplagiatowe wyłapują podobieństwa między dokumentami w krótkich, najczęściej kilkuwyrazowych i jednocześnie równoważnych leksykalnie tekstach. O krok dalej idą systemy antyplagiatowe korzystające z potencjału sztucznej inteligencji.
Zaawansowane metody analizy języka naturalnego
Zaawansowane systemy, takie jak Jednolity System Antyplagiatowy oferowany przez Ministerstwo Nauki i Szkolnictwa Wyższego czy też Otwarty System Antyplagiatowy przygotowany przez Międzyuniwersyteckie Centrum Informatyzacji, zamiast ze standardowych algorytmów, korzystają z połączenia wielu metod analizy języka naturalnego. Przetwarzanie języka naturalnego opiera się na hybrydowym połączeniu językoznawstwa i sztucznej inteligencji. Pozwala to na automatyzację analizy tekstów, ale też na rozumienie i tłumaczenie, a nawet generowanie języka naturalnego przez komputer!
W efekcie system antyplagiatowy potrafi efektywnie zidentyfikować podobieństwa pomiędzy badanymi tekstami, nawet jeśli zostały zastosowane różnorodne sposoby kamuflażu i manipulacji. Tym samym systemu, takiego jak OSA czy JSA, nie oszuka przestawianie szyku wyrazów, zmiana kolejności zdań, stosowanie synonimów, usunięcie części słów, dodanie nowych zdań czy też tworzenie pracy w oparciu o treści pochodzące z kilku różnych źródeł, a nawet zmiana stylu wypowiedzi. Co ważne, zastosowane algorytmy radzą sobie doskonale z analizą tekstu bez względu na to, w jakim języku został napisany. System antyplagiatowy korzystający z potencjału sztucznej inteligencji z powodzeniem rozpozna też cyfry arabskie i rzymskie, a nawet całe równania matematyczne.
System antyplagiatowy po analizie materiału generuje raport podobieństwa, który wykazuje fragmenty zidentyfikowane jako zapożyczenia, wraz z oznaczeniem źródła pierwotnego. Program określa też tzw. współczynnik podobieństwa, czyli stosunek zapożyczonych fragmentów do objętości całego tekstu. Naturalnie część zapożyczeń jest całkowicie uzasadniona, między innymi ze względu na prawo do cytowania. Zatem trzeba podkreślić, że program antyplagiatowy nie ocenia samoistnie czy tekst został przygotowany samodzielnie. On jedynie dostarcza dane pozwalające kompetentnej osobie na przeprowadzenie wnikliwej i kompleksowej analizy.
AI w systemach antyplagiatowych — bazy referencyjne
Nowoczesne systemy antyplagiatowe oparte o rozwiązania z zakresu sztucznej inteligencji doskonale poradzą sobie z identyfikacją skopiowanego tekstu. Nawet jeśli nieuczciwy autor przerobi go po swojemu. Tym samym jedynym wyzwaniem dla twórców programów antyplagiatowych jest powiększanie baz referencyjnych. Systemy antyplagiatowe takie jak OSA czy JSA opierają się na Ogólnopolskim Repozytorium Pisemnych Prac Dyplomowych i uczelnianych repozytoriach prac zaliczeniowych, a także na milionach dokumentów zebranych przez wyszukiwarkę NEKST, zwanej często korpusem polskiego internetu. Oczywiście bazy te to stosunkowo niewielki wycinek materiałów dostępnych w internecie. To dlatego międzynarodowe systemy antyplagiatowe, takie jak największy na świecie program antyplagiatowy TurnItIN, są jeszcze bardziej skuteczne. Korzystają one bowiem z pomocy wyszukiwarek internetowych takich jak Google, Baidu czy też Bing. Otwierają one dostęp do niemal wszystkich zasobów globalnej sieci.
Czytaj więcej: Czy antyplagiat wykrywa AI? Rozwiewamy wątpliwości
Wymóg weryfikacji oryginalności prac
AI w systemach antyplagiatowych — ośrodki naukowe walczą z plagiatami
Szkoły wyższe już w 2014 roku zostały zobowiązane do sprawdzania pisemnych prac dyplomowych przed egzaminem dyplomowym z wykorzystaniem programów antyplagiatowych, współpracujących z ogólnopolskim repozytorium pisemnych prac dyplomowych. Jednak Ministerstwo Edukacji i Nauki pracuje nad rozwiązaniami, które mają zobowiązywać ośrodki naukowe do weryfikacji oryginalności nie tylko prac dyplomowych, ale też wszelkich prac zaliczeniowych pisanych w trakcie studiów i publikacji naukowych. Dlatego też instytucje takie jak Ośrodek Przetwarzania Informacji Państwowego Instytutu Badawczego pracują nad modernizacją i rozbudową systemów antyplagiatowych. Celem jest dostosowanie ich do aktualnych potrzeb szkół wyższych. Dostępu do skutecznych systemów antyplagiatowych domagają się też redaktorzy wydawnictw naukowych. Wszystko wskazuje więc na to, że znacznie wzrośnie skuteczność identyfikacji nieuczciwych studentów i naukowców.
Czytaj więcej: Parlament Europejski przyjął nowe przepisy regulujące sztuczną inteligencję