Uczenie maszynowe jest jednym z podstawowych narzędzi używanych do analizowania ogromnych ilości danych. Poza opracowywaniem technik umożliwiających poprawę funkcjonowania tego procesu, naukowcy zajmują się również zupełnie odwrotną dziedziną – zapominaniem. Okazuje się, iż jest to zaskakująco przydatna umiejętność, umożliwiająca na przykład całkowite usunięcie “wspomnień” nt. danej osoby czy obiektu – i to bez wpływu na funkcjonowanie samego urządzenia.
Czytaj też: Dwunożny robot i uczenie maszynowe, czyli jak Cassie przebiegł rekordowe 5 km
Oczywiście projektowanie systemów uczenia maszynowego od nowa byłoby wymagającym i kosztownym przedsięwzięciem. W związku z tym naukowcy musieli znaleźć złoty środek: rozwiązanie zapewniające zadowalające efekty, które nie będzie wiązało się z nadmiernymi zmianami. Jednym z ekspertów zaangażowanych w „oduczanie maszynowe” jest Aaron Roth z Uniwersytetu w Pensylwanii.
Oduczanie maszynowe zajmuje się celowym zapominaniem informacji przez algorytmy
Po co ten cały wysiłek? Jako mieszkańcy Unii Europejskiej powinniśmy to wiedzieć najlepiej. Wprowadzane przez władze wspólnoty przepisy, regulujące między innymi dysponowanie prywatnymi informacjami, wywołują wiele problemów – szczególnie w przypadku firm i placówek dysponujących „wrażliwymi” danymi. Jako że mamy prawo do żądania usunięcia dotyczących nas informacji z niektórych baz danych, to firmy, które je przechowują powinny mieć możliwość bezproblemowego spełnienia naszych próśb. Nie jest to jednak tak łatwe, jak mogłoby się wydawać.
Podobne wydarzenia mają miejsce także w Stanach Zjednoczonych i Wielkiej Brytanii, dlatego można stwierdzić, iż problem ma coraz bardziej międzynarodowy charakter. Z pewnością możemy mówić o postępach w tej dziedzinie. Naukowcy przyznają, że udało im się – w określonych okolicznościach – zmusić algorytmy do usunięcia wybranych danych, bez szkody dla całego systemu. Jednym z bardziej obiecujących projektów okazał się ten, który wyszedł spod rąk naukowców z uniwersytetów w Toronto i Wisconsin-Madison.
Czytaj też: Sztuczna inteligencja będzie w stanie wyobrazić sobie rzeczy, których nigdy nie widziała
Postanowili oni spowodować, by algorytmy uczenia maszynowego dzieliły prywatne informacje na mniejsze grupy. Każda z nich była następnie przetwarzana z osobna, a uzyskane w ten sposób rezultaty dopiero na koniec były łączone w jedną całość, czyli model uczenia maszynowego. Kiedy pojawiła się konieczność usunięcia wybranego fragmentu danych, przebiegało to sprawnie, ponieważ reszta nie musiała być przetwarzana ponownie. Takie rozwiązanie okazało się skuteczne nawet w przypadku zbiorów danych liczących ponad milion fotografii. Problem w tym, że Roth i jego współpracownicy wykazali niedawno, że przy odrobinie pecha (bądź celowym działaniu) cała sekwencja mogłaby się „wysypać”. Innymi słowy, oduczanie maszynowe nadal jest dalekie od ideału.