Dysk Google zyskał AI. Twoje paragony nigdy nie wyglądały lepiej

Jeżeli nie upychacie po kieszeniach paragonów i robicie im zdjęcia, to zapewne nie wszystkie z nich są idealnie czytelne. Część przysłoniliście własnym cieniem, innym razem za szybko poruszyliście ręką. Ta sytuacja może zresztą dotyczyć innych dokumentów. Dla zabieganych i nie tylko, Dysk Google już niedługo dostanie nie lada rozwiązanie.
Dysk Google zyskał AI. Twoje paragony nigdy nie wyglądały lepiej

Jeszcze w 2020 roku Google ogłosił, że na platformie Google Photos znajdują się ponad 4 biliony zdjęć, a każdego tygodnia przybywało wtedy 28 miliardów nowych zdjęć i filmów. Te liczby obecnie z pewnością są jeszcze wyższe, w końcu Google namawia do robienia kopii zapasowych naszych galerii już nie tylko za pośrednictwem usługi Zdjęcia Google, ale także w aplikacjach do zdjęć u kilku producentów smartfonów z Androidem. Z pewnością nie brakuje tam dokumentów, paragonów i rzeczy wrażliwych, których wycieku wolelibyśmy uniknąć.

Dziś jednak nie o prywatności w sieci, a o rozwiązaniu, które jest tak proste, że aż zaskakuje, jak długo przyszło na nie czekać. Najwyraźniej było do tego potrzeba całej rewolucji związanej z wdrażaniem konsumenckiego AI. To właśnie dzięki sztucznej inteligencji będzie wam łatwiej odczytać treść waszych dokumentów – przynajmniej w teorii.

Mała-wielka zmiana czeka Dysk Google. Automatyczne ulepszanie dokumentów tuż-tuż

Wiedzieliście, że aplikacja Dysk Google na Androidzie pozwala na skanowanie dokumentów? Mojej uwadze to umknęło, głównie z powodu wierności wobec Microsoft Lens. Tak czy inaczej, nie musicie korzystać z funkcji skanu dokumentu w aplikacji aparatu, a następnie wpuszczania takich zdjęć do dysku. Zamiast tego wystarczy włączyć aplikację i kliknąć ikonę aparatu znajdującą się nad plusem. Reszta prezentuje się już dosyć typowo – robimy zdjęcie, a oprogramowanie automatycznie kadruje i pozwala nam na nałożenie filtra lub przycięcie zdjęcia oraz zapisanie go jako plik JPEG lub PDF.

Nowa funkcja na dysku Google sama poprawi czytelność dokumentów

Czytaj też: Google ogłasza garść nowych funkcji dla Androida

Całkiem przydatna rzecz, a od 6 stycznia rozwiązanie to stanie się jeszcze lepsze. Firma poinformowała o nowej funkcjonalności Dysku Google za pośrednictwem Google Workspace Updates. Jak widać na obrazku powyżej, rozwiązanie nie tylko zwiększa ostrość tekstu i podbija kontrast, ale jest w stanie usuwać cień, który zmniejsza czytelność. Poprawia przy tym doświetlenie oraz balans bieli. Użytkownik nie musi w ten proces ingerować. To kolejny krok po dodaniu biało-czarnego filtra do edycji zdjęć. Nietrudno domyślić się, że zyskamy na tym nie tylko my, ale także i samo Google.

Z jednej strony wygoda, a z drugiej gigantyczne pole do treningów

Wiecie, że celem Captchy, oprócz zabezpieczania internetu przed “robotami”, jest ćwiczenie modeli rozpoznających obiekty? Później wiedza, którą z naszych zgadywanek czerpie Google, a nawet całe konsorcjum Alphabet, przydaje mu się chociażby do tworzenia algorytmów, z których korzystają pojazdy autonomiczne Waymo. Być może dlatego fragmenty zdjęć przedstawiają miejsca w Stanach Zjednoczonych, a nie tak często w Polsce, choć tu już snuję własną teorię.

@kanalwtf Po co się trudzić, skoro Deep Research zrobi badania za ciebie? #gemini #ai #deepresearch #nauka #edukacja #sztucznainteligencja #ciekawostka #przydatne ♬ dźwięk oryginalny – Kanał WTF!

Dlaczego jednak ją snuję? Google, jak zresztą każdy szanujący się gracz na rynku agentów sztucznej inteligencji, potrzebuje danych oraz przestrzeni do treningu dla modeli. Każdy fragment wiedzy się przyda, a treści naszych dokumentów stanowią idealne pole do zrozumienia zarówno naszych nawyków zakupowych w przypadku paragonów czy faktur, jak i naszych kolei życia, w oparciu o inne dokumenty. Google cały czas rozwija wirtualnego asystenta (Project Astra), który widzi i rozumie nasz świat. Astra dociera do coraz szerszej bazy użytkowników, ale po co płacić za testowanie, skoro można zrobić to z użytkownikami za darmo?

Czytaj też: Sayonara, Google – hej Gemini!

Zapotrzebowanie big techu na to, by maszyny widziały i rozumiały świat niczym ludzki mózg, wydaje się ogromne. Nie dziwi zatem, że sztuczna inteligencja w postaci narzędzi jak ChatGPT czy Gemini 2.0 staje się wielomodułowa. Z pozoru takie niewielkie funkcje jak skanowanie dokumentów, mogą dać ogromne pole do popisu modelom uczącym się kontekstu czy po prostu rozumiejącym ludzki świat. Użytkownicy Androida mogą więc, świadomie lub nie, zostać królikami doświadczalnymi. Na razie z funkcji nie znajdziemy w aplikacji Dysku Google na iOS.