W centrum zainteresowania badaczy znalazły się dane dotyczące właściwości widmowych światła widzialnego w ultrafiolecie związane z ponad 10 mln cząsteczek organicznych. Otwiera to drogę do lepszego zrozumienia interakcji na linii cząsteczka-światło, co z kolei będzie kluczem do opisania właściwości elektronicznych i optycznych. Na tej podstawie możemy spodziewać się licznych zastosowań, które przydadzą nam się w codziennym życiu. W grę wchodzi na przykład implementacja układów fotoaktywnych w ogniwach słonecznych bądź narzędziach wykorzystywanych na potrzeby obrazowania medycznego.
Czytaj też: Splątanie kwantowe ma niespodziewaną cechę. Zaskakujący związek potwierdziły ostatnie eksperymenty
Każda z cząsteczek organicznych objętych analizami została poddana modelowaniu, którego celem było określenie właściwości stanu wzbudzonego. Wyniki tych ekspertyz oraz potencjalne korzyści z nich płynące zostały opisane w Nature Scientific Data. Najważniejszym aspektem wydaje się wytrenowanie modelu głębokiego uczenia się, który można teraz wykorzystać w celu identyfikacji cząsteczek o dostosowanych właściwościach optoelektronicznych i fotoreaktywnych.
Do tej pory realizacja takich zadań była oczywiście możliwa, ale wymagała znacznie więcej czasu. Pokazuje to, jak ogromny potencjał drzemie w modelach głębokiego uczenia się. Do ich sprawnego działania potrzeba ogromnych ilości danych, na podstawie których taki model staje się coraz lepszy w realizacji zlecanych mu zadań. Z drugiej strony, tworzenie tak rozległych zbiorów może prowadzić do problemów z przepływem danych.
Model głębokiego uczenia się jest w stanie wykonywać obliczenia na wielką skalę, obejmujące ponad 10 milionów cząsteczek
Aby uniknąć takich komplikacji, inżynierowie zaangażowani w badania skupili się na opracowaniu skalowalnego oprogramowania do przepływu informacji, dzięki któremu pojawia się pewność, iż pliki generowane przez kod mechaniki kwantowej są obsługiwane bez obciążania współdzielonego systemu plików. Takowy odpowiada nie tylko za wprowadzanie, ale również wysyłanie i przechowywanie danych.
Chcąc przetestować możliwości nowego narzędzia, autorzy publikacji stworzyli zbiór danych GDB-9-Ex, w którym znalazło się 96 766 cząsteczek złożonych z węgla, azotu, tlenu i fluoru. Co istotne, zawierały on maksymalnie dziewięć atomów innych niż wodór. Przepływ informacji okazał się skuteczny, natomiast przeszkolony model głębokiego uczenia się był w stanie przewidywać położenie i intensywność najważniejszych pików widma ultrafioletowego oraz widzialnego.
Czytaj też: Bezbłędne obliczenia kwantowe są jednak możliwe. Kubity Rydberga mogą stanowić prawdziwy przełom
Później przyszła pora na wyzwanie z prawdziwego zdarzenia. Do akcji wkroczył zbiór danych ORNL_AISD-Ex zawierający 10 502 917 cząsteczek składających się z węgla, azotu, tlenu, fluoru i siarki, przy czym zawierały one co najwyżej 71 atomów innych niż wodór. Pomimo obecności ponad 10 milionów cząsteczek model był w stanie określić widmo. Dostarczyło to informacji na temat tego, jaka częstotliwość światła jest konieczna do odnalezienia cząsteczki i rozerwania wybranych wiązań chemicznych.