W Internecie zyskuje obecnie na popularności trend udostępniania danych w formie otwartej (Linked Open Data – LOD). W tym trendzie chodzi o to, aby publikować dane zgodnie z pewnym prostym modelem, który może być łatwo wykorzystany przez każdego zainteresowanego. Rolę takiego modelu przyjął RDF – Resource Description Framework – opracowany pierwotnie jako infrastruktura dla składowania, wymiany i ponownego wykorzystania metadanych.
RDF pozwala na przekazywanie informacji skojarzeniowej. Formalnie jest to model reprezentacji informacji w postaci trójek: podmiot, orzeczenie, dopełnienie. Każdy obiekt (podmiot) można opisać za pomocą par atrybut-wartość (orzeczenie-dopełnienie). Na przykład zdanie “Fryderyk Chopin urodził się w Żelazowej Woli” można by zapisać jako [Fryderyk Chopin] – [miejsce urodzenia]: [Żelazowa Wola]. Każdy element trójki ma swój unikatowy (w skali Internetu) identyfikator umożliwiający jego wielokrotne wykorzystanie. Dzięki temu informacje o miejscowości można dalej rozwinąć jako [Żelazowa Wola] – [województwo]: [mazowieckie]. W ten sposób można łączyć ze sobą różne zbiory danych, tworząc tzw. skojarzone dane (linked data) i wykorzystywać je w nowy sposób. Łączenie jest dodatkowo ułatwiane przez to, że w RDF umieszczane są nie tylko dane, ale również ich semantyczny opis.
Takich trójek dostępnych w Internecie może być bardzo dużo. Z pojedynczego artykułu w Wikipedii można ich wyciągnąć kilkadziesiąt. Lawinowy wzrost danych dostępnych w Internecie wskazuje, że technologie i usługi wspierające Linked Open Data stały się ostatnio nieodzowne. Naprzeciw tym oczekiwaniom wychodzi konsorcjum LOD2. LOD2 jest projektem współfinansowanym przez Komisję Europejską w ramach 7. Programu Ramowego – Technologie Informacyjne i Komunikacyjne (nr grantu 257943). Projekt, który rozpoczął się we wrześniu 2010 roku, skupia czołowych badaczy z obszaru Linked Open Data, firmy oraz dostawców usług (15 partnerów) z aż 11 krajów europejskich (w tym 1 podmiot stowarzyszony z Korei Pd.), a jest koordynowany przez grupę badawczą AKSW z Uniwersytetu w Lipsku.
Zestaw narzędzi LOD2 jest głównym rezultatem tego projektu już po pierwszym roku. Zestaw ten jest zintegrowaną dystrybucją dopasowanych narzędzi, które wspierają cykl życia skojarzonych danych od ekstrakcji, tworzenia, poprzez wzbogacanie, wiązanie i fuzję do wizualizacji. W jego skład wchodzą nowe i istotnie rozbudowane narzędzia zarówno członków LOD2, jak i zewnętrznych podmiotów.
Narzędzia LOD2 są niezbędne dla złagodzenia przesytu danymi i informacjami oraz dostarczają fundamentów dla przyszłego Internetu. W projekcie już teraz pracuje się na zbiorach danych, które zawierają dziesiątki miliardów trójek. Stały rozwój oprogramowania przez członków LOD2 od samego początku pojawienia się Linked Open Data jako paradygmatu integracji i udostępniania danych, skutkujący między innymi powstaniem zestawu LOD2, prowadzi do ułatwienia profesjonalistom z instytucji rządowych i komercyjnych udostępniania i pobierania danych w Internecie, a także zwiększa ich efektywność.
Jednym z celów LOD2 jest powiązanie skojarzonych danych z istniejącymi wielkoskalowymi aplikacjami. Wybrano trzy scenariusze, które mają zademonstrować oczekiwane korzyści w następujących obszarach:
- media i publikacje – tworzenie zbiorów publikacji dopasowanych do potrzeb odbiorców, komponowanie mediów na żądanie,
- dane korporacyjne w intranetach – uzupełnianie danych wewnętrznych przedsiębiorstw o dane pozyskane ze źródeł zewnętrznych,
- e-rząd – udostępnianie informacji obywatelom w sposób umożliwiający ich dalsze wykorzystanie, czy to do działalności badawczej, czy komercyjnej; również jest to krok w kierunku transparencji sprawowania władzy.
Wynikające z prac narzędzia, metody oraz zbiory danych mają szansę zmienić znany nam do tej pory Internet. Zgodnie ze słowami koordynatora projektu Dr. Sörena Auera “dzięki dostępności zestawu LOD2 bariery tworzenia i wykorzystania skojarzonych danych (linked data) zostały istotnie obniżone, a przez to pojawiły się udogodnienia dla wyszukiwania i wymiany informacji w Internecie poprzez uzupełnienie istniejących stron internetowych w bogato ustrukturyzowane dane”.