– Jako pierwsi wprowadziliśmy rozwiązanie w postaci generatora statystyk, który umożliwia tworzenie raportów tematycznych na podstawie oficjalnych danych kancelarii Sejmu. Dzięki temu możemy się dowiedzieć np. kto jest najaktywniejszym parlamentarzystą, kto najczęściej bywa w Sejmie, czy komu najczęściej przerywano wypowiedzi itd. – mówi Agata Majchrzak, rzecznik prasowy serwisu Pracujadlaciebie.pl. – Nasze narzędzie ułatwia kontrolę pracy posłów nie tylko osobom zainteresowanym polityką, ale także przeciętnym obywatelom. Jest to szczególnie ważne w czasach, w których wizerunek medialny polityka często odbiega od jego rzeczywistych dokonań – dodaje.
Użytkownicy strony znajdą na www.pracujadlaciebie.pl również informacje dotyczące samych posłów w tym m.in. ich dane osobowe, oświadczenia majątkowe, adresy biur poselskich czy wypowiedzi. W poszczególnych zakładkach można dowiedzieć się w jakim klubie parlamentarnym jest poseł, ile głosów w wyborach otrzymał, jak głosował w Sejmie, ile razy się wypowiadał, ile razy w głosowaniach był za, przeciw czy się wstrzymał. Serwis umożliwia analizę danych z szóstej i siódmej kadencji.
Autorskie rozwiązania
Pracujadlaciebie.pl stworzono w oparciu o framework django i co za tym idzie język programowania python. Część webowa serwisu korzysta z klasycznej relacyjnej bazy danych oraz mechanizmów wyszukiwania opartych o solr. Całość serwuje serwer Nginx.
Właśnie z tego powodu, przy tworzeniu modułu statystycznego skorzystano z ORM SQLAlchemy. Generator statystyk kryje w sobie więcej zagadek technologicznych tj. np. bibliotekę matplotlib, którą obudowano tak aby umożliwiała łatwe generowanie bardzo różnego typu danych. Kolejnym ciekawym elementem systemu statystyk jest mechanizm kolejkowania zapytań RabbitMQ oraz dokumentowy nierelacyjny silnik baz danych CouchDB, w którym przechowywane są wszystkie wygenerowane informacje.
Wśród rozwiązań stworzonych przez autorów serwisu wyróżnić można mechanizm zapobiegający duplikacji statystyk w bazie danych oraz pseudo język kwerend do baz danych. Sprawność działania serwisu zapewnia stosunkowo wydajny system automatycznego pobierania danych, który skrupulatnie analizuje informacje pochodzące ze stron Sejmu RP, a następnie zapisuje je do bazy. Ta część w dużej mierze oparta jest o autorskie rozwiązania pozwalające na efektywne
analizowanie długich dokumentów oraz tworzenie na ich podstawie spójnej bazy
danych.