Informacje cyfrowe generują wszyscy: użytkownicy prywatni, firmy i instytucje. Do powiększenia ogólnoświatowego zbioru danych przyczyniają się nowoczesne urządzenia mobilne, które jeszcze kilka lat temu były rzadkością, a które teraz są w zasięgu możliwości większości społeczeństwa: laptopy, smartfony, aparaty cyfrowe.
Ciekawostką może być to, że jedynie połowa zapisywanych informacji jest efektem świadomych działań użytkowników, takich jak wysyłanie maili czy łączenie się poprzez komunikatory VoIP. Resztę stanowi tzw. “cyfrowy cień”, który jest jedynie śladem aktywności. Składa się na niego między innymi historia przeglądanych stron internetowych, wykonywanych połączeń czy też nagrań kamer monitoringu.
Kolejnym problemem, którego istnienia nie są zwykle świadomi przeciętni użytkownicy komputerów, jest nieuzasadniona duplikacja, a nawet multiplikacja danych. Te same dane, w wyniku braku racjonalnej polityki magazynowania informacji, przechowywane są na kilku nośnikach, a nierzadko także na jednym nośniku w kilku miejscach. Takie postępowanie nie wynika z chęci tworzenia kopii zapasowych plików, będąc raczej skutkiem prowadzenia nieracjonalnej polityki magazynowania informacji.
Jaki jest najlepszy sposób przechowywania cyfrowych danych? Co zrobić, żeby wielkość cyfrowego wszechświata nie przekroczyła możliwości, jakie dają współczesne rozwiązania? Z pomocą przychodzą tu technologie deduplikacji danych. Deduplikacja to proces polegający na eliminowania duplikatów danych poprzez umieszczanie w ich miejsce odnośników do jednego źródła. W ten sposób wiele osób może mieć dostęp do tej samej porcji danych bez konieczności ich powielania.