Big Data – gestern und heute:

In diesem Jahr stand unter dem Motto Datability, der verantwortungsvolle Umgang mit großen Datenmengen im Fokus der CeBIT. Doch lange bevor Modeworte wie Big Data aufkamen, machte man sich Gedanken über die wachsende Informationsflut

  • 10 years ago Posted in

1941, als die Erfindung des Computers noch in den Kinderschuhen steckte, führte das Oxford English Dictionary zum ersten Mal das Wort „information explosion“ auf [1]. Ein paar Jahre später beschrieb Fremont Rider in „The Scholar and the Future of the Research“, dass die Bibliotheken US-amerikanischer Universitäten sich alle sechzehn Jahre in ihrer Größe verdoppeln würden [1]. 1963 erschien in den USA „Science since Babylon“ von Derek de Solla Price. Laut seinen Berechnungen, die auf der Zunahme der Anzahl von wissenschaftlichen Fachartikeln beruhen, wächst die Zahl der Publikationen seit Mitte des 17. Jahrhunderts exponentiell an, so dass es sich alle fünfzehn Jahre verdoppelt und alle fünfzig Jahre um den Faktor zehn ansteigt [2].

Berühmte Bibliotheken

Wenn es um Wissen auf Papier geht, denkt man natürlich zuerst an Bibliotheken. Antikes Vorbild ist die legendäre Bibliothek von Alexandria, deren Bestand man zur Zeit von Ptolemaios (284-222 v. Chr.) auf 400.000 bis 700.000 Werke schätzt [3]. Die wohl berühmteste Bibliothek heutzutage ist die Russische Staatsbibliothek in Moskau mit über 43 Millionen Publikationen [4]. Ihre Dokumente gehören zur UNESCO-Liste des Weltdokumentenerbes „Memory of the World“ [5]. Die meisten Bücher lagern hingegen in der Library of Congress in Washington D.C.: Mehr als zehn Millionen gebundene Werke verteilen sich auf über 925 Regalkilometer [6].Wenn man davon ausgeht, dass bedrucktes Papier je nach Schriftgröße maximal 25 Megabyte pro dicht gefülltem Regalmeter enthält [7], dann würden in der Library of Congress 23.125.000 Megabyte (22 Terrabyte) an Daten lagern.

Digitale Wendepunkt schon 2002 – Tendenz steigend

Derzeit schreitet die Digitalisierung der weltweiten Informationen unaufhörlich voran. 1993 lagen lediglich 3 Prozent der globalen Informationskapazität in digitaler Form vor. Im Jahr 2007 waren es bereits 84 Prozent [8]. Ferner geht die Wissenschaft davon aus, dass der „digitale Wendepunkt“ schon im Jahr 2002 erreicht wurde, als erstmals mehr digitale als analoge Informationen gespeichert wurden. Und die Big Data-Menge wächst exponentiell weiter: Laut IBM werden im Jahr 2020 weltweit 40 Zettabyte- eine Zahl mit 21 Nullen - an Daten vorliegen, was dann der 300-fachen Datenmenge von 2005 entspricht [9].

Sammeln, speichern und vergessen?

Ein Problem, dass sich auf Grund des rasanten Informationswachstums ergibt, wird oft übersehen: Der Mensch kann diese ungeheuren Datenmengen nicht mehr durch eigene Denkleistung verarbeiten. Anders als bei den von Menschenhand geschriebenen Büchern, beinhalten gesammelte Daten – so wie auch jene Daten der NSA – meist Meta-Informationen, die ein Mensch niemals zu Gesicht bekommt. Laut einer IDC-Studie wurden bisher übrigens erst weniger als 1 Prozent der weltweiten Daten analysiert [10].

Angesichts dieser „Informationsexplosion“ benötigt es viel Expertise, um sowohl digitale Daten als auch Papier richtig zu verwalten und diese in einem ganzheitlichen Konzept zusammen zu fassen. Hierfür sind Datenprofis wie zum Beispiel das US-Unternehmen Iron Mountain zuständig. Der Dienstleister für Informationsmanagement schützt und verwaltet in seinen weltweit über tausend Archiven auf einer Fläche von 850 Fußballfeldern 12 Millionen Kubikmeter Papierdokumente, was dem fünffachen Volumen der Cheops-Pyramide entspricht. Zusätzlich verwaltet Iron Mountain 65 Millionen Datenträger, zwanzigtausend Server und 10 Milliarden E-Mails. Zu den berühmtesten Dokumenten, um die sich Iron Mountain kümmert, zählen zum Beispiel die private Fotosammlung von Bill Gates, das Testament von John Lennon oder Originaltonaufnahmen von Elvis Presley.

 

 [1] http://www.forbes.com/sites/gilpress/2013/05/09/a-very-short-history-of-big-data/

[2] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC227421/?page=1

[3] http://www.pm-magazin.de/a/das-verlorene-paradies-der-b%C3%BCcher

[4] http://rsl.ru/en

[5] http://www.unesco.de/mow.html

[6] http://www.pm-magazin.de/a/wo-gibt-es-die-gr%C3%B6%C3%9Fte-bibliothek

[7] http://www.sueddeutsche.de/digital/2.220/datenwachstum-der-digitalisierten-welt-explosion-des-cyberspace-1.1058394

[8] http://www.sciencemag.org/content/332/6025/60

[9] http://stephenslighthouse.com/2011/02/18/the-digital-analog-tipping-point-was-2002/

[10] http://www.theguardian.com/news/datablog/2012/dec/19/big-data-study-digital-universe-global-volume