Was ist Big Data? Das musst Du dazu wissen

Big Data ist eins der beliebtesten Schlagworte in den Medien, aber was steckt eigentlich hinter diesem Begriff?
Big Data ist eins der beliebtesten Schlagworte in den Medien, aber was steckt eigentlich hinter diesem Begriff? (©Adobe Stock 2018)
Michael Brandt Freut sich über die Rückkehr der Metroidvania-Games.

Big Data ist ein Begriff, der in den Medien zunehmend häufiger verwendet wird. Aber was ist Big Data eigentlich? Die genaue Definition von Big Data kennen die wenigsten. In unserem Ratgeber versuchen wir, den Begriff etwas greifbarer zu machen.

Der Anglizismus "Big Data" bezeichnet grundsätzlich erst einmal eine sehr große Menge an Daten. Eine genaue Definition, wie groß diese Datenmenge sein muss, um als Big Data zu gelten, gibt es nicht. Es wird immer dann von Big Data gesprochen, wenn die Menge zu groß, zu komplex, zu schnelllebig oder zu schlecht strukturiert ist, um sie manuell und mit den herkömmlichen Methoden der Datenverarbeitung auszuwerten. Der Begriff wird in den Medien häufig als Buzzword verwendet und seine Bedeutung wandelt sich stetig.

Diese drei Vs machen "Data" zu "Big Data"

Laut der Definition von Gartner spielen drei Variablen im Bezug auf das Wort "Big" eine Rolle: Volume (Datenvolumen), Velocity (Geschwindigkeit, in der Daten generiert und übertragen werden) und Variety (Spektrum der Datentypen und -quellen). Andere Definitionen beziehen auch noch die Werte Value (unternehmerischer Mehrwert) und Validity (Aussagekraft der Daten) mit ein.

Wie entstand Big Data?

Der Begriff "Big Data" kam ungefähr in der Zeit auf, in der die umfassende Vernetzung von Geräten an Wichtigkeit gewann. Vorangetrieben wird das immer schnellere Datenwachstum durch die stetig zunehmende Erzeugung von Daten durch Maschinen. Wir hinterlassen täglich bewusst oder unbewusst eine große Menge an Daten. Sei es unser Surf-Verhalten im Internet, unser GPS-fähiges Smartphone, das ständig seine Position mitteilt, oder unsere Kommunikation in den sozialen Medien – das alles erzeugt Daten. Sensoren, Kameras und Mikrofone zeichnen täglich Unmengen an Daten auf, ohne dass wir dies überhaupt merken.

Huawei Band 2 Pro
Fitness-Tracker, Smartphones, PCs oder sogar der Netwerkdrucker im Büro erzeugen und sammeln tagtäglich Unmengen von Daten.

Einer Studie zum Datenwachstum aus dem Jahr 2011 zufolge wächst das Datenvolumen exponentiell und verdoppelt sich alle zwei Jahre. Im Jahr 2011 lag das erzeugte Datenvolumen bereits bei 1,8 Zettabyte – das sind umgerechnet 1,8 Billionen Gigabyte. Wie Forbes berichtet standen wir im Jahr 2017 schon bei 16,3 Zettabyte. Die Auswertung der Daten stellt jedoch ein viel größeres Problem als die Sammlung und Speicherung dar.

Warum ist die Auswertung von Daten so wichtig?

Das Sammeln und Auswerten von Daten ist für Menschen seit Jahrhunderten von Jahren enorm wichtig. Denn je mehr Daten eine Person über einen Sache oder Situation besitzt, desto besser kann sie die Sache bewerten oder die Situation einschätzen. Grundsätzlich gilt: Je mehr Daten zur Verfügung stehen, desto besser die Vorhersage.

CorSense App
Durch die Auswertung von Daten können Situationen besser eingeschätzt werden und Ereignisse vorausgesagt werden.

Hier kommen aber noch Filterung und Ordnung ins Spiel. Denn nicht jeder Datensatz ist gleich gut für jeden Zweck geeignet und muss deshalb zunächst gefiltert werden. Die Ordnung und Sichtbarkeit der Daten stellt vor allem bei Big Data ein großes Problem dar. Tabellen und Datenbanken sind übersichtlich und lassen sich gut auswerten. Aber was ist mit Daten aus Fotos, Videos, Tonaufnahmen oder Texten? Relevante Daten sind in diesen Medien ungeordnet und nicht direkt sichtbar. Dadurch sind sie besonders schwer auszuwerten. Um große Mengen dieser Daten auswertbar zu machen, muss auf Technologien wie Künstliche Intelligenz oder maschinelles Lernen zurückgegriffen werden.

Welche Bereiche profitieren von Big Data?

Wie bereits zuvor erwähnt lassen sich durch die Auswertung vieler Daten sehr präzise Aussagen treffen. Damit ist Analyse und Auswertung von Big Data vor allem für große Unternehmen interessant, um ihre Umsätze zu maximieren. Aber auch andere Bereiche profitieren von der Auswertung großer Menge von Daten.

Illuminated server room panel
Für viele Unternehmen und Konstitutionen ist das Sammeln und Auswerten von Daten enorm wichtig.

Bereiche, die besonders von Big Data profitieren, sind die Wissenschaft, das Militär, das Finanzwesen, die Logistik und so weiter. Im Grunde genommen kann jedes Unternehmen und jede Privatperson von der Auswertung großer Mengen Daten profitieren, da Vorhersagen so deutlich an Präzision gewinnen.

Staaten sind natürlich besonders am Sammeln von Daten ihrer Bürger interessiert. Ihnen geht es vor allem darum, Verbrechen aufzuklären bzw. zu verhindern oder die gesammelten Daten für die Terrorismusbekämpfung einzusetzen. Dafür müssen aber teilweise private und intime Grenzen überschritten werden, was bei vielen Menschen verständlicherweise auf Widerstand stößt.

Big Data in den Medien: Wieso wird so häufig negativ über Big Data berichtet?

Der Grund für die häufig negative Berichterstattung in den Medien ist die synonyme Verwendung des Begriffs für Dinge wie Vorratsdatenspeicherung oder Überwachung. Außerdem wird der Begriff "Big Data" häufig in Zusammenhang mit Spionage, Datendiebstahl und Überwachung durch den Staat genannt. Menschen assoziieren also direkt etwas Negatives. Bei den Daten, die in diesen Bereichen gesammelt werden, kann aufgrund ihres Volumens, der Geschwindigkeit ihrer Generierung und ihrer Vielfalt zwar wirklich von Big Data gesprochen werden, es ist aber nicht der Begriff "Big Data" per se, der negativ aufgeladen ist, sondern der Zweck, für den die Daten verwendet werden. Big Data ist wie oben bereits erwähnt nur eine große Menge an Daten.

Zusammenfassung

  1. Als Big Data werden grundsätzlich große Mengen an Daten bezeichnet. Die Variablen Volumen, Geschwindigkeit und Vielfalt sind entscheidende Faktoren für die Definition
  2. Big Data kam zusammen mit der Vernetzung von Geräten und der automatischen Erzeugung von Maschinen auf. 2017 wurden weltweit über 16 Zettabyte Daten erzeugt und diese Menge verdoppelt sich alle zwei Jahre
  3. Durch die Auswertung von Daten können wir präzise Vorhersagen über Ereignisse treffen. Bei vielen Medientypen sind wir bei der Auswertung auf Technologien wie Künstliche Intelligenz oder maschinelles Lernen angewiesen
  4. Big Data ist für Unternehmen, Staaten, das Militär, die Wissenschaft und viele weitere Bereiche besonders interessant
  5. In den Medien wird häufig negativ über Big Data berichtet, da es mit negativen Dingen wie Spionage und Kontrolle durch den Staat assoziiert wird. Grundsätzlich ist Big Data aber ein neutraler Begriff
Kommentar schreiben
Relevante Themen:

Beliebteste Artikel bei Tech

  • Letzte 7 Tage
  • Letzte 30 Tage
  • Alle
close
Bitte Suchbegriff eingeben