You are on page 1of 30

www.techdivision.

com

BIG DATA

Vorsprung durch Wissen


Tante Emma 2.0 oder Big-Data
(Josef Willkommer, TechDivision GmbH)

Big Data Zwischen Urheberrecht und Datenschutzrecht


(Interview mit Dr. Clemens Wass, Rechtsexperte)

Big Data Modebegriff oder Trend?


(Interview mit Dr. Michael May, Fraunhofer Institut IAIS)

Big Data und Customer Journey


(Thorben Fasching, hmmh)

Big Data Vorsprung durch Wissen


(Hendrik Stange, Fraunhofer Institut IAIS)

...Big Data ist in aller Munde!


Das Wachstum der Datenberge scheint unaufhaltsam, ist sehr komplex und meist auch unstrukturiert. Wie kein zweiter Begriff prgt das Thema Big Data derzeit die IT-Diskussionen. Fr die herkmmliche IT bedeutet das Thema einerseits eine groe Herausforderung, andererseits birgt es neue Chancen und Mglichkeiten in sich. Fr die meisten Anwender bleibt jedoch das groe Potential, das sich aus der Anwendung von Big Data fr das eigene Unternehmen ergibt, schwer zu fassen. Big Data gilt als das Rohl des Informationszeitalters es muss nur verstanden werden, es richtig zu nutzen. TechDivision hat sich mit dem Thema Big Data nher auseinander gesetzt und mit Experten der Szene diskutiert. Mit aktuellem Know-How aus dem Hause Fraunhofer Institut IAIS und hochwertigen Expertenartikeln und Interviews stellt das vorliegende Whitepaper das Potential von Big Data ausfhrlich dar.

Tante Emma 2.0 oder Big-Data


Josef Willkommer, TechDivision GmbH Erinnern wir uns doch mal an unsere Jugend. In den meisten Fllen gab es da zumindest bei der Oma einen kleinen Tante Emma Laden, der hug Dreh- und Angelpunkt des tglichen Lebens war. Dort traf man sich, tauschte sich aus und bekam entweder von Tante Emma oder von anderen Kunden allerlei Neuigkeiten, Tipps fr das tgliche Leben, Produktempfehlungen und vieles mehr. Im Prinzip eigentlich Social Media 1.0. Tante Emma war damals auch deswegen erfolgreich und hatte ein tragfhiges Geschftsmodell, weil die Mobilitt noch nicht in der heutigen Form gegeben war und viele auf Nahversorgung ohne eigenes Auto angewiesen waren. Wie wir alle wissen, nahm die Mobilitt gerade whrend des Wirtschaftswunders enorm zu, viele kauften sich ihr erstes Auto und die ersten Supermrkte wie man sie heute kennt wurden aus dem Boden gestampft. Fr Tante Emma & Kolleginnen natrlich harte Konkurrenz. Dennoch hat Tante Emma im Kleinen immer noch Erfolg, weil sie genau das bieten kann, was in der Anonymitt eines Supermarktes, Discounters oder SBWarenhauses grtenteils untergeht: Persnlichkeit. Tante Emma kannte und kennt ihre Kunden und deren Vorlieben sowie Besonderheiten. Welche Konserven Herr Maier am liebsten mag, wieviele Brtchen Frau Mller am Samstag bentigt. Sie wei auch entsprechende Zusammenhnge und kann aus eigener Erfahrung berichten und Empfehlungen abgeben: Wenn Ihnen der Joghurt zu s ist, sollten sie mal diesen versuchen.

TechDivision GmbH

Big Data Vorsprung durch Wissen

Nach aktuellen Berechnungen verdoppelt sich das weltweite Datenvolumen alle 2 Jahre. Diese Entwicklung wird vor allem getrieben durch die zunehmende maschinelle Erzeugung von Daten z. B. ber Protokolle von Telekommunikationsverbindungen (CDR) und Web-Zugriffen (Logdateien), automatische Erfassungen von RFID-Lesern, Kameras, Mikrofonen und sonstigen Sensoren. Big Data fallen auch in der Finanzindustrie an (Finanz-Transaktionen, Brsendaten), sowie im Energiesektor (Verbrauchsdaten) und im Gesundheitswesen (Verschreibungen). In der Wissenschaft fallen ebenfalls groe Datenmengen an, z. B. in der Geologie, Genetik, Klimaforschung und Kernphysik. Der IT-Branchenverband Bitkom hat Big Data als einen Trend im Jahr 2012 bezeichnet. (Quelle: Wikipedia)

Mit anderen Worten Tante Emma machte und macht intuitiv das, was heute aufgrund der enormen Zunahme an Produkten, Werbebotschaften und generellen Optionen beim Einkauf und der damit zusammenhngenden Explosion der Datenmengen auch zum Begriff Big Data und der damit einhergehenden Personalisierung gehrt. Was aber bedeutet Big Data eigentlich? Als Big Data werden besonders groe Datenmengen bezeichnet, die mit Hilfe von Standard-Datenbanken und DatenmanagementTools nicht oder nur unzureichend verarbeitet werden knnen. Problematisch sind dabei vor allem die Erfassung, die Speicherung, die Suche, Verteilung, Analyse und Visualisierung von groen Datenmengen. Das Volumen dieser Datenmengen geht in die Terabytes, Petabytes und Exabytes. Dass die Datenstrme aus immer mehr Kanlen generiert werden bei denen die Grenzen inzwischen auch immer huger verschwimmen zeigt das Beispiel Fernsehen. Whrend zu Tante Emmas Zeiten in der Regel drei Fernsehprogramme zur Verfgung standen, wei man heute hug gar nicht mehr wieviele und welche Sender verfgbar sind. Im Schnitt drften hier pro Haushalt sicherlich inzwischen 30 bis 50 Sender mitunter auch deutlich mehr um die Gunst der Zuschauer buhlen. So verwundert es auch nicht, dass Konsumenten heutzutage rund 10.000 Werbebotschaften pro Tag ausgesetzt sind, die in der Folge natrlich auch immense Datenmengen nach sich ziehen. Durch die Vernetzung von Web und TV sowie entsprechende Tracking-Technologien werden daher inzwischen oft wie wild Daten gesammelt hug ohne klares Ziel und entsprechende strategische Vorabplanungen.

Das Ergebnis sind exponentiell ansteigende Datenberge. Dies erklrt auch, warum ca. 90% der weltweiten Daten in den letzten 2 Jahren entstanden sind und nur 15% der Marketing-Entscheider ein klares Verstndnis darber haben, welchen Mehrwert einzelne Kommunikationskanle bieten. [1] Wie Big-Data heute in der Praxis aussehen kann, zeigt ein Beispiel der AOK. Auch die Wissenschaftler des Wissenschaftlichen Instituts der AOK (WIdO) wissen genau, wie essenziell Zahlen gerade fr den Versicherungsmarkt sind. Mit welchen Datenmengen hier hantiert wird, zeigt die nachfolgende Auistung: 24 Millionen AOK-Versicherte mit: sechs Millionen Behandlungen/Jahr 55 Millionen Diagnosen 18 Millionen Prozeduren 55 Millionen Entgeltinformationen 140.000 ambulant ttige rzte mit: ber 370 Millionen Behandlungen ber 1,3 Milliarden Abrechnungsziffern ber 800 Millionen codierten ICD-10-Diagnosen 3,6 Millionen OPS-Codes 12 Millionen Arbeitsunfhigkeiten All diese Daten helfen den Wissenschaftlern des WIdO dabei, fr die Gesundheitsversorgung wichtige Korrelationen aufzudecken. Dabei sorgen bereits einfachste Analysen dafr, dass vermeintlich schwierige Fragen beantwortet

[1] http://www.owm.de/dokumente/studien/publikationen_detail.php?id=11 [2] http://www.computerwoche.de/a/wenn-pythagoras-mit-big-data-hantiert,2527754


TechDivision GmbH Big Data Vorsprung durch Wissen 3

werden knnen: Welche und wie viele Versicherte mssen in nchster Zeit vermutlich ins Krankenhaus? Wie oft geht, im Vergleich zu einem regulren Patienten, ein chronisch Kranker zum Arzt? Wo mssen Patienten huger wiederholt behandelt werden? Weiterfhrende Analysen sind mglich wenn etwa Daten aus den verschiedenen Leistungsbereichen miteinander verknpft und analysiert werden. Dabei besteht innerhalb des AOK-Wissenschaftsinstituts eine groe Schwierigkeit: Jeder Sektor also die Arzneimittelversorgung, die Kliniken, die ambulante Versorgung und die Arbeitsunfhigkeit besitzt eine separate Datenverwaltung. Sie alle mssen aufwendig miteinander verbunden und synchronisiert werden. Diese Verknpfungen sind jedoch sehr wichtig, da sie Rckschlsse auf gesellschaftliche Gesundheitszustnde erlauben. [2] An diesem Beispiel wird auch gleich eines der grten Probleme im Bereich Big-Data klar. Viele Unternehmen besitzen bereits Unmengen von Daten bzw. haben zwischenzeitlich begonnen, entsprechende Daten zu erheben. Diese werden meist jedoch in unterschiedlichsten Bereichen und Systemen generiert und gespeichert und mssen dann wieder zusammengefhrt werden um bergreifende Analysen zu ermglichen.

einkaufen, kontrolliert Walmart mehr als 1,5 Mio. Kundentransaktionen pro Stunde! Alle dadurch generierten Daten ieen in eine zentrale Datenbank, die aktuell rund 3 Petabyte an Informationen enthlt. Da sie mit Petabyte vermutlich noch nicht so viel anfangen knnen hier ein vereinfachtes Praxisbeispiel: Fr unser Beispiel bedienen wir uns des sog. ASCII Zeichensatzes, bei dem jedes Zeichen mit einem Byte codiert wird. Auf einer DIN-A4 Seite lassen sich mit einer Schreibmaschine 80 Zeichen pro Zeile und 53 Zeilen pro Seite schreiben. Damit passen 4.240 Zeichen (80 x 53) auf eine einseitig bedruckte DIN-A4 Seite. Der Einfachheit halber vernachlssigen wir im folgenden Dateisysteme und Header Informationen, welche zustzlichen Platz beanspruchen wrden aber am Ende wird ersichtlich, das dies auch keinen groen Unterschied machen wird. Rechnen wir mit 4.000 Zeichen (80 x 50) pro A4 Seite, was dann 4.000 Byte oder ~ 3,9 KiB oder 4 KB entspricht (?iB vs ?B). Der Einfachheit halber nehmen wir an, wir haben eine Festplatte mit 2 Terabyte Fassungsvermgen, also 2.000.000.000.000 Byte. Damit wird bereits ersichtlich, dass es sich um recht groe Zahlen handelt. Um das Ganze etwas greifbarer zu machen bedienen wir uns eines konkreteren Beispiels: Ein Stapel Papier, A4, 100 Seiten, hat etwa eine Hhe von 1 cm. Wie gro ist nun der Papierstapel, wenn ich den gesamten Inhalt meiner 2TB Festplatte einseitig auf Papier in ASCII Symbolen mit 8050 Zeichen pro Blatt ausdrucken wrde? 2.000.000.000.000 Byte / 4.000 Byte pro Seite = 500.000.000 Seiten Papier 500.000.000 Seiten / 100 Seiten pro 1 cm = 5.000.000 cm / 100 = 50.000 m / 1.000 = 50 km Das entspricht etwa einem Papierstapel von Mnchen nach Rosenheim Luftlinie. Ein Petabyte ist die nchstgrere Einheit nach Terabyte, somit sind 1000 TB = 1 PB und damit 3 PB =

Walmart Tante Emma 3.0


Versuchen wir aber mal, den Bogen zur eingangs erwhnten Tante Emma zu schlagen, die inzwischen in den meisten Fllen von Walmart & Co. abgelst wurde. Aufgrund der enormen Grenunterschiede sowie der Tatsache, dass inzwischen unterschiedlichste Kanle bespielt werden mssen, funktioniert das, was Tante Emma so erfolgreich gemacht hat und was sie meist einzig in ihrem Kopf hatte, heutzutage nicht mehr. Willkommen in der Welt von BigData! Beispiel gefllig? Mit mehr als 200 Millionen Kunden, die jede Woche in die 10.700 Stores mit 69 Firmierungen in 27 Lndern einfallen und in 10 Lndern auch ber Webshops

TechDivision GmbH

Big Data Vorsprung durch Wissen

3.000.000.000.000.000 Byte. Wir kommen zu folgender Rechnung: 3.000.000.000.000.000 Byte / 4.000 Byte pro Seite = 750.000.000.000 Seiten Papier 750.000.000.000 Seiten / 100 Seiten pro 1 cm = 7.500.000.000 cm / 100 = 75.000.000 m / 1.000 = 75.000 km Dieser Papierstapel aus Walmart Kundeninformationen wrde knapp 12 mal um den Erdquator verlaufen, bei 6.370 km Erdumfang. (Beispiel in Anlehnung an:

http://norwied.wordpress.com/2011/07/17/was-isteigentlich-ein-petabyte/) Was Walmart mit diesen Daten unter anderem anstellt bzw. anstellen kann, soll nachfolgendes Beispiel verdeutlichen, das aus dem Buch Big Data von Viktor MayerSchnberger und Kenneth Cukier stammt: Walmart erfasst smtliche Kaufvorgnge aller Kunden um Vorhersagen bzw. entsprechenden Ableitungen treffen zu knnen. Anhand dieser erfassten Kaufvorgnge konnte Walmart ableiten, dass bei einer Hurrikan-Warnung in den Walmart-Lden des jeweiligen Hurrikan-Zielgebietes die

Quelle: WalmartLabs

Nachfrage nach Kellogs Pop-Tarts signikant steigt. Daraufhin wurden die Store-Manager von Walmart informiert, dass whrend der Hurrikansaison die Kellogs Pop-Tarts im Eingangsbereich platziert werden sollten. Das Ergebnis war ein enormer Boost der Abverkaufszahlen fr dieses Produkt, den man ohne entsprechende Datenanalyse sicherlich kaum realisieren htte knnen, da eine Korrelation zwischen Hurrikanen und bestimmten Frhstckssnacks nicht gerade offensichtlich ist.

Inzwischen betreibt Walmart genau fr solche Zwecke auch eine umfassende Online-Marketing-Plattform, in der die Datenstrme unterschiedlichster Kanle zusammenlaufen und entsprechend analysiert werden. Durch komplexe Algorithmen, semantische Analysen, maschinelles Lernen und automatische Skalierung ermglicht die WalmartLabs Plattform folgendes:

TechDivision GmbH

Big Data Vorsprung durch Wissen

Analyse von 100 Millionen Keywords hinsichtlich TrafcVolumen, Synonymen, relevanten Keywords, Wert und Qualitt des Keywords, Keywords mit dem optimalen Produktbezug sowie Kategorisierung von Keywords. Aktives Bidding fr jedes Keyword mittels API mehrmals tglich Analyse des Userverhaltens whrend des Kaufvorganges um optimale Produktempfehlungen abgegeben zu knnen. Durchfhrung paralleler Test um neue Datenmodelle prfen zu knnen

einen Master-Slave-Ansatz. Ein Masterknoten, der so genannte NameNode, bearbeitet eingehende Datenanfragen, organisiert die Ablage von Dateien in den Slaveknoten und speichert anfallende Metadaten. HDFS untersttzt dabei Dateisysteme mit mehreren 100 Mio. Dateien. Sowohl Dateiblocklnge als auch Redundanzgrad sind kongurierbar. Hive erweitert Hadoop um Data-WarehouseFunktionalitten, namentlich die Anfragesprache HiveQL und Indizes. HiveQL ist eine auf SQL basierende Abfragesprache und ermglicht dem Entwickler somit die Verwendung einer SQL-hnlichen Syntax. Im Sommer 2008 stellte Facebook, der ursprngliche Entwickler von Hive, das Projekt der Open-Source-Gemeinde zur Verfgung. Die von Facebook verwendete Hadoop-Datenbank gehrt mit etwas mehr als 100 Petabyte (Stand: August 2012) zu den grten der Welt. HBase ist eine skalierbare, einfache Datenbank zur Verwaltung sehr groer Datenmengen innerhalb eines Hadoop-Clusters. Die HBase-Datenbank basiert auf einer freien Implementierung von Google BigTable. Diese Datenstruktur ist fr Daten geeignet, die selten verndert, dafr aber sehr hug ergnzt werden. Mit HBase lassen sich Milliarden von Zeilen verteilt und efzient verwalten." Quelle: Wikipedia (http://de.wikipedia.org/wiki/ Apache_Hadoop)

Big-Data wird zu Open-Data


Zuknftig mchte Walmart seine Big-Data Tools Open Source zur Verfgung stellen. Durch die Entwicklung mehrerer Tools zur Migration von Big Data plant Walmart von 10 unterschiedlichen Datenquellen auf eine zu reduzieren und von einem testweiten 10-node Hadoop Cluster auf einen 250-node Hadoop Cluster umzusteigen. "Apache Hadoop ist ein freies, in Java geschriebenes Framework fr skalierbare, verteilt arbeitende Software. Es basiert auf dem bekannten MapReduce-Algorithmus von Google Inc. sowie auf Vorschlgen des Google-Dateisystems und ermglicht es, intensive Rechenprozesse mit groen Datenmengen (Big Data, Petabyte-Bereich) auf Computerclustern durchzufhren. Hadoop wurde ursprnglich durch den Lucene-Ernder Doug Cutting initiiert. Am 23. Januar 2008 wurde es zum Top-LevelProjekt der Apache Software Foundation. Nutzer sind unter anderem Facebook, a9.com, AOL, Baidu, IBM, Imageshack und Yahoo. Das Hadoop Distributed File System (HDFS) ist ein hochverfgbares, leistungsfhiges Dateisystem zur Speicherung sehr groer Datenmengen auf den Dateisystemen mehrerer Rechner (Knoten). Dateien werden in Datenblcke mit xer Lnge zerlegt und diese redundant auf die teilnehmenden Knoten verteilt. HDFS verfolgt hierbei

Daten werden die Markenkommunikation revolutionieren


Gem einer Online-Befragung durch die Agentur Interone im Februar/Mrz 2013, bei der insgesamt 400 Marketer aus Unternehmen sowie Agentur-Insider teilgenommen haben, sind 65% der Befragten der Meinung, dass die Bedeutung von Daten fr die Markenkommunikation stark zunehmen wird. Vor allem drei Datenquellen ermglichen kontextsensitives Marketing:

TechDivision GmbH

Big Data Vorsprung durch Wissen

Konsumenten vermessen digital ihr Leben, um sich selbst zu optimieren (Quantied Self) Unternehmen sind in der Lage, groe Datenmengen in krzester Zeit zu analysieren (Big Data) Daten werden ffentlich und ber Schnittstellen verfgbar gemacht (Open Data). Big Context entsteht durch eine Schnittmenge dieser Datenquellen. Mit Big Context wird die Markenkommunikation effektiver, individueller und involvierender. Marken sind durch die neuen Datenquellen in

der Lage, ihre Kunden besser kennenzulernen und individueller anzusprechen. Sie knnen Kanle und Touchpoints wirksamer und virtuoser orchestrieren. Kampagnen lassen sich durch Daten kreativ anreichern und aktueller halten. Inhalte werden relevanter und resonanzfhiger, neue Ideen fr Kommunikation entstehen. (Quelle: Big Context - http://bigcontext.interone.de/) Die Befragung frderte zudem einige weitere, recht interessante Informationen zu Tage: 34% der Befragten knnen noch nichts mit Big Data anfangen 39% wissen nicht was Open Data ist

Abb.: Zusammenhang von Big Context - http://bigcontext.interone.de/

TechDivision GmbH

Big Data Vorsprung durch Wissen

50% haben bisher noch nichts von Quantied Self gehrt Nur 13% sehen heute schon die Zukunft: Daten fr neue Produkte oder Services zu nutzen 20% versprechen sich davon vorrangig efzienter zu kommunizieren 28% sehen den grten Nutzen in einem besseren Verstndnis der Zielgruppe 38% sehen in der fehlenden Transparenz, welche Daten vorhanden sind, die wichtigste Hrde 37% halten eine fehlende Kultur im Umgang mit Daten fr die zentrale Barriere 9% sehen rechtliche Probleme

Absichten und Ziele sind. Daraus ergeben sich zentrale Erfolgskriterien, Hypothesen und Anforderungen. 2. Klein anfangen, statt gro denken

Identizieren Sie berschaubare Bereiche, in denen Sie ohne groes Risiko mit kleinem Budget mit Big Context experimentieren knnen. Ist Ihr Experiment erfolgreich, knnen Sie darber sprechen und Ihre Aktivitten ausweiten. Scheitert es, haben Sie nichts verloren. 3. Holen Sie sich Hilfe

Big Context betritt zentrale Aspekte Ihres Unternehmens. Mittelfristig werden Marketer grere Daten-Kompetenzen aufbauen mssen. Gerade am Anfang ist es jedoch wichtig, den Stein ins Rollen zu bringen. Dafr ist externe Expertise hilfreich. 4. Experimentieren Sie

Big Data wird zuknftig ein zentrales Element bei der Steuerung von Unternehmen darstellen. Jedoch muss bei der Einfhrung sowie der Nutzung auf ein paar ganze wesentliche Parameter geachtet werden, die aus der absolut empfehlenswerten Interone-Studie Big Context stammen: 1. Wissen, was man wissen will

Wer Neuland betreten will, geht Risiken ein. Umso wichtiger ist es sicherzustellen, dass der erste Schritt erfolgreich ist. Big Context schafft vielfltige neue Mglichkeiten. Um sich nicht zu verlieren, sollten Sie zuerst identizieren, was Ihre

Sie wollen mit Big Context neue Wege gehen? Experimentieren Sie, formulieren Sie Hypothesen, und stellen Sie neue Fragen. Reduzieren Sie lieber die Zahl der Datenstze, als zu komplex zu werden. Hug bersieht man bei Experimenten, dass man gerade eine wichtige Entdeckung gemacht hat. Viele der grten Innovationen sind zufllig entstanden.

Quelle: Quelle: IDC, Oktober 2012 (n= 254, Angaben in Prozent)

TechDivision GmbH

Big Data Vorsprung durch Wissen

Quelle: Quelle: IDC, Oktober 2012 (n= 254, Angaben in Prozent)

5.

Bieten Sie bessere Erlebnisse und Emotionen

Stellen Sie sicher, dass Ihre Big Context Aktivitten nicht zu technisch werden, sondern Ihren Kunden Mehrwerte in Form von hherer Relevanz, weniger Strung, neuer Services, besserer Kundenerlebnisse etc. bieten. Menschen wollen auch weiter emotional berhrt werden und sich an guten Geschichten und Ideen erfreuen. Daten knnen hierbei untersttzen Quelle: Interone-Studie Big Context http://bigcontext.interone.de/ Interessant sind hier auch die Ergebnisse einer im Oktober 2012 durchgefhrten Studie von IDC zum Thema Big Data. Auf die Frage Worin liegt Ihrer Meinung nach das Potenzial von Big-Data-Technologie auf Business-Ebene? kamen folgenden Antworten zustande: Und die Frage Welche Geschftsbereiche knnen den hchsten Business-Nutzen aus Big Data ziehen und welche Themen sind fr Sie relevant? wurde wie folgt beantwortet:

Insofern wird Big Data gerade im Hinblick auf die Kostenoptimierung aber auch zur allgemeinen Unternehmenssteuerung zuknftig in vielen Fllen nicht mehr wegzudenken sein.

Fazit
Das Thema Big Data ist sicherlich kein Hype-Thema mehr, sondern absolute Realitt, die aktuell vielleicht noch nicht in allen Bereichen angekommen ist bzw. hug noch in den Kinderschuhen steckt, aufgrund der immer weiter steigenden Datenmengen aber zuknftig selbst vor Lieschen Mller nicht halt machen wird. Dabei wird sich das Wachstum der Datenmengen insbesondere durch Mobile Web und deren Nutzung sowie das Social Web zuknftig noch weiter beschleunigen. Daten werden zuknftig mehr und mehr zum Produkt!

TechDivision GmbH

Big Data Vorsprung durch Wissen

Da Daten hug sehr politisch sind, sollte das Thema Big Data zur Chefsache erklrt bzw. vom Chef nachhaltig berwacht und mitgetragen werden. Dabei wird der Wettbewerbsvorteil zuknftig nicht durch die Existenz bzw. die Generierung von Datenbergen, sondern vielmehr durch deren intelligente Verknpfung entstehen. So hat Barack Obama jetzt sind wir wirklich in der Politik die beiden Wahlen zu einem nicht unerheblichen Teil ber gezieltes Micro-Targeting gewonnen, indem rund 10 Terabyte an Rohdaten aus Webanalyse, Social Media, Apps, Soziodemographie, Medienplnen und -analysen, Anzeigenpreisen etc. von 100 Analysten ausgewertet wurden, um Unentschlossene und Bekehrbare in den Swing-States zu identizieren und gezielt anzusprechen. (Quelle: Interone-Studie Big-Data) In diesem Zusammenhang wird zuknftig auch ein neues Berufsbild Einzug in viele Unternehmen halten der DataScientist. Hilary Mason, Chief Data Scientist bei bit.ly und Meister dieser neuen Disziplin, hat Data Science einmal als Schnittstellenkompetenz beschrieben. Data Science liegt da, wo Computerwissenschaften, Statistik und Mathematik, Ingenieurskunst und Hacking, der neugierige, kreative Umgang mit Computern, Software und Algorithmen, zusammentreffen. Data Science ist ein multidisziplinrer Raum, in dem neue Ideen und Lsungen entstehen. Hilary Mason nennt die Menschen die diesen Raum bewohnen, awesome nerds. (Quelle: http://www.computerwoche.de/ a/wo-wissenschaft-und-business-it-zusammentreffen, 2527192#)

Abschlieen mchte ich mit einem Zitat von Florian Resinger, Head of Online Communication & Web Marketing bei BMW, der ebenfalls in der Interone-Studie auf die Frage, worauf Marketer achten sollten, sofern sie erste Schritte in die neue Datenwelt gehen mchten, folgendes geantwortet hat: Die Kunst besteht nicht darin, Daten zu generieren, sondern handlungsrelevante Informationen zu erhalten. Angesichts der Flle an Mglichkeiten muss man mehr denn je wissen, was man will, was man sucht und ber welche Daten man bereits verfgt. Zudem sind Daten auch mit Vorsicht zu genieen. Hug werden einmalig bestimmte Kennzahlen festgelegt und nicht wieder hinterfragt. Daten werden dann zu Automatismen und entwickeln eine Eigendynamik. Dem ist eigentlich nichts mehr hinzuzufgen.

TechDivision GmbH

Big Data Vorsprung durch Wissen

10

Big Data Modebegriff oder Trend


Interview mit Dr. Michael May, Fraunhofer Institut IAIS

Im letzten Jahr wurden weltweit 1,8 Zettabyte (1,8 x 1021 Byte) an Daten generiert. Glaubt man Expertenprognosen, so wird sich das Datenvolumen alle zwei Jahre verdoppeln. Das Potential von Big Data ist gro. Durch die automatische Erfassung von Daten, den Siegeszug von Smartphones und die Durchdringung aller Lebensbereiche durch Social Media wird das Datenangebot in Zukunft immer grer werden. Wir haben Dr. Michael May, den Big Data-Experten des Fraunhofer Instituts, interviewt, der uns ber Potentiale, Mglichkeiten fr Unternehmen und neue Herausforderungen durch Big Data aufklrte.

Personen und Prozesse generieren weltweit immer mehr neue Daten und lassen das Datenvolumen stetig wachsen: 350 Billionen Meter Dokumente, 5 Millionen abgeschlossene Transaktionen pro Sekunde, 500 Millionen Online-Verbindungen. Daten aus Simulationen, Modellberechnungen, Social Media, etc. die Datenut wird immer grer. In diesem Zusammenhang liefern auch Facebook-Nutzer mit Kommentaren und Likes wichtige Informationen, die Marktrends vorgeben. Ein anderes Beispiel sind Konsumenten, die ihren Verbrauch ber intelligente Stromsysteme managen. IT-Systeme werden von den Datenlawinen regelrecht berrollt und sind mit der Auswertung meist berfordert. Welche Produkte kauft der Verbraucher von morgen? Welche Dienstleitungen und Services sind bei Zielgruppen gefragt und werden aktuell diskutiert? Und welche Trends kommen zuknftig auf uns zu? Big Data knnte diese Fragen beantworten. Doch ist das Thema mittlerweile auch bei deutschen Unternehmen angekommen und wird es hinreichend wahrgenommen? Oder ist das Thema nur ein Hype, der in naher Zukunft wieder abauen wird? Dr. Michael May vom Fraunhofer Institut stellte sich unseren Fragen in einem Interview.

Experten-Info:
Dr. May leitet seit 1998 die Abteilung Knowledge Discovery am Fraunhofer IAIS, die sich mit den Themen Data Mining, Maschinelles Lernen und Big Data befasst. Er leitet derzeit eine Anzahl von Big Data Projekten in Forschung und Wirtschaft und war fr die vom deutschen Wirtschaftsministerium gefrderte Potentialanalyse Big Data in Deutschland verantwortlich. Seine Forschungsschwerpunkte sind derzeit die Data-MiningAnalyse von verteilten Data Streams sowie die Analyse von Telekommunikations- und Mobilittsdaten.

TechDivision GmbH

Big Data Vorsprung durch Wissen

11

Interview mit Dr. Michael May


TechDivision: Big Data Modebegriff oder Trend? Ganz klar: Beides. TechDivision: Ab welcher Grenordnung spricht man von Big-Data? Gibt es heutzutage berhaupt noch Small Data? Wenn man von Big Data spricht, denkt man normalerweise an Datenmengen in den Grenordnungen von vielen Tera-, Peta- oder sogar Exabyte. Allerdings ist die Datenmenge (englisch: Volume) nur eines der drei kennzeichnenden Merkmale von Big Data. Die beiden anderen sind die Geschwindigkeit der Datenverarbeitung (Velocity) und die Vielfalt und Heterogenitt (Variety) der Datenquellen. Zudem ist die Komplexitt der Analyse ein zentrales Kriterium. Was fr die eine Analyse, z. B. ein Text-Mining-Verfahren zur Sentiment-Erkennung, Big Data ist, mag fr das andere, z. B. eine simple Summenbildung nach Regionen, Small Data sein. TechDivision: Warum denken Sie ist der Hype um Big Data jetzt so gro? Der erste Grund ist die Verfgbarkeit immer grerer Datenmengen im Internet, aus Smartphones, aber auch in technischen Prozessen. Ein weiterer wichtiger Grund ist, dass in den letzten Jahren Open-Source-Tools zur Verarbeitung von Big Data breit verfgbar geworden sind, z. B. Hadoop. Sie haben einen gewissen Reifegrad erreicht, so dass sie fr viele Unternehmen interessant werden. Und natrlich haben Google, Facebook & Co. gezeigt, wie ganz auf Big Data gebaute Geschftsmodelle Unternehmen in sehr kurzer Zeit sehr reich machen knnen. Das begelt die Phantasie junger Start-Ups wie auch von Industriegiganten berall in der Welt. TechDivision: Welche Auswirkungen hat Big Data auf Unternehmen?

Richtig verstanden ist Big Data in erster Linie kein Technologiethema obwohl es natrlich groen technologischen Sachverstand braucht, um es umzusetzen. Es geht darum, Entscheidungsprozesse in Unternehmen zu verndern und zu automatisieren, indem man sie auf die intelligente, sehr zeitnahe Auswertung von Daten sttzt, die im Geschftsbetrieb anfallen. Data Driven Enterprises heit hier das Schlsselwort. So verstanden knnen die Auswirkungen auf die Unternehmen fundamental sein. TechDivision: Welche Auswirkungen hat Big Data auf unsere Gesellschaft? Das beginnen wir gerade erst zu erahnen. Bei dieser Frage kommen ja fast reexartig Fragen des Datenschutzes hoch. Aber man sollte darber hinaus die positiven Aspekte, z. B. die Aussicht auf neue datengetriebe Entwicklungen in der Medizin, die Entwicklung energieefzienterer Verfahren mit den positiven Auswirkungen auf die Umwelt oder auch die Chancen fr eine validere Theorienbildung z. B. in der Soziologie, nicht vergessen. Anstze zu letzterem erleben wir gerade in der Theorie sozialer Netzwerke, wo inzwischen dank Facebook oder Twitter-Daten empirische Quellen vorhanden sind, von denen man vor 15 Jahren nicht einmal trumen konnte. TechDivision: Bei Fraunhofer waren Sie mageblich an der Studie Potenzialanalyse Big Data in Deutschland beteiligt. Welche Hauptergebnisse konnten Sie gewinnen? Die Potenzialanalyse wurde vom Bundeswirtschaftsministerium im Rahmen des TheseusProjektes gefrdert. Wir haben existierende Business Cases analysiert, Zukunftsworkshops in sechs verschiedenen Branchen und eine Online-Befragung durchgefhrt. Zusammengefasst lsst sich sagen: Grundstzlich ist das Thema in Deutschland angekommen. ber viele Branchen hinweg denken Unternehmen ber den Einsatz von Big Data nach. Innovationscenter und Big Data-Task Forces werden berall ins Leben gerufen. Aber es existieren auch Hemmnisse. Neben Problemen des Datenschutzes ein in dieser Ausprgung sehr deutsches Phnomen ist insbesondere die mangelnde Vertrautheit mit den neuen Technologien ein Problem. Was gegenwrtig am meisten bentigt wird, sind Orientierungshilfen wie erfolgreiche Use

TechDivision GmbH

Big Data Vorsprung durch Wissen

12

Cases, Best Practices, Lsungsbersichten, aber auch Trainingsmanahmen. Das Jahr 2013 wird hier sehr spannend. TechDivision: Welche Handlungsempfehlungen geben Sie in Richtung Unternehmen? Jetzt mit Big Data zu beginnen und zu prfen, wo fr das eigene Unternehmen der Mehrwert und die neuen Geschftsmodelle liegen. Technologisches Know-How aufbauen. ber wahrgenommene Hemmnisse im Datenschutz nicht nur klagen, sondern gegebenenfalls prfen, wie sich mit datenschutzkonformen Angeboten speziell im deutschen Markt Wettbewerbsvorteile erzielen lassen. TechDivision: Warum ist es wichtig Personal in diesem Bereich auszubilden? Mangelnde Expertise wurde in unserer Potenzialanalyse als eines der Haupthemmnisse identiziert. Ausgebildetes Personal ist gegenwrtig am Markt nicht in ausreichendem Umfang verfgbar. Die neuen Technologien unterscheiden sich oft grundstzlich von bisherigen Paradigmen z. B. im Bereich der Business Intelligence. Um identizierte Chancen fr das Geschft wirklich nutzen zu knnen, ist es deshalb entscheidend, ber geeignet qualiziertes Personal zu verfgen. Neben der rein technischen Expertise ist es dabei wesentlich, eine Generation von Informatikern und Statistikern heranzuziehen, die in der Lage ist, technischmathematische Konzepte in Anwendungslsungen zu bersetzen. Das neue Berufsbild, das hierfr gebraucht wird, nennt sich Data Scientist. Am Fraunhofer IAIS bieten wir z. B. Schulungen an, um Mitarbeiter in Unternehmen gezielt in dieser Richtung zu qualizieren. TechDivision: Gibt es inzwischen StandardTools bzw. -Software fr den Umgang mit Big-Data oder ist das Ganze zu individuell und speziell fr Standardisierung?

Der Markt ist noch zu sehr im Fluss, als dass man eine baldige Standardisierung erwarten knnte. Das Angebot an Open-Source- und kommerziellen Lsungen ist inzwischen nahezu unberschaubar. Neben wirklich neuen und innovativen Lsungen erhlt so manches lange verfgbare Produkt auch einen eiligen Big Data-Anstrich, wodurch die Landschaft noch unbersichtlicher wird. Auf lange Sicht wird es aber zu einer Konsolidierung kommen. TechDivision: Big Data in der Praxis knnen Sie uns Beispiele nennen? Der Finanzbereich protiert beispielsweise von Big DataTechnologie bei der automatischen Betrugserkennung in Kreditkartentransaktionen. Mit neuen sogenannten InMemory-Technologien ist es mglich, die riesigen Datenvolumina efzient und automatisiert nach neu auftauchenden Betrugsmustern zu durchsuchen. Eine entsprechende, vom Fraunhofer IAIS entwickelte, Technologie ist bereits bei Banken im Einsatz. Im Bereich der Social Media-Analyse haben wir eine Software entwickelt, welche mit intelligentem Text-Mining die vielen Millionen Postings eines Forums von Automobilnutzern analysiert und daraus Emotionen zu Automarken extrahiert. Ntzlich ist das beispielsweise fr Automobilhersteller zum Trendmonitoring. Und im ffentlichen Bereich entwickeln wir in einem Forschungsprojekt zusammen mit Anwendungspartnern gegenwrtig Werkzeuge, die TwitterNachrichten und andere Social Media-Daten mit intelligenten Text-Mining-Verfahren in Echtzeit analysieren, um sich frhzeitig ein Lagebild von einer Katastrophe machen zu knnen.

Fazit
Die grte Herausforderung von Big Data ist es, relevante Daten fr eine efzientere Geschftsstrategie zu erkennen. Meist ist es jedoch komplex, Informationen aus unbersichtlichen Datensammlungen herauszultern. Unternehmen stehen so zuknftig vor wettbewerbskritischen Herausforderungen.

TechDivision GmbH

Big Data Vorsprung durch Wissen

13

Big Data Vorsprung durch Wissen


Hendrik Stange, Fraunhofer Institut IAIS

Mit neuen Technologien zum datengesttzten Tante-Emma-Laden

Noch nie standen die Chancen besser, um als Unternehmen oder Kunde auf vielfltige Weise von der Datenexplosion zu protieren. Tante Emmas Erben haben gelernt, dass es nicht nur auf eine efziente Wertschpfung ankommt, sondern dass man auch im E-Commerce-Zeitalter ein offenes Ohr fr die Bedrfnisse der Kunden braucht. Der entscheidende Unterschied: Waren es frher wenige hundert Kunden, sind es heute Millionen Stimmen, die tagtglich direkt oder indirekt mit den Unternehmen kommunizieren. Zusammen mit den innerbetrieblichen Daten aus den Wertschpfungsprozessen liefert dies die Ausgangsbasis fr innovative Vernderungen, wie intelligente Produkte, individualisierte Angebote und efzient ausgerichtete Prozesse.

Jeder ging gern zu ihr in den Laden, denn Tante Emma kannte ihre Kunden genau. Seit damals hat sich viel verndert, doch dieses natrliche Gespr und Fingerspitzengefhl fr die Bedrfnisse und Interessen wollen Handelsunternehmen fr ihre Kunden auch im Internet abbilden. Denn kaum eine Branche ist strker darauf angewiesen, ihre Kunden besser zu verstehen und ihre Dienstleistungen sowie Angebote auf die jeweiligen Kundenbedrfnisse auszurichten, als der E-Commerce. Dies ist ein Grund, weshalb der IT-Branchenverband BITKOM den E-Commerce in einer Vorreiterrolle beim Einsatz von BigData-Technologien in Deutschland sieht. In Big Data steckt die Kraft innovativer Vernderung fr einen besseren Kundenservice, individuellere Angebote und efzientere Prozesse in einem dynamischeren Marktumfeld. Den Wissensvorsprung, um den Markt zu gestalten, generieren die Unternehmen nicht mehr nur aus einzelnen Datenbestnden und manuellen Auswertungen. Vielmehr steckt das Potenzial in der automatisierten Echtzeit-Analyse verknpfter Daten aus verschiedenen Quellen ber die Grenzen eines Unternehmens hinweg.

Ein Meilenstein fr die datengetriebene Entwicklung ist die Vernetzung unseres Alltages. Smartphones, Tablets und zuknftig sogar Datenbrillen lassen die Grenzen zwischen digitaler und physischer Einkaufswelt verschwinden. Gleichzeitig erzeugen sie zusammen mit den klassischen Datenquellen entlang der Wertschpfungsprozesse einen multidimensionalen Datenpool. Darin liegen wegweisende Herausforderungen fr Unternehmen. So sehen wir beispielsweise eine zunehmende Emanzipation des Kunden, der sich fragt: Wirklich (m)ein Angebot oder doch nur (t)eure Restposten? Der vernetzte Kunde validiert, evaluiert und vergleicht, und wird dabei zunehmend von Sensoren und Apps untersttzt. In der Folge wandeln sich seine Erwartungen und sein Verhalten und es steigen die Anforderungen an Unternehmen, ihre Angebote an den individuellen Bedrfnissen ihrer Kunden auszurichten. Dafr mssen die Unternehmen in den massiven Datenstrmen lesen und die Daten vor allem im Kontext verstehen knnen. So hat Google gerade erst seinen Nutzeranalysedienst Universal Analytics als Nachfolger von Google Analytics lanciert und trgt dem

TechDivision GmbH

Big Data Vorsprung durch Wissen

14

vernderten Nutzerverhalten durch ein gertebergreifendes Tracking Rechnung.

relevanten Daten ganzheitlich betrachtet und analysiert. Das Potenzial von Big Data entfaltet sich somit erst durch die Verknpfung der Datenbestnde ber Grenzen hinweg.

Big Data gro, unterschiedlich, rasant


Insgesamt steht das Phnomen Big Data heute erst am Anfang. Weltweit gehen die Schtzungen weit auseinander, wie tief der Datenozean ist und wie schnell er sich weiter fllt. Unterm Strich wird man sich schnell einig, dass es so viele Daten sind, dass traditionelle Analysewerkzeuge an ihre Grenzen stoen. Dabei sind es nicht nur die Datenvolumen allein, die Big Data ausmachen. Kennzeichnend fr Big Data sind im Kern drei Eigenschaften, die auch als 3 Vs bezeichnet werden: Volume, Variety, Velocity. Volume steht fr die groe Menge der zu analysierenden Daten; Variety fr deren Verschiedenartigkeit in Bezug auf Datentyp und Ursprung. Velocity beschreibt die hohe Geschwindigkeit der Datengenerierung und damit auch wie gro der Datenstrom ist, den es in Echtzeit zu analysieren gilt. Wobei man sich nicht einzelne Dateninseln wie etwa aus dem Kundenservice oder Warensystem ansieht, sondern mglichst alle

Big-Data-Anwendungen
In diesen Datenozeanen liegen wahre Schtze. So erklren es Big-Data-Experten und verweisen auf erfolgreiche Geschftsanwendungen. Dabei sind es nicht mehr nur die Namen der Big 5 der Internetbranche Yahoo, Google, Amazon, Facebook, Twitter die genannt werden. Es sind Banken, Versicherungen, Pharmaunternehmen, Telekommunikations- und Industrieunternehmen, die BigData-Anwendungen aktiv fr ihr Geschft nutzen. Wissenschaftler des Fraunhofer-Instituts fr Intelligente Analyse- und Informationssysteme IAIS haben weltweit 50 Big Data Anwendungen systematisch aufbereitet und dabei charakteristische Unternehmensbereiche je nach Branche identiziert (siehe Abb. 1). Fr den Handel zeigt sich der Schwerpunkt im Bereich Marketing, Vertrieb und Kundenbetreuung. Unternehmen starten mit ersten BigData-Anwendungen im Bereich der Absatzprognose, des Marktmonitoring oder Kundenfeedbackanalyse.

Abb. 1: Anwendungen fr Big Data je nach Branche und Unternehmensbereich (n=50, Quelle: Fraunhofer IAIS)

TechDivision GmbH

Big Data Vorsprung durch Wissen

15

Wegbereiter wie Google, Yahoo oder Amazon zeigen, welcher Mehrwert in Big Data auch fr den E-Commerce steckt. Wer sich anschaut, wie Google die verschiedensten Facetten des Internets in Millisekunden durchforstet oder das Nutzungsverhalten zu nutzerzentrierten Landkarten verdichtet, will auch selbst von derartigen Techniken protieren, um die eigenen Daten zu analysieren und visuell zu explorieren.

und Dynamisierung der Prozesse dazu, dass selbstoptimierende Verfahren nicht nur bei der Prozesssteuerung und Qualittssicherung entscheidend mitwirken, sondern auch im Bereich Sicherheit und Kundenservice. Insbesondere im Kundendialog entstehen viele unstrukturierte Daten. So ist in den E-Mail-Rckfragen, Supportanfragen oder Beschwerden wie auch in den sozialen Medien, Blogs und Produkttests wertvolles Feedback zu den eigenen Angeboten und der Unternehmenswahrnehmung kodiert. Wozu Big Data im Stande ist, zeigt das Fraunhofer IAIS mit seiner EmotionsMonitoring-Infrastruktur (siehe Abb. 2) Mit intelligenten Verfahren aus dem Technologiestack Smart Semantics knnen Emotionen zu verschiedenen Produkten bzw. Produkteigenschaften identiziert werden. Dafr wurden im genannten Anwendungsfall ber 30 Millionen Postings eines Community-Forums in kurzer Zeit ausgewertet. Wobei nicht einfach auf positiv oder negativ aufgeladene Worte geachtet, sondern der komplexe Sinnzusammenhang jedes Nutzerbeitrages beachtet wurde. Mit entsprechender Visualisierung ist das Resultat fr jeden anschaulich nutzbar. Damit sind die Stimmungen und Meinungen der Kunden nicht nur fr den Kundenservice, die Produktentwicklung oder das Qualittsmanagement verwendbar. Auch das Online-Marketing protiert vom Monitoren der Stimmungslage. Insbesondere im Online-Marketing sehen Branchenvertreter gegenwrtig den individualisierten Transport von Markenkern-Botschaften im Fokus. Am Ende steht ein Social Context Aware Advertising, das dezent begleitet und vor allem punktgenau ins Bewusstsein des Konsumenten rckt.

eCom-Roadmap Big Data


Wo der Mehrwert fr E-Commerce und fr den Versandhandel liegt und welche Herausforderungen und Probleme gesehen werden, wurde von Branchenvertretern und Teilnehmern eines Zukunftsworkshops Big Data am Fraunhofer IAIS diskutiert. Das Ergebnis wurde aufbereitet, gebndelt und zu einer branchenspezischen Roadmap speziell fr den Online- und Versandhandel verdichtet. Die Mglichkeiten, Big Data im E-Commerce zu nutzen, sind hnlich vielfltig wie der Variety-Aspekt bei Big Data. So wnschen sich Entscheider ganzheitliche Lagebilder zur aktuellen Geschftslage mit allen Einussfaktoren und Abhngigkeiten, ergnzt um Trendprognosen und Konsummuster vieler Millionen Menschen. Der gleichzeitige Blick auf Wettbewerb, Warenbestnde, Bestellungen, Kunden und soziale Trends ist fr die ECommerce-Branche von groer Bedeutung. Die Unternehmen versprechen sich gesteigerte Reaktionsfhigkeit und datengesttzte Entscheidungen mit Weitblick. Kurzfristig untersttzen sollen u. a. EchtzeitMonitoring ber die Verfgbarkeit bestimmter Artikel bei verschiedenen Hndlern. Auch der Bereich SaaS/ Outsourcing und Kernkompetenzorientierung bleiben diskutierte Themen. Langfristig fhrt die rasante Vernetzung

Abb. 2: Engineering Emotions mit Smart Semantics auf Big Social Data

TechDivision GmbH

Big Data Vorsprung durch Wissen

16

ber den Erfolg entscheidet am Ende, wer weiterhin verkauft. So werden die Produktprsentationen in OnlineShops zunehmend komplexer und beziehen den Konsumenten mit ein. Die Mglichkeit, ein Foto des Kunden einzufgen, um anzuprobieren, die neue Schrankwand virtuell schon im eigenen Zimmer zu bewundern oder die Information zum Wein im Brillenglas zu lesen dieses Augmented Shopping erfordert Werkzeuge fr das Verarbeiten und Auswerten groer Datenmengen in Echtzeit.

Grundlage der ersten Erkenntnisse ist das weitere Vorgehen zu strukturieren und messbare Erfolgskriterien fr die Fortfhrung des Dachprojektes zu bestimmen. Am Ende wird Big Data Excellence erreicht, wenn ein kontinuierlicher, datengesttzter Verbesserungsprozess in der Wertschpfung etabliert ist.

Big-Data-Werkzeuge
Eine Vielzahl verschiedener Big-Data-Werkzeuge und Technologien steht bereit, die alle auf den Wissensvorsprung in Echtzeit abzielen. Smart Semantics ist ein Technologiebndel, um Social Data zu analysieren. Es kombiniert statistische und linguistische Verfahren, um Inhalte, Meinungen und implizite Beziehungen in geschriebenen Aussagen aufzudecken. Ein Anwendungsbeispiel ist die Verbindung von Kundenfrustration mit CRM und Qualittsmanagement. Mobile Analytics erschliet das Verhalten der Nutzer und liefert Customer Insights. Eingesetzt werden Methoden zur Mustererkennung, regelbasierten Beschreibung von Verhaltensweisen oder Besucherstromanalysen. Die Auenwerbung nutzt Mobile Analytics.

Infobox: Best Practice: Roadmap Big Data


Big Data Excellence erreichen Unternehmen in der Praxis ber ein agiles, iteratives Vorgehen. Das Fundament bildet das Wissen um Big Data und eine unternehmenseigene BigData-Strategie. Aus der strategischen Bedeutung heraus ergibt sich die Notwendigkeit der Untersttzung durch das Management. Fr eine zentrale Fragestellung kann eine vorgelagerte Pilotstudie erste Antworten liefern und Risiken, Mehrwerte und Kosten besser abschtzen lassen. ber die Denition konkreter Use Cases erarbeitet ein interdisziplinres Projektteam einen Proof-of-Concept. Auf

TechDivision GmbH

Big Data Vorsprung durch Wissen

17

Abb. 3: Lambda-Architektur fr Big Data (Quelle: Fraunhofer IAIS)

Visual Analytics setzt den Entscheider ans Steuer. Interaktive Visualisierungstechniken zur Darstellung komplexer Resultate und Echtzeit-Dashboards werden kombiniert mit Ad-hoc-Analysefunktionalitt (z. B. Clustering). Den Grundstein fr Big Data Analytics legt eine exible und skalierbare Architektur. Beispiele wie die LambdaArchitektur von Nathan Marz (siehe Abb. 3) kombinieren die schnelle Analyse einkommender Daten mit komplexeren, weniger zeitkritischen Analysen im Batch. Wie die Architektur mit Softwareprodukten gleich ob kostengnstige Open-Source oder kommerzielle Lsungen instanziiert wird, hngt vom konkreten Setting ab. Dies birgt allerdings auch Gefahren. Alle Entscheidungen im Kontext von Big Data setzen ein umfassendes Verstndnis der Konzepte und Technologien voraus. Nicht jede wenn auch frei nutzbare Lsung ist fr den jeweiligen Zweck geeignet. Es berrascht nicht, dass erste Unternehmen enttuscht von ihren ersten Gehversuchen mit Big Data zurckkehren. Laut einer Innovationspotenzialanalyse (www.bigdata-studie.de) wnschen sich 95% der

Data Scientists die Architekten von Big Data


Die Architekten des Erfolgs sind Data Scientists. Eine Berufsgruppe mit Zukunft. US-Marktforscher Gartner schtzt den Bedarf an Data Scientists weltweit auf ber vier Millionen. Schulungsangebote zum Data Scientist werden deshalb zunehmend angeboten. Fr den Einstieg in Big Data ist es jedoch wichtig, erst einmal von Einzeltechnologien zu abstrahieren und sich modular einzelnen Aspekten wie BigData-Architekturen, Big Data Analytics oder Visual Analytics zu widmen. Anwendungsorientierte Angebote arbeiten direkt in einem Living Lab Big Data, um Technologien und Lsungsanstze anhand praktischer Anwendung anfassbar zu machen und Best Practices zu vermitteln.

Vertrauen in Daten
Weitere Hindernisse fr den Einsatz von Big Data sieht jedes zweite Unternehmen im Bereich Datenschutz & Datensicherheit und dem Setzen der richtigen Prioritten. Dabei sind der Schutz der Privatsphre und das Extrahieren relevanter Informationen fr individuelle Angebote lngst kein Widerspruch mehr. Viele Bedenken bei den Kunden sind urschlich meist auf negative Vorflle oder fehlenden Transparenz zurckzufhren. Offenheit im Umgang mit Big

Unternehmen gezielte Frderung in Form von Best Practices und Trainings, gefolgt von Anbieter- und Lsungsbersichten.

TechDivision GmbH

Big Data Vorsprung durch Wissen

18

Data und gleichzeitig ein striktes Umsetzen des Privacy by Design-Konzeptes machen Datenschutz und Informationssicherheit zum integralen Bestandteil jedes Produktes oder Services. Aber auch die Politik ist gefordert, die Rahmenbedingungen fr einen modernen Datenschutz zu schaffen. Big Data bedeutet aber auch aktive Sicherheit fr den Kunden. Neue Fraud-Mining-Technologien erkennen zuverlssig Betrugsversuche mit Informationen aus Big Data. Der entscheidende Mehrwert entsteht durch die Kombination verschiedener Daten und setzt auf die komplexe Vernetzung der Fakten zu nachvollziehbaren Entscheidungen, warum ein Vorgang als verdchtig eingestuft wurde. Diese Vernetzung und der Einsatz semantischer Verfahren bieten schon heute den Wissensvorsprung in Bezug auf den Wahrheitsgehalt der teils subjektiven oder fehlerhaften Daten.

Fazit
Mit Big Data knnen die Unternehmen auf einen Technologiebaukasten und intelligente Analysewerkzeuge zugreifen, die es ermglichen, datengetriebene Entscheidungen im bergeordneten Kontext zu treffen und gleichzeitig mit Gespr fr den jeweiligen Kunden und dessen Situation berzeugende Angebote zu offerieren. Es ist diese ganzheitliche Sicht, die den Wert von Big Data ausmacht. Mit der Verfgbarkeit von immer mehr Datenbestnden und dem gezielten Erfassen neuer Daten wchst auch Big Data mit seinen Aufgaben. Unternehmen knnen auf Best Practices und umfangreiches Know-how zu Big Data zugreifen. Die Technologien zur Verarbeitung und Auswertung sind kostengnstig nutzbar und Daten knnen in jeglicher Form verarbeitet werden. Alles zusammen bildet die Basis fr neuartige Wertschpfungsmodelle in jeder Branche.

Big Data zwischen Urheberrecht und Datenschutzrecht


Interview mit Dr. Clemens Wass, Rechtsexperte

Big Data steht nicht nur fr groe Datenmengen, sondern auch fr unstrukturierte Informationen aus den verschiedensten Bereichen. Daten werden in krzester Zeit gesammelt, analysiert und ausgewertet. Je grer der Datenberg wird, desto grer ist auch die Gefahr des Missbrauchs und Kontrollverlustes. Big Data Anwendungen haben nicht nur groes Potential fr die Wirtschaft, sondern knnen auch zur Lsung gesellschaftlicher Probleme beitragen. Umfangreiche Daten-Analysen treffen jedoch nur dann auf die Akzeptanz der Verbraucher, wenn der Datenschutz auf hohem Niveau gewhrleistet ist. Wir haben uns mit dem Rechtsexperten Dr. Clemens Wass ber Big Data und die rechtlichen Rahmenbedingungen unterhalten ein Experteninterview.

TechDivision GmbH

Big Data Vorsprung durch Wissen

19

Big Data vs. Privatsphre?


Im Zeitalter groer Datenberge lassen sich ziemlich przise Vorhersagen ber die Eigenschaften von Facebook-Nutzern machen. Egal, wie sehr Facebook die Daten seiner User auch schtzen mag, durch die Kombination aller vorhandenen Daten knnen exakte Prognosen ber einzelne Nutzer gemacht werden das behaupten zumindest viele Daten-Wissenschaftler. Die meisten Menschen denken, aus ihren Facebook-Posts lasse sich nichts Spannendes herauslesen. Aber das stimmt nicht. Data-Wissenschaftler knnen mit diesen Daten sehr wohl etwas anfangen. Indem sie Verbindungen zu ihren Freunden mit bercksichtigen, lassen sich Eigenschaften wie die Intelligenz oder ihre politische Einstellung mit einer bemerkenswerten Przision vorhersagen, so der MITProfessor Erik Brynjolfsson. Der entscheidende Punkt ist es, zwei Datenquellen zusammenzufhren. Dann knnen anonymisierte Daten Personen zugeordnet werden. Unternehmen nutzen diese Kenntnisse bereits, indem sie Gutscheine aufs Handy zusenden und dabei Informationen ber Einkufe im Netz mit Smartphone-Daten zum Aufenthaltsort verschiedener Personen miteinander verknpfen. Laut Aussagen des Daten-Wissenschaftlers Brynjolfsson gibt es bereits eine Reihe von Start-Up Unternehmen, die smtliche ffentliche Informationen ber Menschen sammeln und zu Prolen zusammenfassen. Die Folge ist das Verschwinden von Privatsphre. Bundesverbraucherministerin Ilse Aigner bezeichnete die groen Datenmengen auf dem Safer Internet Day 2013 als das Gold des digitalen Zeitalters. In diesem Zusammenhang sei es auch notwendig, klare Regeln und Grenzen fr die Datennutzung zu denieren. So msse gerade bei Big Data-Anwendungen der Datenschutz bereits im Design bercksichtigt werden und die Selbstbestimmung der Betroffenen gewahrt bleiben, indem Nutzer aktiv einwilligen mssen. Dies wrde vor allem dann gelten, wenn Nutzerprole gebildet werden, so Aigner. Eine Massenauswertung ist nur bei effektiv anonymisierten Daten gerechtfertigt. Laut Aigner reiche es hier nicht, nur Namen zu lschen, denn Bewegungsdaten knnten auch einfach ohne Namen oder Telefonnummer zugeordnet werden, wenn beispielsweise jemand bestimmte Aufenthaltsorte einer Person kennt.

BITKOM-Prsident Prof. Dieter Kempf ergnzte auf der Veranstaltung Safer Internet Day 2013, dass durch die fortschreitende Digitalisierung in den Bereichen Energie, Gesundheit, Verkehr, Bildung und ffentliche Verwaltung das Datenvolumen noch mehr wachsen wird: Der Wert digitaler Infrastrukturen liegt in der sinnvollen, kontrollierten Nutzung von Daten zum Wohl des einzelnen Menschen sowie der Gesellschaft insgesamt. Ilse Aigner fordert, eine EU-Datenschutz-Grundverordnung zgig voran zu bringen und europaweit durchzusetzen, um Verbraucher und Internetnutzer ausreichend schtzen zu knnen. Das Datenschutzrecht msse endlich auch im Informationszeitalter verankert werden und das auf europischer Ebene. Angesichts immer perfekterer Aufzeichnungs- und Analysetechniken sei eine breite Debatte ber den Datenschutz notwendig. So sei es jetzt wichtig, den Rahmen fr Datenschutz und Big Data festzulegen, bevor es zu spt sei, erklrt Aigner.

Experten-Info:
Dr. Clemens Wass, MBL, MBA, ist ausgebildeter Wirtschaftsjurist mit langjhriger Berufserfahrung in internationalen Technologie-Unternehmen. Neben verschiedenen innovativen rechtlichen Projekten ist Dr. Wass Unternehmensberater (Schwerpunkt Innovationsmanagement, geistiges Eigentum und Datenschutz) sowie externer Lektor an der Wirtschaftsuniversitt Wien am Institut fr Entrepreneurship & Innovation.

TechDivision GmbH

Big Data Vorsprung durch Wissen

20

Interview mit Dr. Clemens Wass


TechDivision: Welche rechtlichen Rahmenbedingungen sind zu beachten, wenn mit Big Data gearbeitet wird? Big Data ist ein neuer Begriff, den die Rechtsordnung als solchen nicht kennt. Wie bei vielen Trends wird ber genaue Denitionen in Fachkreisen noch diskutiert. Wenn wir Big Data jedoch simpliziert als eine groe Anhufung von Datenmengen betrachten und uns berlegen, was man mit Daten alles machen kann, wird schnell klar, dass weite Bereiche der Rechtsordnung betroffen sein knnen. Dennoch treten aus der Masse von anwendbaren Normen sicherlich das Datenschutzrecht und das Urheberrecht hervor. Die Situation ist im weitesten Sinn europaweit vergleichbar, da hier eine gewisse Harmonisierung aufgrund einschlgiger Richtlinien existiert. Selbstverstndlich kommen auch etliche verwaltungsrechtliche Vorschriften oder auch das Wettbewerbsrecht hinzu. Viele Fragen sind fr Juristen komplett neu, so wie das Recht hug der Technologie zeitlich hinterherluft. Oft wird erst die Rechtsprechung bei der Auslegung der einzelnen Gesetze in Bezug auf Big Data Gewissheit und Vertrauen schaffen. Jedoch mssen sich Unternehmen dennoch so gut wie irgendwie mglich mit den rechtlichen Aspekten der Thematik auseinandersetzen, um kein unntiges wirtschaftliches oder rechtliches Risiko einzugehen und auch um Kunden nicht zu verrgern. Es sind bereits einige Unternehmen zu beobachten, die gerade das publikumswirksame Thema Datenschutzrecht bei dem es schlielich um den Schutz der Privatsphre eines jeden von uns geht gezielt auch zur Schaffung eines USPs und zu Marketingzwecken einsetzen. Nmlich durch datenschutzkonformen Umgang, der auch klar mitgeteilt wird. TechDivision: Drfen Unternehmen und Entwickler einfach groe Datenmengen nach Lust und Laune auswerten und verwenden? Auch hier ist zuallererst die Frage zu stellen, um welche Daten es sich handelt. Sind es tatschlich die eigenen Daten

eines Unternehmens und sind keine personenbezogenen Daten betroffen, wird es weniger Probleme geben, als wenn die Daten von Dritten stammen und private Informationen ber Menschen enthalten. Ich muss die Privatsphre der Betroffenen achten und ich darf auch aus urheberrechtlicher Sicht nicht einfach die Datenbank eines anderen ohne Genehmigung anzapfen, selbst wenn ich dies technisch ber Schnittstellen knnte. Die Versuchung ist selbstverstndlich gro, alle Daten zu verwenden und auszuprobieren, was man damit machen kann. Die Datenbestnde erscheinen derzeit wie eine groe Kiste mit LEGO Bausteinen und Unternehmen und Entwickler probieren einfach aus, welche innovativen Anwendungen damit geschaffen werden knnen. Nach Lust und Laune geht es allerdings sicher nicht, auch wenn es Spa macht und selbst wenn dabei Wert geschaffen wird. Unternehmen mssen sich im Rahmen der Gesetze bewegen. So lstig gewisse rechtliche Vorschriften auch mitunter erscheinen mgen, letztlich knnen wir doch froh sein, dass diese uns ein gewisses Schutzniveau bieten. Selbst in den USA, wo gerade die Google Brille vorgestellt wird, und wo Datenschutz typischerweise weniger Beachtung ndet als in Europa, wird der Ruf nach rechtlicher Klarheit laut. Persnlich mchte ich nicht, dass mittels Google Brille und Gesichtserkennung sofort jeder auf der Strae beispielsweise meinen Beruf, meine Adresse, meine Telefonnummer und meinen Freundeskreis etc. kennt von sensiblen personenbezogenen Daten, wie etwa Gesundheit, ganz abgesehen. TechDivision: Was geschieht, wenn personenbezogene Daten betroffen sind oder wenn auf fremde Datenbanken zugegriffen wird? Wenn personenbezogene Daten ins Spiel kommen, ndet das Datenschutzrecht Anwendung. Dies kann jedoch unterschiedlich ausgestaltet sein, je nachdem wo der Betreiber seinen Sitz hat und je nachdem welches nationale Recht anwendbar ist. Grundstzlich gilt im Datenschutzrecht: Es ist unzulssig personenbezogene Daten zu verarbeiten, auer wenn ich eine spezielle Rechtfertigung dafr habe, wie etwa eine gesetzliche oder eine vertragliche Ermchtigung. In Kundenbeziehungen ist es daher so, dass der Nutzer der Verarbeitung ausdrcklich zustimmen muss. Zudem kommt, dass der Grundsatz der Sparsamkeit im Umgang mit Daten gilt. Es drfen die Daten

TechDivision GmbH

Big Data Vorsprung durch Wissen

21

wirklich nur fr den Zweck verarbeitet werden, fr den der Nutzer diese zur Verfgung gestellt hat. Natrlich fragt man sich bei der Taschenlampen-App, die man sich fr sein Smartphone heruntergeladen hat, dann schon, warum diese auf die GPS Position zugreifen mchte. Vorteil hier ist, dass Smartphones bei der Installation von Apps zumindest teilweise darauf hinweisen, welche Daten bermittelt werden, was immerhin ein Anfang ist. Wenn ein Unternehmen oder auch ein privater ohne Genehmigung, also ohne jegliche Lizenz, auf fremde Datenbanken zugreift, benden wir uns typischerweise im Leistungsschutzrecht des Urheberrechts. Der Hersteller einer Datenbank, fr die eine wesentliche Investition erforderlich war, hat weitreichende Rechte an seiner Datenbank. Selbstverstndlich kann er den Zugang untersagen, aber auch mitunter angemessenes Entgelt bzw. Schadenersatz fordern. Unter Mitbewerbern kann auch ein Versto gegen das Wettbewerbsrecht vorliegen. Solche Themen sind nicht neu, selbst die Verlinkung von Inhalten kann je nach Ausgestaltung schon eine Ausbeutung der Leistung eines anderen darstellen. TechDivision: Sie fhrten ja auf eigene Initiative eine Befragung mehrerer Unternehmen durch, wie diese mit Daten umgehen. Wie sind Sie vorgegangen und was waren Ihre Ergebnisse? Ich habe im Juli 2011 51 sterreichische Unternehmen und Institutionen kontaktiert, zu denen ich einen persnlichen Bezug hatte, und um Auskunft hinsichtlich der ber mich gespeicherten Daten gebeten. Ich wollte wissen, woher sie die Daten haben, wozu sie die Daten verwenden, an wen sie die Daten weitergeben, ob Daten ins Ausland bermittelt werden, etc. Die Auswahl war umfassend und hat verschiedenste Branchen umfasst, wie etwa meine Banken und Versicherungen, Einzelhandelsunternehmen bei denen ich eine Vorteilskarte habe, meine frheren Arbeitgeber, IT Unternehmen, bei den ich einen Account habe, Telekommunikationsunternehmen etc. Grundlage war der datenschutzrechtliche Auskunftsanspruch, den jeder Brger in der EU gegenber datenverarbeitenden Unternehmen hat. Die Erkenntnisse waren durchaus spannend. Ich hatte eine Rcklaufquote von beachtlichen 95%, was natrlich aber auch daran liegen mag, dass ich Jurist bin und die Anfrage per eingeschriebenem Brief verschickt habe aber immerhin. Die Qualitt der Beantwortung war sehr

unterschiedlich, auch wenn alle beteuert haben, wie wichtig ihnen das Thema ist. Whrend einige sehr professionell geantwortet haben, mitunter sogar unter Hinzuziehung von Datenschutz- und Datensicherheitsexperten, wussten andere noch nicht einmal, dass Nutzer ein solches Auskunftsrecht haben. Nur wenige reagierten beleidigt auf meine Anfrage, der Groteil war sehr interessiert und hat dies zum Anlass genommen, sich besser ber dieses Thema zu informieren. Ein groes und bekanntes Mbelunternehmen hat sogar extra einen Experten engagiert, um Prozesse neu zu organisieren. Hier zahle ich dann auch gerne weiterhin mit meiner Kundenkarte. Durch die Anfrage sind einige falsche oder widersprchliche Informationen aufgetaucht, die ich als Betroffener selbstverstndlich korrigieren lassen kann. Interessant waren fr mich auch vergangene Befunde aus meiner Krankenakte, an die ich mich schon fast nicht mehr erinnern konnte. Bezeichnend war schlielich auch, dass viele Unternehmen gar nicht wussten oder recherchieren konnten, welche Daten sie ber mich haben. Gerade bei einzelnen IT Unternehmen wei ich, dass dort mehr Daten von mir vorhanden sind, weil ich wei, dass ich diese Daten einmal preisgegeben habe. Ich unterstelle den Unternehmen nicht, dass sie dies absichtlich bei der Beantwortung zurckgehalten haben. Ich vermute eher, dass sie einfach selbst nicht immer wissen, wo die Daten sind. Bei der Frage hinsichtlich der bermittlung ins Ausland kamen relativ wenige Antworten, obwohl dies aufgrund von Cloud Services und Informationsverbundsystemen in Konzernen vermutlich deutlich mehr htten sein mssen. TechDivision: Welche Gefahren sehen Sie durch Big Data? Big Data ist klarerweise auch der nchste groe Schritt hin zum glsernen Menschen und zu Utopien wie von Orwell und Huxley. In einer Hollywood Komdie rief ein ehemaliger Agent einmal bei der CIA an und wollte Geheimdienstinformationen ber seinen zuknftigen Schwiegersohn. Die Auskunft wurde ihm verwehrt, aber zugleich wurde er auf eine Internetsuchmaschine verwiesen mit der Aussage: "Wir wissen auch nicht mehr als die!". Und tatschlich: Wenn man sich gewisse Transparenzberichte groer IT Unternehmen ansieht, geht daraus klar hervor, dass die Anfragen von staatlichen Einrichtungen an Internetdienstleister stark ansteigen. Wir alle sind bereits

TechDivision GmbH

Big Data Vorsprung durch Wissen

22

heute wesentlich transparenter als vor der Zeit des Internet. ngste zu schren ist natrlich keine Lsung, aber wir drfen das Thema Privatsphre nicht ignorieren. Weder aus privater noch aus unternehmerischer Sicht. TechDivision: Welche Chancen sehen Sie durch Big Data? Die Analyse von groen Datenmengen bietet ungeheuere Mglichkeiten. Ich bin mir sicher, dass in beinahe jedem Lebensbereich Big Data Analysen mglich sein werden. Es gibt nur weniges, was man nicht messen kann. Und was man messen kann, kann man dank neuer Technologien immer besser analysieren. Dadurch wchst oft der Komfort, es werden neue wissenschaftliche Erkenntnisse erzielt, es wird ein hherer volkswirtschaftlicher Nutzen erzielt, was in einer Wissensgesellschaft natrlich von groer Bedeutung ist. Die Fabriken der Zukunft stehen schon heute in unseren Kpfen oder in unseren Rechenzentren. Wenn ich nur in einen mir nahen Anwendungsbereich, die Rechtsinformatik, sehe, dann kann ich mir vorstellen, dass Big Data zu mehr Transparenz im Recht fhren kann, zu besseren und faireren Entscheidungen, zu einer strkeren direkten Demokratie, und somit letztlich zu mehr Gerechtigkeit. Dieser soll das Recht schlielich dienen. Aber auch hier ist Vorsicht angesagt, etwa beim Schutz von Minderheiten. Denn nur weil eine Million "Likes" zu einem Thema eine Datenbank befllen, heit dies noch lange nicht, dass dies aus einer umfassenden gesellschaftlichen Sicht auch so erwnscht ist. TechDivision: Wie knnen sich Menschen am besten gegen Missbrauch ihrer Daten schtzen? Jeder Mensch muss letztlich fr sich selbst entscheiden, wie er mit dem Schutz seiner Privatsphre umgehen mchte. Je mehr Daten ich preisgebe, desto grer ist das Missbrauchsrisiko. Es kommt aber natrlich auch darauf an, wem ich die Daten gebe. Zum Glck gibt es oft noch die Wahl, obgleich wir den Komfort zunehmend gewohnt werden und nicht mehr darauf verzichten wollen. Ich kann im Supermarkt noch mit Bargeld bezahlen, dann bin ich anonym. Bei Zahlung mit meiner Bankomatkarte lassen sich schon starke Muster erkennen, etwa wo und wieviel ich bei wem einkaufe. Wenn ich dazu noch eine Kundenkarte zum

Sammeln von Punkten verwende, bin ich schon ein sehr glserner Kunde. Wenn ich im Internet neue Cloud Services nutze, verwende ich hug ein Log-In, wodurch auch hier die Transparenz steigt. Wenn ich US-Lsungen verwende, kann dank Patriot Act auch der dortige Geheimdienst mitlesen. Fr Interessierte empehlt es sich, Auskunft- und Richtigstellungsbegehren zu stellen. Dies ist gegenber europischen Datenverarbeitern verhltnismig unkompliziert und kann sehr aufschlussreich sein. Je nach Antwort kann ich dann entscheiden, ob ich zu einem anderen Anbieter wechsle, und dann am besten gleich auch beim alten Datenverarbeiter den Antrag auf Lschung meiner Daten stelle. Ob dies dann tatschlich auch passiert ist eine andere Frage, denn das Problem bei datenschutzrechtlichen Versten ist, dass sie oft unsichtbar sind. Wenn meine Brieftasche gestohlen wird, merke ich es bald. Wenn meine Privatsphre verletzt wird, passiert das oft nur still und heimlich.

Fazit
Laut Prof. Kempf untersttzt die IKT-Branche das Vorhaben der EU, den Datenschutz in Europa auf ein einheitliches Niveau zu bringen. Dabei msse aber verhindert werden, dass die neuen Regelungen eine sinnvolle Nutzung von Daten zu stark einschrnken oder sogar unmglich machen. So besteht die Gefahr, dass die bereits eingegrenzten Freirume fr eine zuverlssige Datenverarbeitung weiter eingeengt werden und mit brokratischen Informations- und Dokumentationspichten berladen werden. Kempf verdeutlicht, dass nur ein sinnvoll eingesetzter Datenschutz Vorteile bringt. In diesem Zusammenhang sei es Aufgabe der Gesetzgeber, Anreize zu schaffen, damit Daten anonymisiert oder verschlsselt verarbeitet werden, um Missbrauch zu verhindern.

TechDivision GmbH

Big Data Vorsprung durch Wissen

23

Big Data und Customer Journey Trume werden wahr...


Thorben Fasching, hmmh

Die Customer Journey in Online Shops wird heute zwar vielfach analysiert, ein wirklicher Mehrwert fr den Kunden entsteht dadurch hug aber nicht. Es hakt nicht selten am richtigen Wissen, um geeignete Ableitungen aus den Analysen zu bilden. Oft knnen mit Untersttzung von kompetenter Seite die vorhandenen Problemstellungen gelst und die Relevanz der Marketingaktivitten deutlich erhht werden.

Sie wissen, dass Ihre Kunden durchschnittlich vier Werbemittelkontakte bentigen, bis diese ihren Kauf abschlieen und dass dieser Prozess in etwa zwei Tage dauert. Welchen Nutzen ziehen Sie aber aus diesen Informationen? Die entsprechenden Datengrundlagen sind meist vorhanden, aber es fehlt an sinnvollen Verwendungsmglichkeiten dafr.

Online-Betrachtung der Customer Journey Analyse weist diese Ketten als abgebrochen aus, obwohl diese Kunden nachweislich Umsatz eingebracht haben. Das Ergebnis: Sie ziehen falsche Schlsse aus diesen Ketten. Ein leider immer noch hug auftretendes Phnomen im Online Marketing ist das Giekannenprinzip. Die Werbebotschaften der Advertiser erreichen die Kunden oftmals zur falschen Zeit am falschen Ort. In welcher Phase sich dieser in der Customer Journey bendet, wird hug nicht mit in die Aussteuerung der Werbemittel miteinbezogen. Die Folge sind Streuverluste und damit verlorenes Budget. Ein prominentes Beispiel ist an dieser Stelle Retargeting. Aus eigener Erfahrung knnen Sie sicherlich von Fllen berichten, in denen Sie online in verschiedenen Online Shops nach bestimmten Produkten recherchiert haben und danach noch wochenlang durch Retargeting-Banner wieder angesprochen wurden dabei haben Sie das Produkt entweder ofine gekauft haben oder das Interesse verloren. In beiden Fllen ist aus Sicht der Advertiser festzustellen: Das investierte Marketingbudget wird in diesem Fall keinen messbaren Return mehr erwirtschaften.

Hrden der Customer Journey


Betrachten wir beispielsweise folgenden Case: Sie sind ein Multichannel Hndler, der sowohl ber einen Online Shop, als auch stationre Ladengeschfte verfgt. Selbstverstndlich bedienen Sie verschiedene Online Marketing Kanle wie SEA, Afliate und weitere. Ihre Kunden kommen nun an verschiedenen Stellen mit den Marketingaktivitten Ihres Unternehmens in Berhrung und bilden damit die jeweilige Customer Journey ab. Doch was passiert mit den Kunden, die sich online ber Ihre Produkte informiert haben und ofine gekauft haben? Die reine

TechDivision GmbH

Big Data Vorsprung durch Wissen

24

Der Fokus der Marketingaktivitten von Unternehmen liegt hug auf Neukundengenerierung. Bereits 2008 stellte Prof. Dr. Gerrit Heinemann in seinem Buch Multi-ChannelHandel: Erfolgsfaktoren und Best Practices fest, dass es bis zu zehn Mal teurer ist, Neukunden zu gewinnen, als Bestandskunden an das Unternehmen zu binden. Aufgrund des immer strker werdenden Wettbewerbs in den Online Marketing Kanlen wird es immer teurer, Neukunden zu generieren und bestehende Kunden werden vernachlssigt. Dabei ist das Potenzial der Bestandskunden hug noch nicht ausgeschpft.

ermglichen, hnlichen Kunden Produktempfehlungen whrend oder nach dem Einkauf auszusprechen. Die gesammelten Daten knnen Sie auch extern zur Online Marketing Steuerung verwenden. Ziel sollte sein, die Customer Journey bestmglich auszugestalten und an jedem Touchpoint mit relevanten Informationen einen echten Mehrwert zu liefern basierend auf historischen Daten hnlicher Kunden (sogenannter Look-alikes) werden die nchsten Touchpoints gewissermaen vorhersagt und darauf aufbauend die passende Werbebotschaft ausgesteuert. Ein denkbares Szenario wre beispielsweise, dass ein Kunde, der an Testberichten zu einem Produkt interessiert ist, gezielt mit Werbebotschaften angesprochen wird, in denen der Advertiser sein Produkt als Testsieger platziert. Diese Relevanzsteigerung der Marketingaktivitten resultiert in einer hheren Efzienz des Marketingbudgets und einem hheren ROI. Der amerikanische RTA-Anbieter Rocket Fuel nennt in einer Case Study eine mgliche ROISteigerung von rund 200% ber einen Zeitraum von drei Jahren. Durch die gezieltere Aussteuerung der Kampagne ein durchaus realistischer Wert! Die derzeit verbreiteten Customer Journey Modelle enden zumeist mit dem Kauf des Produktes. Advertiser sollten aber auch die Touchpoints nach dem Kauf im Auge behalten. Viele Kunden teilen ihre Erfahrungen in sozialen Netzwerken oder auf Bewertungsplattformen. Hier gilt es, diese Bestandskunden zu erkennen, mit ihnen in den Dialog zu treten und von ihnen Feedback zu erhalten. Wie heit es so schn: Nur ein zufriedener Kunde ist ein guter Kunde. Hier wird auch deutlich, dass die Customer Journey nicht mehr als abgeschlossenen Prozess betrachtet werden sollte, sondern als fortlaufenden Kreislauf. Basierend auf den vorherigen Kufen knnen daraufhin die wahrscheinlichen Touchpoints dieses Kunden vorhergesagt und entsprechend optimiert werden. Das permanente Lernen der Software dient der besseren Ausschpfung des Kunden.

Wie knnen diese Herausforderungen durch Big Data Analysen gelst werden?
Um geeignete Schlsse aus den Big Data Analysen fr die Customer Journey zu ziehen, bedarf es zuerst der richtigen Datengrundlage. Das bedeutet, dass ausnahmslos alle Kundendaten, sofern dies datenschutzrechtlich gebilligt ist, intelligent miteinander verknpft werden mssen. Dies schliet sowohl Onsite-, als auch Offsite-Daten von Drittanbietern ein. Nur wenn diese Grundlage geschaffen ist, lassen sich akkurate Schlsse aus diesem Datenberg ziehen. Big Data ermglicht Ihnen, Ihre Kunden besser kennen zu lernen als jemals zuvor. In Zukunft legen Sie keine Zielgruppen a priori mehr fr Ihre Produkte fest, sondern diese basieren auf datengesttzten Analysen. Weiterhin knnen diese Analysen zu dem Ergebnis fhren, dass Sie nicht mehr die groe, relativ unscharfe Zielgruppe denieren, sondern viele Kunden-Cluster mit sehr przise denierten Interessen, da diese am afnsten sind. Optimalerweise lernt die Software mit jedem Kunden dazu. Sie erhalten von allen Kunden Informationen darber, fr welche Produkte sie sich interessiert haben und welche Produkte sie im Verbund gekauft haben. Auch wenn nicht jeder Kunde exakt die selben Interessen hat, lassen sich doch hug Bewegungsmuster erkennen, die Ihnen

Was kann ich tun, um meinen ROI mit Big Data zu steigern?
25

TechDivision GmbH

Big Data Vorsprung durch Wissen

Sowohl Neukunden, als auch Bestandskunden haben diverse Berhrungspunkte mit Ihrem Shop, bevor sie kaufen. Der Blick auf alle Berhrungspunkte des Kunden ermglicht eine gezielte Ansprache im Aftersales-Erlebnis. Dies versetzt Sie in die Lage, Ihren Kunden langfristig als Bestandskunden zu etablieren.

Mit dem reinen Datensammeln ist es allerdings noch nicht getan, denn mit der Analyse beginnt erst die eigentliche Arbeit. Das beste Tool hilft wenig, wenn kein Know-how vorhanden ist, wie dieser Datenwust intelligent genutzt werden kann. Sie brauchen einen Analysten, der Ihr

Geschftsmodell versteht und aus Nutzersicht die richtigen Fragen stellt: Was suchen Ihre Kunden und was kaufen sie? Wie viel Information bentigt der Kunde mini- und maximal auf dem Weg zum Kauf? Welche Hinweise wirken untersttzend nach dem Kauf?

TechDivision GmbH

Big Data Vorsprung durch Wissen

26

Die Antworten auf diese Fragen helfen vorherzusagen, wie sich bestimmte Kundengruppen und -typen entwickeln, fr welche Produkte sie sich in absehbarer Zeit interessieren und, viel wichtiger, wie hoch die Wahrscheinlichkeit des Kaufes ist. Die gesammelten Bewegungs- und Aktivittsdaten knnen zur Erstellung sogenannter business rules dienen. Mit dieser Hilfe knnen Sie personalisierte Informationen auf der eigenen Website oder extern ausspielen. Anbieter wie nugg.ad, aber auch Rocket Fuel, xplosion oder Criteo bieten mit punktgenauer Werbemittelausstrahlung die Mglichkeit, die Relevanz und damit den ROI massiv zu steigern. Um die gesamte Customer Journey inklusive DrittanbieterSeiten abdecken zu knnen, ist es sinnvoll, alle Marketing Aktivitten zentral zu steuern. Dies hat einen einfachen Grund: Nur wenn alle Touchpoints der Customer Journey abgebildet werden, knnen Sie die richtigen Botschaften vermitteln. Verwenden Sie bei der Bewertung der Online Marketing Kanle sogenannte Attributionsmodelle. Dabei wird der Warenkorbwert auf die verschiedenen Touchpoints aufgeteilt und damit ein deutlich realistischerer ROI auf Touchpoint-Ebene ausgewiesen. Sie erhalten nur dann valide Zahlen, wenn Sie alle Berhrungspunkte in der bersicht haben. Die Bewertung und Gewichtung der einzelnen Touchpoints erfolgt nach verschiedenen vorab festgelegten Kriterien wie beispielsweise Verweildauer, Zeitraum zwischen zwei Touchpoints, demograsche oder geograsche Merkmale und Erfahrungswerte aus vorherigen Kufen des Kunden.

Handlungsempfehlungen: Sicherstellen, dass ein lckenloses und fehlerfreies Multichannel Tracking eingerichtet ist Alle Daten, die zur Verfgung stehen, mssen zentral verwaltet und intelligent miteinander verknpft werden In kompetente Untersttzung investieren, die aus Nutzersicht die richtigen Fragen stellt Relevanz der Marketingaktivitten anhand von Touchpoint-Analysen erhhen Bestandskunden besser an das Unternehmen binden und diese auch nach dem Kauf begleiten

Fazit
Viel Potenzial versteckt sich in den Analysedaten der Kunden. Mit der richtigen Strategie knnen Sie sich einen nicht zu unterschtzenden Vorteil gegenber den Mitbewerbern sichern. Die reine Analyse und Auswertung der vorhandenen Daten ist dabei nur eine Station auf dem Weg zum Erfolg. Wichtig sind die richtigen Fragestellungen, um den Mehrwert fr den Nutzer herauszukristallisieren. Die gewonnene Erkenntnis und die damit verbundene ROISteigerung werden den investierten Aufwand in jedem Fall rechtfertigen.

TechDivision GmbH

Big Data Vorsprung durch Wissen

27

Zusammenfassung TechDivision:
Wie sich anhand der unterschiedlichen Expertenartikel und interviews nachvollziehen lsst, ist das Potential von Big Data gro und in Deutschland noch lange nicht ausgeschpft. Aus unternehmerischer Sicht birgt das viel diskutierte Thema sicherlich neue Mglichkeiten und Chancen im E-Commerce-Bereich. Das Fraunhofer Institut IAIS hat drei wichtige Einsatzbereiche fr Big Data in deutschen Unternehmen analysiert: Efziente und vorausschauende Unternehmensfhrung (z.B. Monitoring von Produkten, Transportmitteln sowie Anlagen) Massenindividualisierung auf Grundlage von Kundeninformationen (z.B. individuellere Services fr Kunden) Intelligente Produkte (z.B. Auswertung produktbezogener Daten) Ein Vorteil der Datenauswertung ist beispielsweise im Einzelhandel der bessere berblick darber, wann Produkte verkauft werden und wann diese nachbestellt werden mssen. So gewann zum Beispiel die bayerische Andechser Molkerei Scheitz durch die Datenanalyse die Erkenntnis, dass Kunden an wrmeren Tagen Joghurt-Getrnke bevorzugen. Das wetterabhngige Muster im Kundenverhalten konnte fr die Produktion genutzt werden. Dem Unternehmen war es so mglich vorausschauender und effektiver zu planen. Nach Befragung einiger Unternehmen wird der Big DataNutzen vor allem in der Prognose zur Wirksamkeit von Werbemanahmen, in der Beobachtung der Wahrnehmung einer Marke und in der genaueren Fixierung des Preises gesehen. Die Mglichkeiten von Big Data sind beinahe unbegrenzt. Das komplexe Thema erfordert jedoch neue Kompetenzen, damit Daten richtig analysiert werden und einen Nutzen bringen knnen. So ist es auch fr kleinere und mittlere Unternehmen mglich durch richtig aufbereitete Daten bessere Entscheidungen zu treffen. Die Zukunft wird zeigen, ob sich auch beim Mittelstand Big Data durchsetzen wird. Die aktuelle Studie des Fraunhofer Instituts IAIS Potentialanalyse Big Data in Deutschland zeigt derzeit noch Hemmnisse gegenber Big Data auf: So haben 49 Prozent der deutschen Unternehmen Datenschutz- und Sicherheitsbedenken. Bei 45 Prozent mangelt es an Budget. Unternehmen haben die Potentiale jedoch bereits erkannt und es wird wohl eine Frage der Zeit sein, bis die letzten Hemmnisse berwunden sind.

TechDivision GmbH

Big Data Vorsprung durch Wissen

28

Autorenbersicht:

Josef Willkommer, TechDivision GmbH Als Geschftsfhrer der TechDivision GmbH, einer der fhrenden Magento- und E-CommerceAgenturen im deutschsprachigen Raum, beschftigt sich Josef Willkommer seit vielen Jahren sehr intensiv mit ECommerce und Online-Marketing. Darber hinaus ist er als Chef-Redakteur des eStrategy-Magazins sowie als Autor diverser Fachbeitrge rund um E-Commerce und OnlineMarketing auch journalistisch ttig. Neben diversen Beratungsttigkeiten fr unterschiedlichste Unternehmen trifft man ihn bei diversen Fachkonferenzen auch als Speaker zu E-Commerce- und Online- Marketing-Themen.

Hendrik Stange, Fraunhofer Institit IAIS Hendrik Stange studierte Wirtschaftsinformatik mit den Schwerpunkten Data Mining und Corporate Governance an der Otto- von-Guericke Universitt Magdeburg. Schon frhzeitig befasste er sich mit Spatial Business Intelligence Lsungen fr den Einzelhandel. Seit 2007 ist er Analyst in der Abteilung Knowledge Discovery am Fraunhofer-Institut fr intelligente Informations- und Analysesysteme IAIS und ist dort seit 2009 als Projektleiter ttig. Sein ak- tueller Forschungsschwerpunkt liegt im Bereich Big Data Analytics und im Spezialgebiet Reality Monitoring. Er untersttzt Unternehmen im strategischen Umgang mit dem wettbewerbs- entscheidenden Rohstoff Daten auf dem Weg zu Data-driven Enterprises.

Experteninterview: Dr. Michael May, Fraunhofer Institut IAIS Dr. May leitet seit 1998 die Abteilung Knowledge Discovery am Fraunhofer IAIS, die sich mit den Themen Data Mining, Maschinelles Lernen und Big Data befasst. Er leitet derzeit eine Anzahl von Big Data Projekten in Forschung und Wirtschaft und war fr die vom deutschen Wirtschaftsministerium gefrderte Potentialanalyse Big Data in Deutschland verantwortlich. Seine Forschungsschwerpunkte sind derzeit die Data-MiningAnalyse von verteilten Data Streams sowie die Analyse von Telekommunikations- und Mobilittsdaten. Interview und Umsetzung des Artikels: Dominik Haller, TechDivision GmbH

Experteninterview: Dr. Clemens Wass, Rechtsexperte Dr. Clemens Wass, MBL, MBA, ist ausgebildeter Wirtschaftsjurist mit langjhriger Berufserfahrung in internationalen TechnologieUnternehmen. Neben verschiedenen innovativen rechtlichen Projekten ist Dr. Wass Unternehmensberater (Schwerpunkt Innovationsmanagement, geistiges Eigentum und Datenschutz) sowie externer Lektor an der Wirtschaftsuniversitt Wien am Institut fr Entrepreneurship & Innovation. Interview und Umsetzung des Artikels: Dominik Haller, TechDivision GmbH

Thorben Fasching, hmmh Thorben Fasching steuert seit 2007 den Bereich Marketing & User Experience der hmmh. In dieser Funktion treibt er auch die Geschftsentwicklung der Agentur voran. Daneben ist er stellvertretender Vorsitzender der Fachgruppe E-Commerce im Bundesverband Digitale Wirtschaft (BVDW) e.V.

TechDivision GmbH

Big Data Vorsprung durch Wissen

29

TechDivision ist ein etablierter E-Commerce Solution Partner und untersttzt seit vielen Jahren nationale und internationale Kunden in der integrierten Planung, Design und Implementierung von komplexen E-Commerce-Lsungen. Als Magento Gold Partner der ersten Stunde, gehrt TechDivision zu den fhrenden Magento Solution Partnern in Europa. Mittelgroe Kunden und internationale Unternehmen wie WMF oder Ritter-Sport, vertrauen auf die Kompetenz und Erfahrung von TechDivision. Derzeit hat TechDivision zwei Standorte in Rosenheim / Kolbermoor und Mnchen.

TechDivision GmbH Spinnereiinsel 3a 83059 Kolbermoor Telefon: +49 8031 2210 55 - 0 Telefax: +49 8031 2210 55 - 22 Balanstr. 73 Haus 8, 3. OG 81541 Mnchen Telefon +49 89 4161 4787 - 0 Ansprechpartner: Josef Willkommer j.willkommer@techdivision.com www.techdivision.com

TechDivision GmbH

Big Data Vorsprung durch Wissen

30