Professional Documents
Culture Documents
Big Data McKinsey
Big Data McKinsey
lipnja 2011
MGI vode tri direktora McKinsey & Company: Richard Dobbs, James Manyika i Charles
Roxburgh. Susan Lund radi kao MGI-jeva direktorica istraživanja. MGI projektne
timove vodi skupina starijih suradnika i uključuju konzultante iz McKinseyevih ureda
diljem svijeta. Ovi se timovi oslanjaju na McKinseyjevu globalnu mrežu stručnjaka i
partnera iz industrije i upravljanja.
Osim toga, MGI surađuje s vodećim ekonomistima, uključujući nobelovce, koji djeluju
kao savjetnici za MGI projekte.
Partneri McKinsey & Company financiraju MGI-jevo istraživanje koje nije naručila
nijedna tvrtka, vlada ili druga institucija.
svibnja 2011
James Manyika
Michael Chui
Brad Brown
Jacques Bughin
Richard Dobbs
Charles Roxburgh
Angela Hung Byers
Machine Translated by Google
Predgovor
Količina podataka u našem svijetu eksplodira. Tvrtke hvataju trilijune bajtova informacija o svojim
klijentima, dobavljačima i operacijama, a milijuni umreženih senzora ugrađeni su u fizički svijet
u uređaje kao što su mobilni telefoni i automobili, detektirajući, stvarajući i prenoseći podatke.
Pitanje je što ta pojava znači. Je li proliferacija podataka samo dokaz sve nametljivijeg svijeta?
Ili veliki podaci mogu imati korisnu ekonomsku ulogu? Dok je većina dosadašnjih istraživanja
velikih podataka bila usredotočena na pitanje njihovog obujma, naša studija tvrdi da su poslovne
i ekonomske mogućnosti velikih podataka i njihove šire implikacije važna pitanja s kojima se moraju
pozabaviti poslovni čelnici i kreatori politike. Kako bi informirala raspravu, ova studija ispituje
potencijalnu vrijednost koju veliki podaci mogu stvoriti za organizacije i sektore gospodarstva te
nastoji ilustrirati i kvantificirati tu vrijednost. Također istražujemo što čelnici organizacija i kreatori
politika trebaju učiniti kako bi to uhvatili.
James Manyika i Michael Chui vodili su ovaj projekt, blisko surađujući s Bradom Brownom,
Jacquesom Bughinom i Richardom Dobbsom. Charles Roxburgh također je dao vrijedan doprinos.
Angela Hung Byers vodila je projektni tim koji su činili Markus Allesch, Alex Ince-Cushman, Hans
Henrik Knudsen, Soyoko Umeno i JiaJing Wang. Martin N. Baily, viši savjetnik McKinseyja i viši
suradnik na Institutu Brookings, i Hal R. Varian, profesor emeritus na Školi informacija, Poslovnoj
školi Haas i Odjelu za ekonomiju na Kalifornijskom sveučilištu u Berkeleyju. , i glavni ekonomist
u Googleu, bili su akademski savjetnici u ovom radu. Također smo zahvalni na doprinosu Eriku
Brynjolfssonu, profesoru obitelji Schussel na MIT Sloan School of Management i direktoru MIT
Centra za digitalno poslovanje, i Andrewu McAfeeju, glavnom istraživaču u MIT Centru za digitalno
poslovanje.
Tim također cijeni doprinos koji je dala naša akademska istraživačka suradnja s Global
Information Industry Center (GIIC) na Kalifornijskom sveučilištu u San Diegu, čiji je cilj bio
postići bolje razumijevanje generiranja podataka u zdravstvu i javnom sektoru, kao i kao u
području osobnih podataka o lokaciji. Zahvalni smo Rogeru E. Bohnu, profesoru menadžmenta
i direktoru na GIIC-u, i Jamesu E. Shortu, direktoru istraživanja Centra, glavnim istraživačima,
kao i studentima diplomskog studija Coralie Bordes, Kylie Canaday i Johnu Petrequinu.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost
Ovo izvješće pridonosi misiji MGI-a da pomogne globalnim čelnicima da razumiju sile koje
transformiraju globalno gospodarstvo, poboljšaju učinak tvrtke i rade na boljim nacionalnim i
međunarodnim politikama. Kao i sa svim MGI istraživanjima, želimo naglasiti da je ovaj rad
neovisan i da ga nije naručila niti na bilo koji način sponzorirala bilo koja tvrtka, vlada ili druga
institucija.
Richard Dobbs
James Manyika
Direktor, McKinsey Global Institute
San Francisco
Charles Roxburgh
Direktor, McKinsey Global Institute
London
Susan Lund
lipnja 2011
Machine Translated by Google
vi
40%
predviđeni rast
generiranih globalnih podataka
5%
godišnje vs.
rast u globalu
IT potrošnja
15 od 17
sektori u Sjedinjenim Državama imaju
više pohranjenih podataka po tvrtki
nego Kongresna knjižnica SAD-a
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost vii
140.000–190.000
dublje pozicije analitičkog talenta i
1.5 milijun
potrebno je više menadžera koji
razumiju podatke kako bi u potpunosti
iskoristili velike podatke u Sjedinjenim Državama
Machine Translated by Google
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost
Sadržaj
Izvršni sažetak 1
dodatak 123
Bibliografija 137
Machine Translated by Google
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 1
Izvršni sažetak
"Veliki podaci" odnose se na skupove podataka čija veličina nadilazi sposobnost tipičnih
softverskih alata za baze podataka za snimanje, pohranu, upravljanje i analizu. Ova je
definicija namjerno subjektivna i uključuje pokretnu definiciju o tome koliko skup podataka
treba biti velik da bi se smatrao velikim podacima—tj. ne definiramo velike podatke u smislu
da su veći od određenog broja terabajta (tisuća gigabajta ). Pretpostavljamo da će se, kako
tehnologija s vremenom bude napredovala, povećavati i veličina skupova podataka koji se
kvalificiraju kao veliki podaci. Također imajte na umu da se definicija može razlikovati
ovisno o sektoru, ovisno o tome koje su vrste softverskih alata uobičajeno dostupne i koje su
veličine skupova podataka uobičajene u određenoj industriji.
Uz ta upozorenja, veliki podaci u mnogim će se sektorima danas kretati od nekoliko
desetaka terabajta do više petabajta (tisuće terabajta).
Sama po sebi, velika količina podataka je globalni fenomen - ali što to znači?
Mnogi građani diljem svijeta s dubokom sumnjom gledaju na ovo prikupljanje informacija,
doživljavajući poplavu podataka ništa više od zadiranja u njihovu privatnost.
Ali postoje snažni dokazi da veliki podaci mogu igrati značajnu gospodarsku ulogu u korist
ne samo privatne trgovine nego i nacionalnih gospodarstava i njihovih građana. Naše
istraživanje otkriva da podaci mogu stvoriti značajnu vrijednost za svjetsko gospodarstvo,
povećavajući produktivnost i konkurentnost tvrtki i
1 Vidi “Posebno izvješće o upravljanju informacijama: Podaci, podaci posvuda,” The Economist,
25. veljače 2010.; i posebno izdanje o “Radu s podacima,” Science, 11. veljače 2011.
2 "Internet stvari" odnosi se na senzore i aktuatore ugrađene u fizičke objekte, povezane
mrežama do računala. Vidi Michael Chui, Markus Löffler i Roger Roberts, “The Internet of
Things”, McKinsey Quarterly, ožujak 2010.
Machine Translated by Google
Mnogo je načina na koje se veliki podaci mogu koristiti za stvaranje vrijednosti u različitim
sektorima globalnog gospodarstva. Doista, naše istraživanje sugerira da smo na pragu
ogromnog vala inovacija, produktivnosti i rasta, kao i novih načina natjecanja i osvajanja
vrijednosti—sve potaknuto velikim podacima dok potrošači, tvrtke i gospodarski sektori
iskorištavaju njihov potencijal . Ali zašto bi to sada bio slučaj? Nisu li podaci uvijek bili dio
utjecaja informacijske i komunikacijske tehnologije?
Da, ali naše istraživanje sugerira da su opseg i opseg promjena koje donose veliki podaci
na prekretnici, da će se znatno proširiti, kako se niz tehnoloških trendova ubrzava i
približava. Već vidimo vidljive promjene u gospodarskom krajoliku kao rezultat ove
konvergencije.
Mnoge pionirske tvrtke već koriste velike podatke za stvaranje vrijednosti, a druge moraju
istražiti kako mogu učiniti isto ako se žele natjecati. I vlade imaju značajnu priliku povećati
svoju učinkovitost i vrijednost za novac
3 Mooreov zakon, koji je prvi opisao Intelov suosnivač Gordon Moore, navodi da broj
tranzistora koji se mogu smjestiti na integrirani krug udvostručuje otprilike svake dvije godine.
Drugim riječima, količina računalne snage koja se može kupiti za isti iznos novca udvostručuje
se svake dvije godine. Računalstvo u oblaku odnosi se na mogućnost pristupa visoko skalabilnim
računalnim resursima putem Interneta, često po nižim cijenama od onih potrebnih za instalaciju
na vlastitim računalima jer se resursi dijele među mnogim korisnicima.
4 Kevin Kelly, Web 2.0 Expo i konferencija, 29. ožujka 2011. Videozapis dostupan na:
www.web2expo.com/webexsf2011/public/schedule/proceedings.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 3
Ovo izvješće nastoji razumjeti stanje digitalnih podataka, kako različite domene
mogu koristiti velike skupove podataka za stvaranje vrijednosti, potencijalnu
vrijednost među dionicima i implikacije za čelnike kompanija u privatnom sektoru i
organizacija javnog sektora, kao i za kreatore politike. Nadopunili smo našu analizu velikih
podataka u cjelini detaljnim ispitivanjem pet domena (zdravstvo u Sjedinjenim Državama,
javni sektor u Europi, maloprodaja u Sjedinjenim Državama te podaci o proizvodnji i
osobnoj lokaciji na globalnoj razini). Ovo istraživanje nipošto ne predstavlja posljednju
riječ o velikim podacima; umjesto toga, vidimo ga kao početak. U potpunosti predviđamo
da je ovo priča koja će se nastaviti razvijati kako se razvijaju tehnologije i tehnike koje
koriste velike podatke, a podaci, njihova upotreba i njihova ekonomska korist rastu (uz
povezane izazove i rizike). Za sada, međutim, naše istraživanje daje sedam ključnih uvida:
PROIZVODNJA
5 Vidi Peter Lyman i Hal Varian, Koliko informacija? 2003., Škola informatike
Upravljanje i sustavi, Kalifornijsko sveučilište u Berkeleyu, 2003.; radovi iz istraživačkog projekta IDC Digital
Universe, sponzoriranog od strane EMC-a, uključujući The expanding digital universe, ožujak 2007.; Raznolik i
rastući digitalni svemir, ožujak 2008.; Kako se ekonomija smanjuje, digitalni svemir se širi, svibanj 2009., i
Desetljeće digitalnog svemira—Jeste li spremni?, svibanj 2010. (www.emc.com/leadership/programs/digital-
universe.htm); dvije bijele knjige sa Sveučilišta Kalifornija, San Diego, Global Information Industry Center: Roger
Bohn i James Short, Koliko informacija? 2009.: Izvješće o američkim potrošačima, siječanj 2010., i Roger Bohn,
James Short i Chaitanya Baru, Koliko informacija? 2010.: Izvješće o informacijama o poslužitelju poduzeća, siječanj
2011.; i Martin Hilbert i Priscila López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje
informacija,” Science, 10. veljače 2011.
6 Prema web stranici Kongresne knjižnice, Kongresna knjižnica SAD-a imala je 235 terabajta
skladištenja u travnju 2011.
Machine Translated by Google
Veliki podaci sada su dosegli svaki sektor u globalnom gospodarstvu. Kao i drugi bitni
čimbenici proizvodnje kao što su čvrsta imovina i ljudski kapital, veliki dio moderne
ekonomske aktivnosti jednostavno se ne bi mogao odvijati bez njega. Procjenjujemo da su do
2009. godine gotovo svi sektori u američkom gospodarstvu imali barem prosječno 200
terabajta pohranjenih podataka (dvostruko više od skladišta podataka američkog trgovca
Wal-Marta 1999.) po tvrtki s više od 1000 zaposlenika. Mnogi su sektori imali više od 1 petabajta
prosječno pohranjenih podataka po tvrtki. Ukupno, europske organizacije imaju oko 70 posto
kapaciteta za pohranu u čitavim Sjedinjenim Državama s gotovo 11 egzabajta u usporedbi s
više od 16 egzabajta u 2010. S obzirom na to da su europska gospodarstva slična jedna drugoj
u smislu stupnja razvoja, a time i distribucije tvrtki, vjerujemo da prosječna tvrtka u većini
industrija u Europi ima dovoljno kapaciteta za pohranu i manipuliranje velikim podacima.
Nasuprot tome, intenzitet podataka po glavi stanovnika u drugim je regijama puno niži. To
sugerira da će, barem u kratkom roku, najveći potencijal za stvaranje vrijednosti korištenjem
velikih podataka biti u najrazvijenijim gospodarstvima. Međutim, gledajući unaprijed, postoji
ogroman potencijal za iskorištavanje velikih podataka u gospodarstvima u razvoju sve dok
postoje pravi uvjeti. Uzmite u obzir, na primjer, činjenicu da je Azija već vodeća regija za
generiranje osobnih podataka o lokaciji jednostavno zato što se tamo koristi toliko mnogo
mobilnih telefona. Više mobilnih telefona—procjenjuje se da je 2010. bilo 800 milijuna uređaja
—u upotrebi je u Kini nego u bilo kojoj drugoj zemlji. Nadalje, neke pojedinačne tvrtke u regijama
u razvoju mogle bi biti daleko naprednije u korištenju velikih podataka nego što to prosjeci
sugeriraju. A neke će organizacije iskoristiti mogućnost pohranjivanja i obrade podataka na
daljinu.
Identificirali smo pet široko primjenjivih načina za iskorištavanje velikih podataka koji
nude transformacijski potencijal za stvaranje vrijednosti i imaju implikacije na način na koji će
organizacije morati biti dizajnirane, organizirane i upravljane. Na primjer, u svijetu u kojem je
moguće eksperimentiranje velikih razmjera, kako će se korporativne marketinške funkcije i
aktivnosti morati razvijati? Kako će se promijeniti poslovni procesi i kako će tvrtke vrednovati i
iskoristiti svoju imovinu (osobito podatkovnu imovinu)? Može li pristup tvrtki i sposobnost analize
podataka potencijalno dati veću vrijednost od robne marke? Koji će postojeći poslovni modeli
vjerojatno biti poremećeni? Na primjer, što se događa s industrijama koje se temelje na asimetriji
informacija – npr. raznim vrstama brokera – u svijetu radikalne transparentnosti podataka? Kako
će se postojeće tvrtke povezane s naslijeđenim poslovnim modelima i infrastrukturom natjecati s
agilnim novim napadačima koji su u stanju brzo obraditi i iskoristiti detaljne podatke o
potrošačima koji brzo postaju dostupni, npr. što govore na društvenim medijima ili što senzori
izvještavaju da rade u svijet? I što se događa kada se višak počne pomicati iz
7 Za drugu usporedbu generiranja podataka u odnosu na pohranu, vidi John F. Gantz, David Reinsel,
Christopher Chute, Wolfgang Schlichting, John McArthur, Stephen Minton, Irida Xheneti, Anna
Toncheva i Alex Manfrediz, "The expanding digital universe", IDC white paper, sponzoriran od
strane EMC-a, ožujak 2007.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 5
Stvaranje transparentnosti
organizacije mogu prikupljati preciznije i detaljnije podatke o izvedbi (u stvarnom ili gotovo
stvarnom vremenu) o svemu, od zaliha proizvoda do bolovanja osoblja . IT organizacijama
omogućuje instrumentiranje procesa i zatim postavljanje kontroliranih eksperimenata.
Korištenje podataka za analizu varijabilnosti u izvedbi – one koja se javlja prirodno ili je
generirana kontroliranim eksperimentima – i razumijevanje njezinih temeljnih uzroka može
omogućiti vođama da upravljaju izvedbom na višim razinama.
i otkriti vrijedne uvide koji bi inače ostali skriveni. Takva analitika ima aplikacije za organizacije
iz poreznih agencija koje mogu koristiti automatizirane mehanizme rizika za označavanje
kandidata za daljnje ispitivanje trgovcima na malo koji mogu koristiti algoritme za optimizaciju
procesa odlučivanja kao što je automatsko fino podešavanje zaliha i cijena kao odgovor na
informacije u stvarnom vremenu. trgovina i online prodaja. U nekim slučajevima odluke neće
nužno biti automatizirane, već će biti proširene analizom ogromnih, cijelih skupova podataka
korištenjem tehnika i tehnologija velikih podataka, a ne samo manjih uzoraka s kojima pojedinci
s proračunskim tablicama mogu rukovati i razumjeti ih. Donošenje odluka možda nikada neće
biti isto; neke organizacije već donose bolje odluke analizirajući čitave skupove podataka kupaca,
zaposlenika ili čak senzora ugrađenih u proizvode.
Big data omogućuje tvrtkama stvaranje novih proizvoda i usluga, poboljšanje postojećih i
osmišljavanje potpuno novih poslovnih modela. Proizvođači koriste podatke dobivene
korištenjem stvarnih proizvoda kako bi poboljšali razvoj sljedeće generacije proizvoda i stvorili
inovativne ponude usluga nakon prodaje. Pojava podataka o lokaciji u stvarnom vremenu
stvorila je potpuno novi skup lokacija-
Machine Translated by Google
Korištenje velikih podataka postaje ključni način za vodeće tvrtke da nadmaše svoje
konkurente. Na primjer, procjenjujemo da trgovac na malo koji prihvaća velike podatke ima
potencijal povećati svoju operativnu maržu za više od 60 posto. Vidjeli smo kako vodeći trgovci
na malo kao što je Tesco iz Ujedinjenog Kraljevstva koriste velike podatke kako bi osvojili
tržišni udio od svojih lokalnih konkurenata, a mnogi drugi primjeri obiluju industrijama kao
što su financijske usluge i osiguranje. U svim sektorima, očekujemo da ćemo vidjeti povećanje
vrijednosti za vodeće korisnike velikih podataka nauštrb onih koji zaostaju, trend za koji su
dokazi u nastajanju sve jači.8 Lideri koji razmišljaju naprijed mogu početi agresivno graditi
kapacitete svojih organizacija za velike podatke. Ovaj napor će potrajati, ali učinak razvoja
nadmoćnog kapaciteta za iskorištavanje velikih podataka donijet će poboljšanu konkurentsku
prednost na duge staze i stoga je vrijedan ulaganja u stvaranje ove sposobnosti. Ali vrijedi i
obrnuto. U svijetu velikih podataka, konkurent koji ne uspije dovoljno razviti svoje sposobnosti bit
će zaostao.
Veliki podaci također će pomoći u stvaranju novih prilika za rast i potpuno novih kategorija
tvrtki, poput onih koje prikupljaju i analiziraju podatke o industriji. Mnoge od njih bit će tvrtke
koje se nalaze usred velikih tokova informacija gdje se podaci o proizvodima i uslugama,
kupcima i dobavljačima te preferencijama i namjerama potrošača mogu uhvatiti i analizirati.
Primjeri će vjerojatno uključivati tvrtke koje se povezuju s velikim brojem potrošača koji
kupuju širok raspon proizvoda i usluga, tvrtke koje omogućuju globalne opskrbne lance,
tvrtke koje obrađuju milijune transakcija i one koje pružaju platforme za potrošačka digitalna
iskustva. To će biti poduzeća s prednostima velikih podataka. Više tvrtki naći će se u nekoj vrsti
velike podatkovne prednosti nego što bi se moglo na prvi pogled pomisliti. Mnoge tvrtke imaju
pristup vrijednim skupovima podataka koje generiraju njihovi proizvodi i usluge. Mreže će čak
povezivati fizičke proizvode, omogućujući tim proizvodima da prijave svoje vlastite serijske
brojeve, datume isporuke, broj korištenja i tako dalje.
Neke od ovih prilika stvorit će nove izvore vrijednosti; drugi će uzrokovati velike promjene
vrijednosti unutar industrija. Na primjer, pružatelji medicinskih kliničkih informacija, koji
prikupljaju podatke i provode analize potrebne za poboljšanje učinkovitosti zdravstvene
skrbi, mogli bi se natjecati na tržištu vrijednom više od 10 milijardi USD do 2020. Rani
pokretači koji osiguravaju pristup podacima potrebnim za stvaranje vrijednosti vjerojatno će
izvući najveću korist (vidi okvir 2, "Kako mjerimo vrijednost velikih podataka?"). Sa stajališta
konkurentnosti i potencijalnog stvaranja vrijednosti, sve tvrtke trebaju ozbiljno shvatiti velike
podatke. U većini industrija, etablirani konkurenti i novi sudionici podjednako će iskoristiti
strategije temeljene na podacima za inovacije, natjecanje i osvajanje vrijednosti. Doista,
pronašli smo prve primjere takve upotrebe podataka u svakom sektoru koji smo ispitali.
8 Erik Brynjolfsson, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako
donošenje odluka vođeno podacima utječe na izvedbu poduzeća?, 22. travnja 2011., dostupno na SSRN
(ssrn. com/abstract=1819486).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 7
Kad smo krenuli u procjenu potencijala velikih podataka za stvaranje vrijednosti, uzeli
smo u obzir samo one radnje koje u biti ovise o upotrebi velikih podataka – tj. radnje u
kojima je upotreba velikih podataka nužna (ali obično nije dovoljna) za izvršenje
posebna poluga. Nismo uključili vrijednost poluga koje se sastoje samo od
automatizacije, ali ne uključuju velike podatke (npr. povećanje produktivnosti zamjenom
bankomata bankomatima). Također imajte na umu da uključujemo bruto vrijednost
poluga koje zahtijevaju korištenje velikih podataka. Nismo pokušali procijeniti relativni
doprinos velikih podataka vrijednosti koju generira određena poluga, već smo procijenili
ukupnu stvorenu vrijednost.
U pet domena koje smo proučavali identificirali smo mnoge poluge velikih podataka koje će,
po našem mišljenju, poduprijeti značajan rast produktivnosti (Prikaz 1). Ove prilike imaju
potencijal poboljšati učinkovitost i djelotvornost, omogućujući organizacijama da učine više
s manje i proizvedu kvalitetnije rezultate, tj. povećaju sadržaj dodane vrijednosti proizvoda i
usluga.9 Na primjer, otkrili smo da tvrtke mogu iskoristiti podatke dizajnirati proizvode koji
bolje odgovaraju potrebama kupaca. Podaci se čak mogu iskoristiti za poboljšanje proizvoda
dok se koriste. Primjer je mobilni telefon koji je naučio navike i preferencije svog vlasnika, koji
sadrži aplikacije i podatke prilagođene potrebama tog određenog korisnika, te će stoga biti
vrjedniji od novog uređaja koji nije prilagođen potrebama korisnika.10 Snimanje ovog
potencijal zahtijeva inovacije u operacijama i procesima. Primjeri uključuju povećanje
donošenja odluka—od kliničke prakse do poreznih revizija—s algoritmima kao i stvaranjem
inovacija u proizvodima i uslugama, kao što je ubrzavanje razvoja novih lijekova korištenjem
napredne analitike i stvaranje nove, proaktivne usluge održavanja automobila nakon prodaje
putem korištenje umreženih senzora. Tvorci politika koji razumiju da je ubrzanje produktivnosti
unutar sektora ključna poluga za povećanje životnog standarda u njihovim gospodarstvima u
cjelini trebaju olakšati način organizacijama da iskoriste prednosti velikih podatkovnih poluga
koje povećavaju produktivnost.
Također nalazimo opći obrazac u kojem korisnici, potrošači i građani hvataju veliku količinu
ekonomskog viška koji omogućavaju veliki podaci – oni su i izravni i neizravni korisnici
inovacija povezanih s velikim podacima.11 Na primjer, korištenje velikih podataka podaci
mogu omogućiti poboljšane zdravstvene ishode, kvalitetniji građanski angažman s vladom,
niže cijene zbog transparentnosti cijena i bolju usklađenost između proizvoda i potreba
potrošača. Očekujemo da će se ovaj trend prema povećanom potrošačkom višku nastaviti
i ubrzati u svim sektorima kako budu koristili velike podatke. Uzmimo područje osobnih
podataka o lokaciji kao ilustraciju. U ovom području, korištenje prometnih informacija u
stvarnom vremenu za informiranje navigacije stvorit će mjerljivi potrošački višak kroz
10 Hal Varian opisao je sposobnost proizvoda da iskoriste podatke za poboljšanje s korištenjem kao
“kaizen proizvoda.” Vidi Hal Varian, Računalno posredovane transakcije, Ely predavanje 2010. na
sastanku Američkog ekonomskog udruženja, Atlanta, Georgia.
Prikaz 1
Maloprodaja Proizvodnja Do 50
u SAD- u Moguće povećanje neto posto smanjenje u razvoju proizvoda,
marže od 60+% 0,5–1,0 posto troškovi montaže Do 7 posto
godišnjeg rasta produktivnosti smanjenje obrtnog kapitala
12 Indeks se sastoji od pet metrika koje su osmišljene kao zamjene za označavanje (1) količine
podaci dostupni za korištenje i analizu; (2) varijabilnost u izvedbi; (3) broj dionika (kupaca i
dobavljača) s kojima organizacija u prosjeku posluje; (4) intenzitet transakcije; i (5) turbulencija
svojstvena sektoru. Vjerujemo da su to karakteristike zbog kojih je više ili manje vjerojatno da
će sektor iskoristiti pet transformativnih prilika za velike podatke. Za više detalja pogledajte
dodatak.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 9
Prikaz 2
Grozd A Grozd D
Neki su sektori pozicionirani za veće dobitke od upotrebe
Grozd B Grozd E
velikih podataka. Povijesni rast produktivnosti u Sjedinjenim
Grozd C
Državama, 2000. – 2008. % 24,0
Veličine mjehurića
označavaju relativne veličine BDP-a
23.5
23.0
22.5
Računalni i elektronički proizvodi
Informacija
9.0
-2,0
Druge usluge Obrazovne usluge
-2.5
-3,0 Izgradnja
-3.5
Niska visoko
Indeks potencijalnih vrijednosti velikih podataka1
1 Pogledajte dodatak za detaljne definicije i metriku koja se koristi za indeks potencijala vrijednosti.
IZVOR: Američki ured za statistiku rada; Analiza McKinsey Global Institute
Dok će svi sektori morati prevladati prepreke kako bi uhvatili vrijednost od korištenja
velikih podataka, prepreke su strukturno veće za neke nego za druge (Prikaz 3). Na primjer,
javni sektor, uključujući obrazovanje, suočava se s većim preprekama zbog nedostatka
mentalnog sklopa koji se temelji na podacima i dostupnih podataka. Hvatanje vrijednosti u
zdravstvu suočava se s izazovima s obzirom na relativno niska ulaganja u informatičku
tehnologiju do sada. Sektori kao što su maloprodaja, proizvodnja i profesionalne usluge mogu
imati relativno niže razine prepreka koje moraju prevladati upravo iz suprotnih razloga.
Machine Translated by Google
10
Prikaz 3
Ukupni
indeks
Sektori lakoće Način razmišljanja
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Financije i osiguranje
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
PODATAKA
Prikaz 4
180 30
300
50–60% razlike
u odnosu na
ponudu iz 2018
150
2008 Diplomanti Ostali1 2018 ponuda Talent gap 2018 projicirana potražnja
zaposlenje s dubokim
analitičkim
talentom
1 Ostali pokretači ponude uključuju odljev (-), useljavanje (+) i ponovno zapošljavanje prethodno nezaposlenih duboko analitičkih talenata (+).
IZVOR: Američki ured za statistiku rada; Popis stanovništva SAD-a; Dun & Bradstreet; razgovori s tvrtkama; Analiza McKinsey Global Institute
Politike podataka. Kako se sve veća količina podataka digitalizira i putuje preko
organizacijskih granica, postoji niz pitanja politike koja će postati sve važnija, uključujući, ali ne
ograničavajući se na privatnost, sigurnost, intelektualno vlasništvo i odgovornost. Jasno je da je
privatnost pitanje čija važnost, osobito za potrošače, raste kako vrijednost velikih podataka postaje
očiglednija. Osobni podaci kao što su zdravstveni i financijski podaci često su oni koji mogu ponuditi
najznačajnije ljudske koristi, poput pomoći u određivanju pravog medicinskog tretmana ili
najprikladnijeg financijskog proizvoda. Međutim, potrošači te kategorije podataka također
smatraju najosjetljivijima. Jasno je da će se pojedinci i društva u kojima žive morati uhvatiti u
koštac s kompromisima između privatnosti i korisnosti.
Drugo usko povezano pitanje je sigurnost podataka, npr. kako zaštititi konkurentske osjetljive
podatke ili druge podatke koji bi trebali biti privatni. Nedavni primjeri pokazali su da povrede
podataka mogu razotkriti ne samo osobne podatke potrošača i povjerljive korporativne
informacije, već čak i tajne nacionalne sigurnosti.
S porastom ozbiljnih povreda, rješavanje sigurnosti podataka pomoću tehnoloških i političkih
alata postat će ključno.13
Sve veća ekonomska važnost velikih podataka također pokreće brojna pravna pitanja,
posebno u kombinaciji s činjenicom da su podaci bitno drugačiji od mnogih drugih sredstava. Podaci
se mogu savršeno kopirati i jednostavno kombinirati s drugim podacima. Isti podatak može
istovremeno koristiti više od jedne osobe. Sve su to jedinstvene karakteristike podataka u usporedbi
s fizičkom imovinom. Morat će se odgovoriti na pitanja o pravima intelektualnog vlasništva vezanim
uz podatke: Tko "posjeduje" dio podataka i koja su prava povezana sa skupom podataka? Što definira
"poštenu upotrebu" podataka? Tu su i pitanja koja se odnose na odgovornost: Tko je odgovoran
kada an
12
netočan podatak dovodi do negativnih posljedica? Takve će vrste pravnih pitanja trebati razjasniti,
vjerojatno s vremenom, kako bi se iskoristio puni potencijal velikih podataka.
Tehnologija i tehnika. Kako bi uhvatile vrijednost velikih podataka, organizacije će morati primijeniti
nove tehnologije (npr. softver za pohranu, računalstvo i analitički softver) i tehnike (tj. nove vrste analiza).
Raspon tehnoloških izazova i prioriteti postavljeni za njihovo rješavanje razlikovat će se ovisno o
zrelosti podataka institucije. Naslijeđeni sustavi i nekompatibilni standardi i formati prečesto sprječavaju
integraciju podataka i sofisticiraniju analitiku koja stvara vrijednost iz velikih podataka. Novi problemi i
rastuća računalna snaga potaknut će razvoj novih analitičkih tehnika. Također postoji potreba za
stalnim inovacijama u tehnologijama i tehnikama koje će pomoći pojedincima i organizacijama da
integriraju, analiziraju, vizualiziraju i konzumiraju rastuću bujicu velikih podataka.
Pristup podacima. Kako bi omogućile transformativne prilike, tvrtke će sve više morati integrirati
informacije iz više izvora podataka. U nekim će slučajevima organizacije moći kupiti pristup podacima. U
drugim slučajevima, međutim, dobivanje pristupa podacima trećih strana često nije jednostavno. Izvori
podataka trećih strana možda nisu razmišljali o njihovom dijeljenju. Ponekad ekonomski poticaji nisu
usklađeni kako bi potaknuli dionike na razmjenu podataka. Dionik koji posjeduje određeni skup podataka
mogao bi ga smatrati izvorom ključne konkurentske prednosti i stoga bi ga oklijevao podijeliti s drugim
dionicima. Ostali dionici moraju
Mnogi od najmoćnijih izuma kroz ljudsku povijest, od jezika do modernog računala, bili su oni
koji su omogućili ljudima da bolje generiraju, hvataju i koriste podatke i informacije.14 Svjedoci
smo eksplozivnog rasta količine podataka u našem svijetu. Veliki podaci dosegli su kritičnu masu
u svakom sektoru i funkciji tipičnog gospodarstva, a brzi razvoj i širenje digitalnih informacijskih
tehnologija intenzivirali su njihov rast.
Nema sumnje da su sama veličina i svemir velikih podataka koji se brzo širi fenomen sami po
sebi i da su do sada bili primarni fokus istraživanja.
Ali ključno je pitanje kakav bi širi utjecaj mogla imati ova bujica podataka. Mnogi su potrošači
sumnjičavi u pogledu količine podataka koji se prikupljaju o svakom aspektu njihovih života,
od načina na koji kupuju do toga koliko su zdravi. Jesu li veliki podaci jednostavno znak koliko je
društvo postalo nametljivo ili veliki podaci zapravo mogu igrati korisnu ulogu u gospodarskom
smislu od koje mogu imati koristi svi društveni dionici?
Odlučan odgovor je da podaci doista mogu stvoriti značajnu vrijednost za svjetsko gospodarstvo,
potencijalno povećavajući produktivnost i konkurentnost tvrtki i stvarajući značajan ekonomski
višak za potrošače i njihove vlade.
Nadovezujući se na MGI-jevu duboku pozadinu u analizi produktivnosti i konkurentnosti diljem
svijeta, ovo istraživanje istražuje novu vezu između podataka i produktivnosti. Iako je odnos
između produktivnosti i ulaganja u IT dobro uspostavljen, istraživanje veze između
produktivnosti i podataka otvara novi put. Na temelju naših otkrića, vjerujemo da je globalno
gospodarstvo na pragu novog vala rasta produktivnosti koji omogućuju veliki podaci.
14 Za zanimljivu perspektivu ove teme, vidi James Gleick, The information: A history. A
teorija. Poplava (New York, NY: Pantheon Books, 2011.).
15 Naša definicija novih pohranjenih podataka opisuje količinu digitalne pohrane koju novozauzmu podaci u jednoj
godini. Imajte na umu da se ovo razlikuje od definicije novih pohranjenih podataka Hala Variana i Petera Lymana
jer naša metodologija ne uzima u obzir podatke koji su stvoreni i pohranjeni, ali zatim prepisani tijekom godine
dana. Za više detalja pogledajte dodatak
16 Peter Lyman i Hal R. Varian, Koliko informacija? 2003., Škola informacijskog menadžmenta i sustava,
Kalifornijsko sveučilište u Berkeleyu, 2003.
Machine Translated by Google
16
MGI je posljednja od nekoliko istraživačkih grupa koje proučavaju količinu podataka koje
poduzeća i pojedinci generiraju, pohranjuju i troše u cijelom globalnom gospodarstvu.
Sve analize, svaka s različitim metodologijama i definicijama, slažu se u jednoj temeljnoj točki -
količina podataka u svijetu brzo se širi i nastavit će eksponencijalno rasti u doglednoj budućnosti
(vidi Okvir 3, "Mjerenje podataka") unatoč tome što postoji upitnik o tome koliko podataka mi, kao
ljudska bića, možemo apsorbirati (vidi Okvir 4, “Ljudska bića mogu imati ograničenja u svojoj
sposobnosti konzumiranja i razumijevanja velikih podataka” na stranici 18).
Hal Varian i Peter Lyman s kalifornijskog sveučilišta Berkeley bili su pioniri u istraživanju
količine proizvedenih, pohranjenih i prenesenih podataka. Kao dio njihovog "Koliko informacija?"
projekta koji je trajao od 2000. do 2003., autori su procijenili da je 2002. globalno pohranjeno 5
egzabajta novih podataka (92 posto na magnetskim medijima) i da je više od tri puta više od te
količine — 18 egzabajta — novih ili izvornih podataka preneseno, ali nisu nužno pohranjeni putem
elektroničkih kanala kao što su telefon, radio, televizija i internet. Što je najvažnije, procijenili su
da se količina novih pohranjenih podataka udvostručila od 1999. do 2002., što predstavlja ukupnu
godišnju stopu rasta od 25 posto.
Potom je, počevši od 2007., tvrtka za upravljanje informacijama EMC sponzorirala istraživačku
tvrtku IDC za izradu godišnje serije izvješća o "Digitalnom svemiru" kako bi se procijenila
količina digitalnih informacija stvorenih i repliciranih svake godine.17 Ova je analiza pokazala da
je 2007. , količina digitalnih podataka stvorena u jednoj godini po prvi je put premašila svjetski
kapacitet pohrane podataka. Ukratko, nije bilo načina da se zapravo pohrane svi digitalni podaci koji
su stvoreni. Također su otkrili da je stopa kojom se povećava proizvodnja podataka mnogo brža
nego što se širi svjetski kapacitet za pohranu podataka, što snažno ukazuje na nastavak
produbljivanja jaza između to dvoje.
Njihova je analiza procijenila da je ukupna količina podataka stvorenih i repliciranih 2009. iznosila
800 egzabajta — dovoljno da popune hrpu DVD-ova koji dosežu do Mjeseca i natrag. Predviđali su
da će taj volumen narasti 44 puta do 2020., što je implicirana godišnja stopa rasta od 40 posto.18
17 IDC je objavio niz bijelih knjiga, koje sponzorira EMC, uključujući "The expanding
digitalni svemir", ožujak 2007.; "Raznoliki digitalni svemir koji eksplodira", ožujak 2008.; "Kako se
ekonomija smanjuje, digitalni svemir se širi", svibanj 2009.; i "Desetljeće digitalnog svemira — jeste
li spremni?", svibanj 2010. Svi su dostupni na www.emc.com/leadership/programs/ digital-universe.htm.
18 IDC-ove procjene količine podataka uključuju kopije podataka, a ne samo izvorno generirane
podaci.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 17
Nedavno su Martin Hilbert i Priscila López objavili rad u časopisu Science koji je analizirao
ukupnu globalnu pohranu i računalni kapacitet od 1986. do 2007.19 Njihova analiza je pokazala
da dok je globalni kapacitet pohrane rastao godišnjom stopom od 23 posto u tom razdoblju
(na više od 290 egzabajta u 2007. za sve analogne i digitalne medije), računalni kapacitet opće
namjene, mjera sposobnosti generiranja i obrade podataka, rastao je po puno višoj godišnjoj
stopi od 58 posto. Njihova je studija također dokumentirala porast digitalizacije. Procijenili su
da se postotak podataka pohranjenih u digitalnom obliku povećao sa samo 25 posto u 2000.
godini (analogni oblici poput knjiga, fotografija i audio/video vrpci činili su najveći dio kapaciteta
za pohranu podataka u to vrijeme) na dominantnih 94 posto udjela 2007. kako su mediji poput
tvrdih diskova, CD-a i digitalnih vrpci postajali sve važniji (prilozi 5 i 6).
Prikaz 5
Pohranjivanje podataka značajno je naraslo, značajno se pomaknuvši s analognog na
digitalno nakon 2000. godine
Globalno instalirano, optimalno komprimirano skladištenje
Eksabajti %; egzabajti
250 25
200
150 94
Analog 99 97
100
75
50
6
0
1986 1993. godine 2000. godine 2007. godine 1986. godine 1993. godine 2000. godine 2007. godine
IZVOR: Hilbert i López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje informacija,” Znanost,
2011
Prikaz 6
Računalni kapacitet također je naglo porastao
Globalno instalirano računanje za rukovanje informacijama
3.0
17
2.5
86
2.0 9
64 66
1.5
1.0
33
0,5
0
1986 1993. godine 2000. godine 2007. godine 1986. godine 1993. godine 2000. godine 2007. godine
IZVOR: Hilbert i López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje informacija,” Znanost,
2011
18
1 George A. Miller, “Čarobni broj sedam, plus ili minus dva: neka ograničenja na našem
sposobnost obrade informacija,” Psychological Review, svezak 63(2), ožujak 1956.:
81–97 (prikaz, stručni).
2 Roger Bohn i James Short, Koliko informacija? 2009: Izvješće o američkim potrošačima, Sveučilište
Kalifornije, San Diego, Globalni informacijski industrijski centar, siječanj 2010.
Postoji široko slaganje da proizvodnja podataka eksponencijalno raste. Je li taj rast koncentriran
samo u određenim segmentima globalne ekonomije? Odgovor na to pitanje je ne. Rast velikih
podataka je fenomen koji smo primijetili u svakom sektoru. Što je još važnije, intenzitet podataka
—tj. prosječna količina podataka pohranjenih po tvrtki—po sektorima u globalnom gospodarstvu
dovoljan je za tvrtke da koriste tehnike koje omogućuju veliki skupovi podataka za povećanje
vrijednosti (iako su neki sektori imali znatno veći intenzitet podataka od drugih). Poslovni čelnici u
svim sektorima sada se počinju pitati kako mogu bolje izvući vrijednost
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 19
Neki sektori pokazuju daleko veće razine intenziteta podataka od drugih, što implicira
da imaju veći kratkoročni potencijal za dobivanje vrijednosti velikih podataka. Sektori
financijskih usluga, uključujući vrijednosne papire i investicijske usluge te bankarstvo, imaju
u prosjeku najviše digitalnih podataka pohranjenih po tvrtki. To vjerojatno odražava činjenicu
da su tvrtke uključene u ove sektore obično intenzivne transakcije (Njujorška burza, na primjer,
može se pohvaliti s oko pola trilijuna trgovina mjesečno) i da, u prosjeku, ove vrste sektora
obično imaju prevlast velikih firmi. Komunikacijske i medijske tvrtke, komunalna poduzeća i
vlada također imaju značajne digitalne podatke pohranjene po poduzeću ili organizaciji, što
izgleda odražava činjenicu da takvi entiteti imaju veliki obujam operacija i multimedijskih
podataka. Diskretna i procesna proizvodnja imaju najviše agregatnih podataka pohranjenih u
bajtovima. Međutim, ti su sektori puno niže rangirani u smislu intenziteta, budući da su
fragmentirani u veliki broj poduzeća. Budući da pojedinačne tvrtke često ne dijele podatke,
vrijednost koju mogu dobiti iz velikih podataka mogla bi biti ograničena stupnjem do kojeg
mogu objediniti podatke u lancima opskrbe proizvodnje (za više detalja pogledajte poglavlje
3d o proizvodnji) (Prikaz 7).
Prikaz 7
20 Ovo je procjena dodatnog kapaciteta iskorištenog tijekom godine. U nekim slučajevima, ovo
kapacitet se može sastojati od više skupova podataka koji prepisuju druge podatke, ali korištenje kapaciteta
je inkrementalno u odnosu na kapacitet pohrane korišten prethodne godine.
Machine Translated by Google
20
Podaci o slikama u obliku X-zraka, CT-a i drugih skeniranja dominiraju količinom pohrane
podataka u zdravstvu. Dok jedna stranica zapisa može ukupno imati kilobajt, jedna slika
može zahtijevati 20 do 200 megabajta ili više za pohranu. U komunikacijskoj i medijskoj
industriji slike i zvuk koji su gladni bajtova dominiraju volumenom pohrane. Doista, ako
bismo ispitivali čisto stvaranje podataka (a ne pohranjivanje), neki podsektori kao što su
zdravstvena njega i igre generiraju čak i više multimedijskih podataka u obliku postupaka
u stvarnom vremenu i video nadzora, ali to se rijetko dugo pohranjuje .
Prikaz 8
visoko
Tekst/
Srednji
Video Slika Audio brojevi
Niska
Bankarstvo
Osiguranje
Diskretna proizvodnja
Procesna proizvodnja
Maloprodaja
Veleprodaja
Profesionalne usluge
Zdravstvena njega
Prijevoz
Komunikacije i mediji2
Komunalije
Izgradnja
Industrije resursa
Vlada
Obrazovanje
1 Sastavili smo ovu toplinsku kartu koristeći jedinice podataka (u datotekama ili minutama videa), a ne bajtove.
2 Video i audio su visoki u nekim podsektorima.
IZVOR: Analiza McKinsey Global Institute
Sve veća uporaba multimedije u sektorima uključujući zdravstvenu skrb i industrije okrenute
potrošačima značajno je pridonijela rastu velikih podataka i nastavit će to činiti. Video zapisi
generiraju ogromnu količinu podataka. Svaka minuta sada najčešće korištenog videa
visoke razlučivosti u ordinacijama generira 25 puta veću količinu podataka (po minuti) čak i
od fotografija najveće rezolucije kao što su CT skeniranja, a svaka od tih fotografija već
zahtijeva tisuće puta više bajtova od jednu stranicu teksta ili brojčanih podataka. Više od
95 posto kliničkih podataka generiranih u zdravstvenoj skrbi sada je video. Multimedijski
podaci već čine više od polovice mrežnog internetskog prometa (tj. prometa koji se odvija
na najvećim vezama između velikih internetskih mreža), a očekuje se da će taj udio porasti
na 70 posto do 2013.21.
Nagli porast upotrebe društvenih medija stvara vlastiti tok novih podataka. Dok društvene
mreže dominiraju komunikacijskim portfeljem mlađih korisnika, stariji ih korisnici usvajaju
još bržim tempom. McKinsey je ispitao korisnike digitalnih usluga i otkrio porast od 7 posto
u 2009. godini u korištenju društvenih mreža kod ljudi u dobi od 25 do 34 godine, još
impresivniji porast od 21 do 22 posto među onima u dobi od 35 do 54 godine te nevjerojatan
porast od 52 posto u upotrebi među osobama u dobi od 55 do 64 godine. Brzo usvajanje
pametnih telefona također povećava korištenje društvenih mreža (Prikaz 9).
Facebookovih 600 milijuna aktivnih korisnika provede više od 9,3 milijarde sati
mjesečno na stranici—da je Facebook država, imao bi treću najveću populaciju na
svijetu. Svaki mjesec prosječni korisnik Facebooka kreira 90 sadržaja, a sama mreža
dijeli više od 30 milijardi sadržaja uključujući fotografije, bilješke, postove na blogu, web
poveznice i vijesti. YouTube kaže da ima oko 490 milijuna jedinstvenih posjetitelja diljem
svijeta koji provode više od 2,9 milijardi sati na stranici svaki mjesec. YouTube tvrdi da
prenosi 24 sata videa svake minute, što ovu stranicu čini iznimno značajnim agregatorom
podataka. McKinsey je također dokumentirao kako se korištenje društvenih medija i Weba
2.0 seli iz sfere potrošača u poduzeća.22
Povećanje primjena Interneta stvari, tj. senzora i uređaja ugrađenih u fizički svijet i povezanih
mrežama s računalnim resursima, još je jedan trend koji pokreće rast velikih podataka.23
Istraživači McKinseyja pokazuju da broj
22 Michael Chui, Andy Miller i Roger Roberts. "Šest načina da Web 2.0 funkcionira", McKinsey Quarterly, veljača
2009.; Jaques Bughin i Michael Chui, "Uspon umreženog poduzeća: Web 2.0 pronalazi svoj dan isplate",
McKinsey Quarterly, prosinac 2010.
23 Michael Chui, Markus Löffler i Roger Roberts, "Internet stvari", McKinsey Quarterly, ožujak 2010.
Machine Translated by Google
22
Prikaz 9
+11% godišnje
67 +28% godišnje
63 57
55 12
47 13
14
13
35 14
12
55
49 44
41 33
23
2008. godine 2009. godine 2010 2008. godine 2009. godine 2010
% %
Često 76 78 82 Često 65 70 77
korisnika korisnika
1 Na temelju penetracije korisnika koji pregledavaju stranice društvenih mreža. Radi dosljednosti, isključujemo pitanja specifična za Twitter
(dodana anketi 2009.) i mobilne društvene mreže koje se temelje na lokaciji (npr. Foursquare, dodano anketi 2010.).
2 Česti korisnici definirani kao oni koji koriste društvene mreže barem jednom tjedno.
IZVOR: Anketa McKinsey iConsumer
Prikaz 10
energija 15
1–3
2–6 5
Industrije
8–23 Maloprodaja
30
17–50
1–2
2–5 2–6 5–
2–6
14
2010 2015
Tijekom niza godina, MGI je istraživao vezu između IT-a i produktivnosti.24 Isti uzročni odnosi
vrijede jednako za velike podatke kao i za IT općenito. Poluge velikih podataka nude značajan
potencijal za poboljšanje produktivnosti na razini pojedinačnih tvrtki. Kompanije, uključujući
Tesco, Amazon, Wal-Mart, Harrah's, Progressive Insurance i Capital One te Smart, bežični igrač
na Filipinima, već su koristile velike podatke kao konkurentsko oružje — kao i cijela gospodarstva
(vidi okvir 5). , “Velike tvrtke diljem svijeta postigle su prve uspjehe u korištenju velikih podataka”).
Okvir 5. Velike tvrtke diljem svijeta postigle su prve uspjehe u korištenju velikih podataka
Postoje zapaženi primjeri tvrtki širom svijeta koje su dobro poznate po svojoj
opsežnoj i učinkovitoj upotrebi podataka. Na primjer, Tescov program vjernosti generira
ogromnu količinu podataka o kupcima koje tvrtka iskopava kako bi informirala odluke od
promocija do strateške segmentacije kupaca. Amazon koristi podatke o klijentima za
pokretanje svog mehanizma preporuka "možda će vam se također svidjeti..." koji se temelji
na vrsti tehnike prediktivnog modeliranja koja se zove kolaborativno filtriranje. Čineći signale
ponude i potražnje vidljivima između maloprodajnih trgovina i dobavljača, Wal-Mart je prvi
usvojio zalihe kojima upravlja dobavljač kako bi optimizirao lanac opskrbe. Harrah's, američka
grupa za hotele i kasina, sastavlja detaljne holističke profile svojih kupaca i koristi ih za
prilagođavanje marketinga na način koji povećava lojalnost kupaca. I Progressive Insurance
i Capital One poznati su po provođenju eksperimenata kako bi sustavno i učinkovito
segmentirali svoje klijente te kako bi u skladu s tim prilagodili ponude proizvoda. Smart,
vodeći bežični igrač na Filipinima, analizira svoju penetraciju, pokrivenost maloprodaje i
prosječni prihod po korisniku na razini grada ili mjesta kako bi se usredotočio na mikro
tržišta s najvećim potencijalom.
Utjecaj IT-a na produktivnost možemo najprije razdvojiti na rast produktivnosti u sektorima koji
proizvode IT kao što su poluvodiči, telekomunikacije i proizvodnja računala te sektorima koji
koriste IT. Općenito, velik dio rasta produktivnosti u sektorima koji proizvode IT rezultat je
poboljšanja kvalitete IT proizvoda kako se tehnologija razvija. U ovoj analizi usredotočeni smo
uglavnom na sektore koji koriste IT (i koji će sve više koristiti velike podatke), koji čine mnogo veći
dio globalnog gospodarstva od sektora koji opskrbljuju IT.
24 Vidi rast produktivnosti u SAD-u, 1995. – 2000., McKinsey Global Institute, listopad 2001., i Kako IT
omogućuje rast produktivnosti, McKinsey Global Institute, listopad 2002., oba dostupna na www.
mckinsey.com/mgi.
Machine Translated by Google
24
radnici bolje i brže alate za obavljanje svog posla. Drugi je ulaganje u ljudski kapital i organizacijske
podatke.25
Došlo je do četiri vala usvajanja IT-a s različitim stupnjevima utjecaja na rast produktivnosti u
Sjedinjenim Državama (Prikaz 11). Prva od ovih era - era "mainframea" - trajala je od 1959. do 1973.
Tijekom tog razdoblja, ukupni godišnji rast produktivnosti u SAD-u bio je vrlo visok i iznosio je 2,82 posto.
Doprinos IT-a produktivnosti bio je prilično skroman; u toj je fazi udio IT-a u ukupnim kapitalnim izdacima
bio relativno nizak. Druga era od 1973. do 1995., koju ćemo nazvati erom “minikompjutera i osobnih
računala,” doživjela je mnogo niži rast ukupne produktivnosti, ali veći udio tog rasta možemo pripisati
utjecaju IT-a. Došlo je do značajnog produbljivanja IT kapitala. Kompanije su počele povećavati svoju
potrošnju na više distribuiranih tipova računala, a ta su računala postajala sve moćnija kako se njihova
kvaliteta povećavala.
Treća era trajala je od 1995. do 2000. - era "Interneta i Weba 1.0". U ovom
U tom razdoblju rast produktivnosti u SAD-u vratio se na visoke stope, potpomognut značajnim
produbljivanjem IT kapitala, intenziviranjem poboljšanja kvalitete, kao i širenjem značajnih menadžerskih
inovacija koje su iskoristile prethodna IT kapitalna ulaganja. Kao što smo sugerirali, postoji zaostatak
između ulaganja u informatičku tehnologiju i menadžerskih inovacija potrebnih za ubrzanje rasta
produktivnosti. Doista, iako smo ovu eru nazvali zbog ulaganja u Internet i Web 1.0 napravljena u to vrijeme,
najveći dio pozitivnog utjecaja na produktivnost u sektorima koji koriste IT došao je od menadžerskih i
MGI istraživanje pokazalo je da je u ovom trećem razdoblju povećanje produktivnosti bilo neravnomjerno
raspoređeno na makroekonomskoj razini, razini sektora i poduzeća. U nekim slučajevima, vodeća tvrtka koja
je uložila dovoljno u IT uspjela je primijeniti menadžerske inovacije kako bi potaknula produktivnost i
nadmašila svoje kolege u industriji. Wal-Martova implementacija IT intenzivnih poslovnih procesa omogućila
je tvrtki da nadmaši konkurente u maloprodajnoj industriji. Na kraju su ti konkurenti kao odgovor uložili u
IT, ubrzali vlastiti rast produktivnosti i potaknuli produktivnost cijelog sektora.
Zapravo, MGI je otkrio da je šest sektora zaslužno za gotovo sve poraste produktivnosti u američkom
gospodarstvu, dok su ostali pridonijeli vrlo malom rastu produktivnosti ili čak, u nekim slučajevima,
negativnom rastu produktivnosti. Šest sektora koji su ostvarili skok u produktivnosti dijele tri opće
karakteristike u svom pristupu IT-u. Prvo, prilagodili su svoje IT ulaganje poslovnim procesima specifičnim
za sektor i povezali ga s ključnim polugama učinka. Drugo, implementirali su IT sekvencijalno, izgrađujući
25 Oslanjamo se na prethodna MGI istraživanja i analizu Dalea Jorgensona, Mun Hoa i Kevina
Stiroha o tome kako je IT utjecao na rast produktivnosti u SAD-u između 1959. i 2006. Vidite
Rast produktivnosti u SAD-u, 1995. – 2000., listopad 2001., i Kako IT omogućuje rast
produktivnosti, listopad 2002., oba dostupna na www.mckinsey.com/mgi; Dale Jorgenson, Mun
Ho i Kevin Stiroh, “Retrospektivni pogled na ponovno oživljavanje rasta produktivnosti u SAD-
u,” Journal of Economic Perspectives, 2008.; i Erik Brynjolfsson i Adam Saunders, Wired for
innovation: Kako informacijska tehnologija preoblikuje gospodarstvo (Cambridge, MA: MIT
Press, 2009.).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 25
Prikaz 11
rada IT doprinos 1
2.82
2.70
2.50
1.11
1.49 1.54
2.52
0,84
1.59
0,96
0,65
0,30
Mobilni uređaji i
Web 2.0
Četvrta i posljednja era, koja traje od 2000. do 2006., razdoblje je "mobilnih uređaja i Weba
2.0". U tom je razdoblju doprinos produbljivanja IT kapitala i sektora koji proizvode IT opao. Međutim,
doprinos menadžerskih inovacija se povećao - opet, ovaj val organizacijskih promjena izgleda kao
zakašnjeli odgovor na ulaganja u Internet i Web 1.0 iz prethodnih pet godina.26
Što nam ti obrasci govore o izgledima za velike podatke i produktivnost? Kao i prethodni
valovi produktivnosti omogućene IT-om, korištenje velikih podataka u osnovi zahtijeva ulaganja
u IT (u pohranu i procesorsku snagu) i menadžerske inovacije.
Čini se vjerojatnim da će intenzivnost podataka i produbljivanje kapitala potaknuti širenje
komplementarne menadžerske inovacije koja potiče rast produktivnosti. Do sada nema
empirijskih dokaza o vezi između intenziteta podataka ili produbljivanja kapitala u ulaganjima
u podatke i produktivnosti u određenim sektorima. Priča o IT-u i produktivnosti sugerira da je razlog
tome vremenski odmak i da ćemo u jednom trenutku vidjeti kako se ulaganja u produbljivanje kapitala
povezanog s velikim podacima isplate u obliku povećanja produktivnosti.
26 Koristimo multifaktorsku produktivnost u industrijama koje koriste IT kao naše mjerenje utjecaja
menadžerske inovacije.
Machine Translated by Google
26
lanac i operativne poluge mogu poboljšati učinkovitost cijelog sektora. Poluge marketinga i
trgovanja pomoći će potrošačima da pronađu bolje proizvode koji će zadovoljiti njihove
potrebe po razumnijim cijenama, povećavajući stvarnu dodanu vrijednost.
2. Tehnike i tehnologije
velikih podataka
A/B testiranje. Tehnika u kojoj se kontrolna skupina uspoređuje s nizom testnih skupina kako
bi se odredilo koji će tretmani (tj. promjene) poboljšati danu objektivnu varijablu, npr. stopu
marketinškog odgovora. Ova tehnika je također poznata kao split testiranje ili bucket testiranje.
Primjer primjene je određivanje koje kopije teksta, izgleda, slika ili boja će poboljšati stope pretvorbe
na web stranici e-trgovine. Veliki podaci omogućuju izvođenje i analizu velikog broja testova,
osiguravajući da su grupe dovoljno velike da otkriju značajne (tj. statistički značajne) razlike između
kontrolnih
Machine Translated by Google
28
28 Jeff Howe, “The Rise of Crowdsourcing,” Wired, izdanje 14.06, lipanj 2006.
29 Michael Chui, Andy Miller i Roger Roberts, “Šest načina kako učiniti da Web 2.0 funkcionira”, McKinsey Quarterly,
veljača 2009.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 29
Genetski algoritmi. Tehnika koja se koristi za optimizaciju inspirirana procesom prirodne evolucije
ili "opstankom najjačih". U ovoj tehnici, potencijalna rješenja su kodirana kao "kromosomi" koji se
mogu kombinirati i mutirati. ove
pojedinačni kromosomi su odabrani za preživljavanje unutar modeliranog "okoliša"
koji određuje sposobnost ili izvedbu svakog pojedinca u populaciji. Često opisani kao vrsta "evolucijskih
algoritama", ovi su algoritmi prikladni za rješavanje nelinearnih problema. Primjeri primjena uključuju
poboljšanje rasporeda poslova u proizvodnji i optimiziranje izvedbe investicijskog portfelja.
Strojno učenje. Subspecijalnost računalne znanosti (unutar polja povijesno zvanog "umjetna
inteligencija") koja se bavi dizajnom i razvojem algoritama koji omogućuju računalima da razvijaju
ponašanja na temelju empirijskih podataka. Glavni fokus istraživanja strojnog učenja je automatsko
učenje prepoznavanja složenih obrazaca i donošenje inteligentnih odluka na temelju podataka.
Obrada prirodnog jezika primjer je strojnog učenja.
Obrada prirodnog jezika (NLP). Skup tehnika iz subspecijalnosti računalnih znanosti (unutar polja koje
se povijesno naziva "umjetna inteligencija") i lingvistike koje koriste računalne algoritme za analizu
ljudskog (prirodnog) jezika.
Mnoge NLP tehnike su vrste strojnog učenja. Jedna od primjena NLP-a je korištenje analize raspoloženja
na društvenim medijima kako bi se utvrdilo kako potencijalni kupci reagiraju na kampanju brendiranja.
Neuronske mreže. Računalni modeli, nadahnuti strukturom i radom bioloških neuronskih mreža (tj.
stanica i veza unutar mozga), koji pronalaze uzorke u podacima. Neuronske mreže su prikladne za
pronalaženje nelinearnih obrazaca.
Mogu se koristiti za prepoznavanje uzoraka i optimizaciju. Neke aplikacije neuronske mreže uključuju
učenje pod nadzorom, a druge učenje bez nadzora.
Primjeri aplikacija uključuju identificiranje klijenata visoke vrijednosti koji su u opasnosti od napuštanja
određene tvrtke i identificiranje lažnih potraživanja osiguranja.
Analiza mreže. Skup tehnika koje se koriste za karakterizaciju odnosa između diskretnih čvorova u
grafu ili mreži. U analizi društvenih mreža analiziraju se veze između pojedinaca u zajednici ili
organizaciji, npr. kako informacije putuju ili tko na koga ima najveći utjecaj. Primjeri aplikacija uključuju
identificiranje ključnih lidera mišljenja za ciljanje marketinga i identificiranje uskih grla u protoku
informacija poduzeća.
Optimizacija. Portfelj numeričkih tehnika koje se koriste za redizajniranje složenih sustava i procesa
kako bi se poboljšala njihova izvedba prema jednoj ili više objektivnih mjera (npr. cijena, brzina ili
pouzdanost). Primjeri aplikacija uključuju poboljšanje operativnih procesa kao što su planiranje,
usmjeravanje i tlocrt te donošenje strateških odluka kao što je strategija asortimana proizvoda, analiza
povezanih ulaganja i strategija portfelja istraživanja i razvoja. Genetski algoritmi su primjer optimizacijske
tehnike.
Machine Translated by Google
30
Prepoznavanje uzorka. Skup tehnika strojnog učenja koje dodjeljuju neku vrstu izlazne vrijednosti
(ili oznake) danoj ulaznoj vrijednosti (ili instanci) prema određenom algoritmu. Primjer su
tehnike klasifikacije.
Prediktivno modeliranje. Skup tehnika u kojima se stvara ili odabire matematički model za najbolje
predviđanje vjerojatnosti ishoda. Primjer primjene u upravljanju odnosima s kupcima je upotreba
prediktivnih modela za procjenu vjerojatnosti da će se kupac "odbaciti" (tj. promijeniti dobavljača) ili
vjerojatnosti da se kupcu može prodati drugi proizvod. Regresija je jedan primjer od mnogih tehnika
prediktivnog modeliranja.
Analiza sentimenta. Primjena obrade prirodnog jezika i drugih analitičkih tehnika za prepoznavanje
i izdvajanje subjektivnih informacija iz izvornog tekstualnog materijala.
Ključni aspekti ovih analiza uključuju identifikaciju značajke, aspekta ili proizvoda o kojem se
izražava mišljenje i određivanje tipa, "polariteta" (tj. pozitivan, negativan ili neutralan) te stupnja
i snage mišljenja. Primjeri aplikacija uključuju tvrtke koje primjenjuju analizu raspoloženja za
analizu društvenih medija (npr. blogova, mikroblogova i društvenih mreža) kako bi se utvrdilo
kako različiti segmenti kupaca i dionici reagiraju na njihove proizvode i akcije.
Primjeri aplikacija uključuju modeliranje za analizu vremenskih nizova ili implementaciju fuzije
podataka za određivanje preciznijeg očitanja kombiniranjem podataka iz skupa manje preciznih
izvora podataka (tj. izdvajanje signala iz šuma).
Analiza prostora. Skup tehnika, od kojih se neke primjenjuju iz statistike, koje analiziraju topološka,
geometrijska ili geografska svojstva kodirana u skupu podataka. Podaci za prostornu analizu često
dolaze iz geografskih informacijskih sustava (GIS) koji prikupljaju podatke uključujući informacije o
lokaciji, npr. adrese ili koordinate zemljopisne širine/dužine. Primjeri aplikacija uključuju
uključivanje prostornih podataka u prostorne regresije (npr. kako je spremnost potrošača da
kupe proizvod u korelaciji s lokacijom?) ili simulacije (npr. kako bi funkcionirala mreža proizvodnog
opskrbnog lanca s lokacijama na različitim lokacijama?).
Učenje pod nadzorom. Skup tehnika strojnog učenja koje izvode funkciju ili odnos iz skupa
podataka za obuku. Primjeri uključuju strojeve za klasifikaciju i vektorske vektore.30 Ovo se
razlikuje od učenja bez nadzora.
Analiza vremenskih serija. Skup tehnika iz statistike i obrade signala za analizu sekvenci
podatkovnih točaka, koje predstavljaju vrijednosti u uzastopnim vremenima, za izdvajanje
značajnih karakteristika iz podataka. Primjeri analize vremenskih serija uključuju vrijednost
burzovnog indeksa po satu ili broj pacijenata kojima je dijagnosticirano određeno stanje svaki
dan. Predviđanje vremenskih serija korištenje je modela za predviđanje budućih vrijednosti
vremenske serije na temelju poznatih prošlih vrijednosti iste ili druge serije. Neke od ovih
tehnika, npr. strukturno modeliranje, rastavljaju niz na komponente trenda, sezonske i rezidualne
komponente, što može biti korisno za identificiranje cikličkih obrazaca u podacima. Primjeri
primjene uključuju predviđanje brojki prodaje ili predviđanje broja ljudi kojima će biti
dijagnosticirana zarazna bolest.
Učenje bez nadzora. Skup tehnika strojnog učenja koje pronalaze skrivenu strukturu u
neoznačenim podacima. Klaster analiza je primjer nenadziranog učenja (za razliku od nadziranog
učenja).
Sve je veći broj tehnologija koje se koriste za prikupljanje, manipuliranje, upravljanje i analizu
velikih podataka. Detaljno smo opisali neke od istaknutijih tehnologija, ali ovaj popis nije iscrpan,
pogotovo jer se nastavlja razvijati više tehnologija za podršku tehnikama velikih podataka, od
kojih smo neke naveli.
Veliki Stol. Vlasnički distribuirani sustav baze podataka izgrađen na Google datotečnom sustavu.
Inspiracija za HBase.
32
Računalni oblak. Računalna paradigma u kojoj se visoko skalabilni računalni resursi, često
konfigurirani kao distribuirani sustav, pružaju kao usluga putem mreže.
Stanica podataka. Podskup skladišta podataka, koji se koristi za pružanje podataka korisnicima
obično putem alata poslovne inteligencije.
Distribuirani sustav. Više računala, koja komuniciraju putem mreže, koriste se za rješavanje zajedničkog
računskog problema. Problem je podijeljen na više zadataka, od kojih svaki rješava jedno ili više računala
koja rade paralelno. Prednosti distribuiranih sustava uključuju veće performanse po nižoj cijeni (tj. zato
što klaster nižih računala može biti jeftiniji od jednog višeg računala), veću pouzdanost (tj. zbog
nedostatka jedne točke kvara). ), i veću skalabilnost (tj. jer se povećanje snage distribuiranog sustava može
postići jednostavnim dodavanjem više čvorova umjesto potpunom zamjenom središnjeg računala).
Ekstrahiraj, transformiraj i učitaj (ETL). Softverski alati koji se koriste za izdvajanje podataka iz
vanjskih izvora, njihovu transformaciju kako bi odgovarali operativnim potrebama i njihovo učitavanje u a
baze podataka ili skladišta podataka.
Googleov sustav datoteka. Vlasnički distribuirani datotečni sustav koji je razvio Google; dio inspiracije za
Hadoop. 31
Hadoop. Okvir (besplatnog) softvera otvorenog koda za obradu velikih skupova podataka o određenim
vrstama problema u distribuiranom sustavu. Njegov razvoj inspiriran je Googleovim MapReduceom i
Googleovim datotečnim sustavom. Izvorno je razvijen u Yahoo! i sada se vodi kao projekt Apache Software
Foundationa.
HBase. Otvorena (besplatna), distribuirana, nerelacijska baza podataka po uzoru na Googleov Big
Table. Izvorno ga je razvio Powerset, a sada se njime upravlja kao projekt zaklade Apache Software kao dio
Hadoopa.
MapReduce. Softverski okvir koji je predstavio Google za obradu ogromnih skupova podataka o
određenim vrstama problema u distribuiranom sustavu.32 Također implementiran u Hadoop.
Mashup. Aplikacija koja koristi i kombinira prikaz podataka ili funkcionalnost iz dva ili više izvora za
stvaranje novih usluga. Te su aplikacije često dostupne na webu i često koriste podatke kojima se pristupa
putem otvorenih programskih sučelja aplikacija ili iz otvorenih izvora podataka.
Metapodaci. Podaci koji opisuju sadržaj i kontekst podatkovnih datoteka, npr. način stvaranja, svrha,
vrijeme i datum stvaranja te autor.
31 Sanjay Ghemawat, Howard Gobioff i Shun-Tak Leung, "Google datotečni sustav", 19. ACM simpozij o
načelima operativnih sustava, Lake George, NY, listopad 2003. (labs.google. com/papers/gfs.html).
Nerelacijska baza podataka. Baza podataka koja ne pohranjuje podatke u tablice (redove i stupce). (Za
razliku od relacijske baze podataka).
Relacijska baza podataka. Baza podataka sastavljena od zbirke tablica (relacija), tj. podaci su
pohranjeni u redovima i stupcima. Sustavi za upravljanje relacijskim bazama podataka (RDBMS)
pohranjuju vrstu strukturiranih podataka. SQL je najrašireniji jezik za upravljanje relacijskim bazama
podataka (vidi stavku u nastavku).
Polustrukturirani podaci. Podaci koji nisu u skladu s fiksnim poljima, ali sadrže oznake i druge oznake
za odvajanje podatkovnih elemenata. Primjeri polustrukturiranih podataka uključuju XML ili tekst s
HTML oznakama. Kontrast sa strukturiranim i nestrukturiranim podacima.
SQL. Izvorno akronim za strukturirani jezik upita, SQL je računalni jezik dizajniran za upravljanje
podacima u relacijskim bazama podataka. Ova tehnika uključuje mogućnost umetanja,
postavljanja upita, ažuriranja i brisanja podataka, kao i upravljanje shemom podataka (strukture baze
podataka) i kontrolu pristupa podacima u bazi podataka.
Obrada toka. Tehnologije dizajnirane za obradu velikih tokova podataka o događajima u stvarnom
vremenu. Obrada toka omogućuje aplikacije kao što su algoritamsko trgovanje financijskim uslugama,
aplikacije za obradu RFID događaja, otkrivanje prijevara, praćenje procesa i usluge temeljene na lokaciji
u telekomunikacijama. Poznato i kao obrada toka događaja.
Strukturirani podaci. Podaci koji se nalaze u fiksnim poljima. Primjeri strukturiranih podataka uključuju
relacijske baze podataka ili podatke u proračunskim tablicama. Suprotnost s polustrukturiranim podacima
i nestrukturiranim podacima.
Nestrukturirani podaci. Podaci koji se ne nalaze u fiksnim poljima. Primjeri uključuju tekst u
slobodnom obliku (npr. knjige, članci, tijelo poruka e-pošte), neoznačene audio, slikovne i video podatke.
Kontrast sa strukturiranim podacima i polustrukturiranim podacima.
Vizualizacija. Tehnologije koje se koriste za stvaranje slika, dijagrama ili animacija za prenošenje
poruke koje se često koriste za sintetiziranje rezultata analiza velikih podataka (pogledajte sljedeći
odjeljak za primjere).
VIZUALIZACIJA
Predstavljanje informacija na takav način da ih ljudi mogu učinkovito konzumirati ključni je izazov s
kojim se treba suočiti ako se želi da analiza podataka dovede do konkretnih radnji. Kao što smo
raspravljali u okviru 4, ljudska bića su evoluirala kako bi postala vrlo učinkovita u opažanju određenih
vrsta uzoraka svojim osjetilima, ali se i dalje suočavaju sa značajnim ograničenjima u svojoj sposobnosti
obrade drugih vrsta podataka kao što su velike količine numeričkih ili tekstualnih podataka. Iz tog
razloga trenutno postoji ogromna količina istraživanja i inovacija u području vizualizacije, tj. tehnika i
tehnologija koje se koriste za stvaranje slika, dijagrama ili animacija za komunikaciju, razumijevanje i
poboljšanje rezultata analiza velikih podataka. Predstavljamo neke primjere kako bismo dali uvid u ovo
rastuće i važno polje koje podržava velike podatke.
Machine Translated by Google
34
Oblak oznaka
Ova grafika je vizualizacija teksta ovog izvješća u obliku oblaka oznaka, tj. ponderirane vizualne
liste, u kojoj su riječi koje se najčešće pojavljuju veće, a riječi koje se rjeđe pojavljuju manje. Ova
vrsta vizualizacije pomaže čitatelju da brzo uoči najistaknutije koncepte u velikom tekstu.
Clustergram
Clustergram je tehnika vizualizacije koja se koristi za analizu klastera koja prikazuje kako su
pojedinačni članovi skupa podataka dodijeljeni klasterima kako se broj klastera povećava.33
Izbor broja klastera važan je parametar u analizi klastera. Ova tehnika omogućuje analitičaru da
postigne bolje razumijevanje toga kako rezultati klasteriranja variraju s različitim brojem klastera.
Tok povijesti
Tijek povijesti tehnika je vizualizacije koja prikazuje evoluciju dokumenta dok ga uređuje više
autora koji sudjeluju.34 Vrijeme se pojavljuje na vodoravnoj osi, dok su prilozi tekstu na okomitoj
osi; svaki autor ima različitu šifru boje, a okomita duljina trake označava količinu teksta koju je
svaki autor napisao.
Vizualizirajući povijest dokumenta na ovaj način, lako se pojavljuju različiti uvidi.
Na primjer, tijek povijesti koji ovdje prikazujemo, a koji prikazuje unos u Wikipediji za riječ
"islam", pokazuje da je sve veći broj autora dao doprinos u povijesti ovog unosa.35 Također
se lako može vidjeti da je duljina dokumenta rasla je tijekom vremena kako je više autora
razrađivalo temu, ali da je u određenim točkama bilo i značajnih brisanja, tj. kada se okomita
duljina smanjila. Čak se mogu vidjeti i primjeri “vandalizma” u kojem dokument ima
u potpunosti uklonjen iako je, zanimljivo, dokument bio vrlo brzo popravljen i vraćen u
prethodno stanje.
34 Fernanda B. Viegas, Martin Wattenberg i Kushal Dave, Proučavanje suradnje i sukoba između
autora s vizualizacijama toka povijesti, CHI2004 zbornik SIGCHI konferencije o ljudskim faktorima
u računalnim sustavima, 2004.
35 Za više primjera tokova povijesti, pogledajte galeriju koju je pružio Collaborative User
Istraživačka skupina IBM-a (www.research.ibm.com/visual/projects/history_flow/gallery.htm).
Machine Translated by Google
36
Druga tehnika vizualizacije je ona koja prikazuje tokove prostornih informacija. Primjer koji ovdje
prikazujemo zove se New York Talk Exchange.36 Prikazuje količinu podataka internetskog protokola (IP) koja
teče između New Yorka i gradova diljem svijeta.
Veličina sjaja na određenoj gradskoj lokaciji odgovara količini IP prometa koji teče između tog mjesta
i New Yorka; što je veći sjaj, to je veći protok. Ova vizualizacija nam omogućuje da brzo odredimo koji su
nam gradovi najbliži
povezani s New Yorkom u smislu opsega svojih komunikacija.
36 New York Talk Exchange bio je izložen u njujorškom Muzeju moderne umjetnosti 2008.
(senseable.mit.edu/nyte/).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 37
Kako bismo istražili koliko veliki podaci mogu stvoriti vrijednost i veličinu tog
potencijala, odabrali smo pet domena za dubinsko proučavanje: zdravstvena skrb u
Sjedinjenim Državama; uprava javnog sektora u Europskoj uniji; maloprodaja u Sjedinjenim
Državama; globalna proizvodnja; i globalne osobne podatke o lokaciji.
Zajedno ovih pet predstavljalo je blizu 40 posto globalnog BDP-a u 2010. (Prikaz 12).37
Tijekom naše analize ovih područja, obavili smo intervjue sa stručnjacima iz industrije i poduzeli
temeljit pregled aktualne literature. Za svaku domenu identificirali smo specifične poluge pomoću
kojih veliki podaci mogu stvoriti vrijednost; kvantificirao potencijal za dodatnu vrijednost; i
katalogizirao elemente koji su potrebni tvrtkama, organizacijama, vladama i pojedincima da uhvate
tu vrijednost.
Pet domena razlikuje se u svojoj sofisticiranosti i zrelosti u korištenju velikih podataka te stoga
nude različite poslovne lekcije. Oni također predstavljaju široki spektar ključnih segmenata
globalnog gospodarstva i obuhvaćaju niz regionalnih perspektiva.
Oni uključuju globalno razmjenjive sektore kao što je proizvodnja i nerazmjenjive sektore
kao što je uprava javnog sektora, kao i mješavinu proizvoda i usluga.
Javni sektor još je jedan veliki dio globalnog gospodarstva koji se suočava s ogromnim
pritiskom da poboljša svoju produktivnost. Vlade imaju pristup velikim bazama digitalnih
podataka, ali, općenito, jedva da su počele iskorištavati moćne načine na koje bi mogle koristiti te
informacije za poboljšanje učinka i transparentnosti.
Odabrali smo proučavati administrativne dijelove vlasti. Ovo je područje u kojem postoji velika
količina podataka, što nam daje priliku povući analogije s procesima u drugim industrijama
stručnjaka znanja, kao što je obrada potraživanja u osiguranju.
Za razliku od prve dvije domene, maloprodaja je sektor u kojem neki igrači već neko vrijeme
koriste big data za segmentiranje kupaca i upravljanje opskrbnim lancima. Unatoč tome, još
uvijek postoji golem potencijal u cijeloj industriji za pojedinačne igrače da prošire i poboljšaju
svoju upotrebu velikih podataka, osobito s obzirom na sve veću lakoću kojom mogu prikupljati
informacije o svojim potrošačima, dobavljačima i zalihama.
37 Za više detalja o metodologiji koju smo koristili u našim studijama slučaja, pogledajte dodatak.
Machine Translated by Google
38
Proizvodnja nudi detaljan uvid u industriju kojom se globalno trguje s često složenim
i široko rasprostranjenim lancima vrijednosti i velikom količinom dostupnih podataka.
Ova domena stoga nudi ispitivanje na više točaka u lancu vrijednosti, od iznošenja
proizvoda na tržište i istraživanja i razvoja (R&D) do usluga nakon prodaje.
Prikaz 12
Pet sektora ili domena koje smo odabrali za dubinsko proučavanje daju
važan doprinos globalnom gospodarstvu
Procijenjeni globalni BDP sektora u 2010
% ukupnog BDP-a
Nominalni trilijun dolara
zdravstvo 1 7 3.9
Maloprodaja 6 3.3
Proizvodnja 18 10.1
Telekomunikacije3 2 1.2
Ukupno 39 22.3
Naše procjene potencijalne vrijednosti koju veliki podaci mogu stvoriti u zdravstvu
stoga nisu predviđanja onoga što će se dogoditi, već naš pogled na puni ekonomski
potencijal, pod pretpostavkom da su potrebna ulaganja u IT i skup podataka, analitičke
sposobnosti, zaštita privatnosti i odgovarajući ekonomski poticaji. staviti na mjesto. Uz ovo
upozorenje, procjenjujemo da za otprilike deset godina postoji prilika za prikupljanje više od
300 milijardi dolara godišnje u novoj vrijednosti, s dvije trećine toga u obliku smanjenja
nacionalnih rashoda za zdravstvenu skrb — oko 8 posto procijenjenih zdravstvenih troškova
izdaci za skrb na razini iz 2010.
Sjedinjene Države troše više po osobi na zdravstvenu skrb nego bilo koja druga nacija u
svijetu – bez očitih dokaza o boljim ishodima. Očekuje se da će tijekom sljedećeg desetljeća
prosječni godišnji rast potrošnje za zdravstvo nadmašiti prosječni godišnji rast
38 Paul D. Mango i Vivian E. Riefberg, “Tri imperativa za poboljšanje zdravstvene skrbi u SAD-u,”
McKinsey Quarterly prosinac 2008.
Machine Translated by Google
40
BDP za gotovo 2 postotna boda.39 Dostupni dokazi upućuju na to da znatan udio američke
potrošnje na zdravstvenu skrb malo doprinosi boljim zdravstvenim ishodima.
Brojne studije su otkrile da Sjedinjene Države troše oko 30 posto više na skrb od
prosječne zemlje Organizacije za ekonomsku suradnju i razvoj (OECD) kada se prilagodi
BDP-u po glavi stanovnika i relativnom bogatstvu.40 Ipak, Sjedinjene Države još uvijek
padaju ispod prosjeka OECD- a na takve parametre zdravstvene zaštite kao što su
prosječni životni vijek i smrtnost dojenčadi. Dodatna potrošnja iznad trendova OECD-a
iznosi procijenjenih 750 milijardi dolara godišnje iz nacionalnog proračuna za zdravstvo
u 2007. od 2,24 trilijuna dolara—to je oko 2500 dolara po osobi godišnje (Prikaz 13). Dob,
opterećenje bolešću i zdravstveni ishodi ne mogu objasniti značajnu razliku.
Prikaz 13
Ujedinjene države
7000
~2500
5000 Kanada
Danska Norveška
Švicarska
Belgija
4000 Njemačka Nizozemska
Francuska Austrija Irska
Novi Zeland Švedska
Grčka Italija
3000
Island
Južna Korea
Izrael Japan
Republika Slovačka
2000 Australija
Slovenija
Ujedinjeno Kraljevstvo
Mađarska Španjolska
Finska
purica Poljska Estonija
1000 Češka Republika
Meksiko
Čile
0
10.000 15.000 20.000 25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000
BDP po glavi stanovnika
1 Merck je dobio odobrenje FDA za stavljanje Vioxxa (rofekoksiba) na tržište u svibnju 1999.
pet godina koliko je proteklo prije nego što je Merck povukao Vioxx s tržišta, procjenjuje
se da je 80 milijuna pacijenata uzimalo lijek, što ga je učinilo "blockbusterom" s više od 2
milijarde dolara godišnje prodaje. Unatoč statističkim dokazima u brojnim studijama manjeg
opsega (kasnije analiziranim u metastudiji), trebalo je više od pet godina dok nisu dokazani
kardiovaskularni rizici Vioxxa. U kolovozu 2004., dokument na Međunarodnom
farmakoepidemiološkom skupu u Bordeauxu, Francuska, objavio je rezultate studije koja je
uključivala veliku bazu podataka Kaiser Permanente koja je uspoređivala rizik od štetnih
kardiovaskularnih događaja za korisnike Vioxxa s rizikom za korisnike Pfizerovog Celebrexa.
Studija je zaključila da se između 1999. i 2003. dogodilo više od 27 000 infarkta miokarda
(srčanog udara) i iznenadnih srčanih smrti koje su se mogle izbjeći. Uzimanje 25 miligrama
dnevno ili više Vioxxa rezultiralo je više od tri puta većim rizikom od akutnog srčanog udara ili
iznenadna srčana smrt u usporedbi s primjenom Celebrexa. Dana 30. rujna 2004., u onome
što su mnogi promatrači nazvali najvećim povlačenjem lijekova u povijesti medicine, Merck
je povukao Vioxx s polica ljekarni.
Machine Translated by Google
42
Sustav zdravstvene zaštite SAD-a ima četiri glavna skupa podataka unutar zdravstvene zaštite, od kojih svaki
primarno drži različito biračko tijelo. Podaci su u ovoj domeni jako fragmentirani. Četiri skupa su klinički podaci
pružatelja usluga, podaci o aktivnostima (potraživanja) i troškovima platitelja, podaci o istraživanju i razvoju
Količina podataka koja je dostupna, prikupljena i analizirana uvelike varira unutar sektora. Na
primjer, pružatelji zdravstvenih usluga obično imaju opsežno digitalizirane financijske i
administrativne podatke, uključujući računovodstvo i osnovne informacije o pacijentima.
Općenito, međutim, pružatelji usluga još su u ranoj fazi digitalizacije i prikupljanja kliničkih
podataka koji pokrivaju područja kao što su napredak i ishodi liječenja. Ovisno o postavci skrbi,
procjenjujemo da se čak 30 posto kliničkih tekstualnih/numeričkih podataka u Sjedinjenim
Državama, uključujući medicinsku dokumentaciju, račune te laboratorijska i kirurška izvješća,
još uvijek ne generira elektronički. Čak i kada su klinički podaci u digitalnom obliku, obično ih čuva
pojedinačni pružatelj usluga i rijetko ih dijeli. Doista, većina stvarno generiranih kliničkih podataka
je u obliku video zapisa i feedova monitora, koji se koriste u stvarnom vremenu, a ne pohranjuju.
Prikaz 14
U domeni zdravstvene skrbi u SAD-u danas postoje četiri različita velika skupa
podataka s malim preklapanjem u vlasništvu i niskom integracijom
Skupovi podataka
Integracija skupova
podataka potrebna za velike
mogućnosti
Mnoge poluge koje identificiramo u sljedećem odjeljku uključuju integraciju više skupova
podataka. Bit će imperativ za organizacije, a vjerojatno i kreatore politike, da smisle kako uskladiti
ekonomske poticaje i prevladati tehnološke prepreke kako bi se omogućilo dijeljenje podataka.
Identificirali smo skup od 15 poluga u pet širokih kategorija koje imaju potencijal za poboljšanje
učinkovitosti i djelotvornosti sektora zdravstvene skrbi iskorištavanjem ogromne količine elektroničkih
informacija koje su, i koje bi mogle postati, dostupne u cijelom zdravstvenom sektoru SAD-a. Gdje je to
moguće, procjenjujemo financijski potencijal primjene ovih poluga u obliku uštede troškova,
povećane učinkovitosti, poboljšane učinkovitosti liječenja i povećanja produktivnosti. Do ovih smo
procjena došli pozivajući se na najbolju međunarodnu i američku praksu (više pojedinosti potražite
u dodatku). Pod pretpostavkom da američki sustav zdravstvene skrbi uklanja strukturne prepreke i
postavlja prave poticaje za različite dionike, procjenjujemo da veliki podaci mogu pomoći u otključavanju
više od 300 milijardi dolara godišnje dodatne vrijednosti u cijelom sektoru. Iznos koji će sektor realno
ostvariti ovisit će o zajedničkom djelovanju zdravstvenih organizacija i kreatora politike u prevladavanju
strukturnih i drugih prepreka.
Usredotočeni smo na poluge koje zahtijevaju analizu velikih skupova podataka koji se prvenstveno
odnose na razvoj i pružanje skrbi, a ne na sve HIT poluge kao što je automatizacija u obradi
zahtjeva. Naše procjene nemaju za cilj obuhvatiti cjelokupnu vrijednost koju je generirao HIT (npr.
isključujemo vrijednost koja u osnovi ne zahtijeva analizu velikih skupova podataka, kao što je
vrijeme koje su liječnici i medicinske sestre uštedjeli pri prepisivanju bilješki pomoću EMR-a ili
ušteda učinkovitosti i povećani pristup skrbi putem mobilnog zdravlja). Kako bismo potvrdili naše
nalaze, usporedili smo naše procjene s onima drugih istraživača i ustanovili da su usporedive (vidi
dodatak).
Poluge dijelimo u pet širokih kategorija: kliničke operacije, plaćanje/cijene, istraživanje i razvoj, novi
poslovni modeli i javno zdravstvo. Sada raspravljamo o svakom redom:
kliničkih operacija pet je poluga velikih podataka koje uglavnom utječu na način na koji pružatelji
usluga, obveznici plaćanja i PMP pružaju kliničku skrb. Procjenjujemo da bi, ako se potpuno iskoriste,
ovih pet poluga moglo smanjiti nacionalne izdatke za zdravstvo do 165 milijardi dolara godišnje u
odnosu na 2,5 trilijuna dolara u 2009. godini.
Machine Translated by Google
44
Diljem svijeta, agencije kao što su NICE u Ujedinjenom Kraljevstvu, Institut für Qualität
und Wirtschaftlichkeit im Gesundheitswesen (Institut za kvalitetu i učinkovitost zdravstvene
skrbi ili IQWIG) u Njemačkoj, Common Drug Review u Kanadi i Australska shema farmaceutskih
beneficija započeti CER programi s uspješnim rezultatima. Sjedinjene Države poduzele su
prvi korak u tom smjeru putem američkog Zakona o oporavku i ponovnom ulaganju iz 2009.
Zakonom je stvoreno Savezno koordinacijsko vijeće za komparativno istraživanje učinkovitosti,
koje, kao što mu ime kaže, koordinira komparativno istraživanje učinkovitosti u saveznoj
vladi i daje preporuke za 400 milijuna dolara izdvojenih za CER. Ako ova poluga želi postići
sustavnu razmjeru u Sjedinjenim Državama, mora prevladati neke značajne prepreke.
Sveobuhvatne i dosljedne skupove kliničkih podataka i podataka o tvrdnjama treba uhvatiti,
integrirati i staviti na raspolaganje istraživačima, a potrebno je pregovarati o brojnim
potencijalnim problemima. Na primjer, u trenutnoj žurbi za uvođenjem EHR-a, potencijalni
nedostatak standarda i interoperabilnosti mogao bi otežati kombiniranje skupova podataka.
Još jedna briga je kako osigurati privatnost pacijenta, a istovremeno pružiti dovoljno detaljne
podatke koji omogućuju učinkovite analize. Nakon što su identificirali optimalne načine
liječenja, platiteljima će se morati dopustiti da vežu odluke o naknadi troškova i dizajn
pogodnosti s rezultatima ovog istraživanja. Međutim, važeći američki zakon zabranjuje
centrima za Medicare i Medicaid usluge korištenje omjera troškova i koristi za odluke o
naknadi troškova. Širenje znanja o najučinkovitijim tretmanima medicinskim stručnjacima
zahtijevat će uvođenje ili nadogradnju alata, uključujući sustave podrške kliničkim odlukama
(vidi sljedeću polugu), tako da liječnici mogu dobiti preporuke najbolje prakse u trenutku
donošenja stvarne odluke o tretmanima.
2. Sustavi podrške kliničkom odlučivanju. Druga poluga je uvođenje sustava za podršku kliničkom
odlučivanju za poboljšanje učinkovitosti i kvalitete operacija. Ovi sustavi uključuju računalne
mogućnosti liječnika za unos naloga. Trenutna generacija takvih sustava analizira unose liječnika
i uspoređuje ih s medicinskim smjernicama kako bi upozorila na moguće pogreške kao što su
neželjene reakcije na lijekove ili događaji. Uvođenjem ovih sustava pružatelji usluga mogu
smanjiti nuspojave i stope pogrešaka u liječenju i zahtjeve za odgovornost, posebno one koji
proizlaze iz kliničkih pogrešaka. U jednoj osobito snažnoj studiji provedenoj na pedijatrijskoj
jedinici za intenzivnu njegu u glavnom gradskom području SAD-a, alat sustava za potporu
kliničkog odlučivanja smanjio je nuspojave i događaje za 40 posto u samo dva mjeseca.41
41 Amy L. Potts, Frederick E. Barr, David F. Gregory, Lorianne Wright i Neal R. Patel,
"Računalni unos liječničkih naloga i pogreške u liječenju u pedijatrijskoj jedinici za intenzivnu njegu,"
Pediatrics 113(1), 2004: 59–63.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 45
U budućnosti, sustavi velikih podataka kao što su ovi mogu postati znatno inteligentniji
uključivanjem modula koji koriste analizu i prepoznavanje slike u bazama podataka
medicinskih slika (X-zrake, CT, MRI) za preddijagnostiku ili koji automatski istražuju medicinsku
literaturu za stvaranje medicinske baza podataka stručnjaka koja može liječnicima predložiti
mogućnosti liječenja na temelju medicinske dokumentacije pacijenata. Osim toga, sustavi
podrške kliničkom odlučivanju mogu omogućiti veći dio posla medicinskim sestrama i
liječničkim pomoćnicima automatiziranjem i olakšavanjem savjetodavne uloge liječnika i time
poboljšavanjem učinkovitosti skrbi za pacijente.
4. Daljinsko praćenje pacijenata. Četvrta klinička poluga velikih podataka je prikupljanje podataka
iz daljinskog praćenja pacijenata za kronično bolesne pacijente i analiziranje dobivenih
podataka za praćenje pridržavanja (određivanje rade li pacijenti stvarno ono što je
propisano) i za poboljšanje budućih lijekova i mogućnosti liječenja. Procjenjuje se da je 150
milijuna pacijenata u Sjedinjenim Američkim Državama 2010. bilo kronično bolesno od bolesti
kao što su dijabetes, kongestivno zatajenje srca i hipertenzija, te su činili više od 80 posto
troškova zdravstvenog sustava te godine. Sustavi za daljinsko praćenje pacijenata mogu biti
vrlo korisni za liječenje takvih pacijenata. Sustavi uključuju uređaje koji prate stanje srca, šalju
informacije o razinama šećera u krvi, prenose povratne informacije od njegovatelja, pa čak
uključuju i tehnologiju "čip na piluli"—lijekove koji djeluju kao instrumenti za izvješćivanje kada
ih pacijent proguta— koji dostavlja podatke u gotovo stvarnom vremenu elektroničkim
42 Razlike u troškovima mogu biti prilično značajne. Na primjer, cijena kolonoskopije može varirati
faktor šest unutar područja San Francisca.
Machine Translated by Google
46
Plaćanje/cijene
Dvije poluge u ovoj kategoriji uglavnom uključuju poboljšanje plaćanja i cijena zdravstvene
zaštite, a prvenstveno su usmjerene na poslovanje obveznika. Zajedno imaju potencijal
stvoriti vrijednost od 50 milijardi dolara, od čega bi polovica rezultirala uštedama troškova
nacionalne zdravstvene skrbi.
U slučaju određivanja cijena lijekova, farmaceutske tvrtke dijelile bi dio terapijskog rizika.
Za platitelje, ključna korist je da sheme podjele troškova i rizika za nove lijekove omogućuju
kontrolu ili ograničenje značajnog dijela potrošnje na zdravstvenu skrb. U isto vrijeme, PMP
tvrtke mogle bi dobiti bolji pristup tržištu uz snažne napore da se obuzdaju troškovi
zdravstvene skrbi. PMP tvrtke također mogu osigurati potencijalno veći prihod od
učinkovitije upotrebe lijekova putem inovativnih shema određivanja cijena. Pacijenti bi
dobili poboljšane zdravstvene ishode uz formular temeljen na vrijednosti i dobili pristup
inovativnim lijekovima po razumnoj cijeni. Da bi se postigla maksimalna vrijednost za sustav
zdravstvene skrbi, Sjedinjene Države trebale bi omogućiti kolektivno pregovaranje platitelja.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 47
U tijeku je nekoliko pilot programa određivanja cijena lijekova koji se temelje na ekonomici zdravlja
i istraživanju ishoda, prvenstveno u Europi. Novartis se, na primjer, dogovorio s njemačkim zdravstvenim
osiguravateljima da će pokriti troškove veće od 315 milijuna eura (468 milijuna dolara) godišnje za
Neki platitelji također mjere troškove i kvalitetu pružatelja usluga i dogovaraju naknade
na temelju podataka. Na primjer, obveznici mogu isključiti pružatelje usluga čiji su troškovi liječenja
različitih bolesti izvan okvira nakon prilagodbe za komorbiditete (prisutnost jedne ili više bolesti uz
primarnu bolest). Alternativno, mogu pregovarati o inovativnim cjenovnim planovima, kao što su plaćanja
istraživanje i razvoj
Pet poluga velikih podataka moglo bi poboljšati produktivnost istraživanja i razvoja u podsektoru PMP-a.
Zajedno bi te poluge mogle stvoriti vrijednost veću od 100 milijardi dolara, od čega bi oko 25 milijardi moglo
1. Prediktivno modeliranje. Prva poluga je agregacija istraživačkih podataka kako bi PMP tvrtke mogle
izvesti prediktivno modeliranje za nove lijekove i odrediti najučinkovitiju i isplativu raspodjelu resursa
za istraživanje i razvoj. Ovo “racionalno
dizajn lijeka” znači korištenje simulacija i modeliranja na temelju pretkliničkih ili ranih kliničkih
skupova podataka duž lanca vrijednosti istraživanja i razvoja za predviđanje kliničkih ishoda što je
brže moguće. Čimbenici procjene mogu uključivati sigurnost proizvoda, učinkovitost, potencijalne
nuspojave i ukupne rezultate ispitivanja. Ovo prediktivno modeliranje može smanjiti troškove
obustavom istraživanja i skupih kliničkih ispitivanja suboptimalnih spojeva ranije u istraživačkom
ciklusu.
Prednosti ove poluge za PMP sektor uključuju niže troškove istraživanja i razvoja i ranije
prihod od manjeg, bržeg i više ciljanog istraživanja i razvoja. Poluga pomaže bržem plasiranju
lijekova na tržište i proizvodnji više ciljanih spojeva s većim potencijalnim tržištem i stopom
terapeutskog uspjeha. Prediktivno modeliranje može smanjiti 3 do 5 godina od otprilike 13 godina koliko
je potrebno da se nova smjesa iznese na tržište.
2. Statistički alati i algoritmi za poboljšanje dizajna kliničkog ispitivanja. Druga je poluga korištenje
statističkih alata i algoritama za poboljšanje dizajna kliničkih ispitivanja i ciljanje regrutiranja pacijenata
u kliničkim fazama procesa istraživanja i razvoja. Ova poluga uključuje rudarenje podataka o
pacijentima kako bi se ubrzala klinička ispitivanja procjenom izvedivosti regrutiranja pacijenata,
preporukom učinkovitijih dizajna protokola i sugeriranjem mjesta ispitivanja s velikim brojem
potencijalno prihvatljivih pacijenata i dobrim rezultatima. Tehnike koje se mogu primijeniti uključuju
izvođenje simulacija scenarija i modeliranje kako bi se optimizirala veličina etikete (raspon indikacija
primjenjivih na određeni lijek) kako bi se povećala vjerojatnost stope uspjeha ispitivanja. Algoritmi
mogu kombinirati podatke istraživanja i razvoja i ispitivanja s komercijalnim modeliranjem i povijesnim
regulatornim podacima kako bi pronašli optimalni kompromis između veličine i karakteristika ciljane
populacije pacijenata za ispitivanja i šanse za regulatorno odobrenje novog spoja. Analize također
mogu poboljšati proces odabira istražitelja usmjeravanjem na one s dokazanim rezultatima.
3. Analiza podataka kliničkih ispitivanja. Treća poluga povezana s istraživanjem i razvojem je analiza podataka
kliničkih ispitivanja i zapisa pacijenata kako bi se identificirale dodatne indikacije i otkrile nuspojave.
48
moguće nakon statističke analize velikih skupova podataka o rezultatima za otkrivanje signala dodatnih
kliničkom ispitivanju ili, u nekim slučajevima, identificiranje događaja koji su bili nagoviješteni u kliničkim
Ovi analitički programi mogu biti osobito važni u sadašnjem kontekstu u kojemu je godišnja povlačenja
lijekova u 2008. godini dosegnula rekordnu razinu svih vremena, a ukupni broj novih odobrenja za lijekove
opada. Povlačenje lijekova često je vrlo javno štetno za tvrtku. Uklanjanje lijeka protiv bolova Vioxx s
tržišta 2004. rezultiralo je oko 7 milijardi dolara pravnih i odštetnih troškova za Merck i 33-postotni pad
4. Personalizirana medicina. Još jedna obećavajuća inovacija velikih podataka koja bi mogla
stvaranje vrijednosti u areni istraživanja i razvoja je analiza velikih skupova podataka u nastajanju (npr.
Cilj ove poluge je ispitati odnose između genetske varijacije, predispozicije za specifične bolesti i specifičnih
odgovora na lijekove, a zatim objasniti genetsku varijabilnost pojedinaca u procesu razvoja lijeka.
Personalizirana medicina obećava poboljšanje zdravstvene skrbi na tri glavna načina: nudi rano
otkrivanje i dijagnozu prije nego što pacijent razvije simptome bolesti; učinkovitije terapije jer se pacijenti
s istom dijagnozom mogu segmentirati prema podudaranju molekularnih potpisa (tj. pacijenti s istom
bolešću često ne reagiraju na isti način na istu terapiju, dijelom zbog genetske varijacije); i prilagođavanje
doza lijeka prema molekularnom profilu pacijenta kako bi se smanjile nuspojave i maksimalizirao odgovor.
Personalizirana medicina je u ranoj fazi razvoja. Zabilježeni su impresivni početni uspjesi, osobito u
ranom otkrivanju raka dojke, u prenatalnom testiranju gena i testiranju doze u liječenju leukemije i raka
koje pojedini pacijenti ne reagiraju mogao iznositi 30 do 70 posto ukupnih troškova u nekim slučajevima.
Isto tako, ranije otkrivanje i liječenje mogli bi značajno smanjiti teret raka pluća za zdravstvene sustave, s
obzirom na to da su troškovi operacije u ranom stadiju približno upola manji od troškova liječenja u
kasnom stadiju.
5. Analiza obrazaca bolesti. Peta poluga za stvaranje vrijednosti velikih podataka povezana s istraživanjem i razvojem je
strateških odluka o ulaganju u istraživanje i razvoj. Ova analiza može pomoći PMP tvrtkama da
optimiziraju fokus svog istraživanja i razvoja kao i raspodjelu resursa uključujući opremu i
osoblje.
modele koji mogu nadopuniti ili se natjecati s postojećim i njihovim polugama. Ističemo dva potencijalna nova
poslovna modela:
Prva vrsta novog poslovnog modela je onaj koji agregira i analizira kartone pacijenata kako bi pružio
podatke i usluge trećim stranama. Tvrtke bi mogle izgraditi robusne skupove kliničkih podataka koji bi
To može uključivati licenciranje i analizu podataka o kliničkim ishodima za platitelje i regulatore kako
Javno zdravstvo
Sve poluge s omogućenim velikim podacima koje smo opisali mogu odigrati značajnu
ulogu u preispitivanju produktivnosti američkog zdravstvenog sustava, poboljšanju
kvalitete skrbi i liječenja, poboljšanju iskustva pacijenata, jačanju konkurentnosti industrije
i stvaranju niza svježi poslovni modeli i usluge.
Ukupno procjenjujemo da bi zdravstvo SAD-a moglo ostvariti vrijednost veću od 300
milijardi dolara svake godine, s dvije trećine toga u obliku smanjenja rashoda za nacionalnu
zdravstvenu skrb od oko 8 posto. Održavanje ishoda zdravstvene skrbi konstantnima
(konzervativna pretpostavka s obzirom na to da će mnoge poluge poboljšati kvalitetu
zdravstvene skrbi, što je teško kvantificirati), uzimanje u obzir godišnjih operativnih troškova
i pretpostavka da potencijal vrijednosti svake poluge velikih podataka raste linearno s rashodima
za zdravstvenu skrb , to bi značilo da bi godišnja produktivnost američkog zdravstvenog
sektora mogla porasti za dodatnih 0,7 posto. Ovo povećanje produktivnosti pretpostavlja da
industrija ostvari sve potencijalne koristi od korištenja velikih podataka tijekom sljedećih deset
godina (Prikaz 15).43 Kao što smo rekli, stvarna količina vrijednosti koju će sektor
43 Ovaj izračun uzima u obzir tekuće operativne troškove EMR-a u cijeloj zemlji, procijenjene na oko 20
milijardi dolara godišnje, nakon početnog postavljanja (procijenjeno na do 200 milijardi dolara).
Pogledajte dodatak za naš izračun produktivnosti.
Machine Translated by Google
50
Prikaz 15
Primjeri poluga
Potencijal
226 107 333
ukupne bruto vrijednosti1
1 Isključujući početna IT ulaganja (~120 – 200 milijardi USD) i godišnje operativne troškove (~20 milijardi USD godišnje).
IZVOR: Razgovori stručnjaka; pretraživanje tiska i literature; Analiza McKinsey Global Institute
Pacijenti bi vidjeli niže troškove za bolju skrb i imali bi širi, jasniji pristup većem broju
informacija o zdravstvenoj skrbi, što bi ih učinilo informiranijim potrošačima medicinskog
sustava. Pacijenti bi mogli usporediti ne samo cijene lijekova, tretmana i liječnika, već i njihovu
relativnu učinkovitost, što bi im omogućilo odabir učinkovitijih, bolje ciljanih lijekova, od
kojih su mnogi prilagođeni njihovom osobnom genetskom i molekularnom sastavu. Pacijenti
bi također imali pristup širem spektru informacija o epidemijama i drugim javnozdravstvenim
informacijama ključnim za njihovu dobrobit.
Pružatelji usluga, obveznici plaćanja i PMP sektor iskusit će različite prednosti od primjene
poluga velikih podataka. Moraju biti svjesni posljedičnih promjena vrijednosti i promjena
poslovnih modela. Neke bi poluge trebale donijeti dodatnu vrijednost svim dionicima.
Na primjer, sprječavanjem neželjenih događaja vezanih uz lijekove, sustavi podrške
kliničkim odlukama trebali bi dovesti do manje tužbi za odgovornost za platitelje, nižih
stopa osiguranja od nesavjesnog liječenja za pružatelje usluga i boljih ishoda za pacijente.
Međutim, u slučaju drugih poluga, jedan bi igrač mogao dobiti na račun drugoga, rezultat
koji bi se odrazio na cijelu industriju, stvarajući pobjednike i gubitnike na kraju. U slučaju
usvajanja komparativnog istraživanja učinkovitosti, na primjer, pružatelji usluga mogli bi
vidjeti smanjenje svojih prihoda za tretmane za koje se utvrdi da nisu optimalno učinkoviti.
Daljinski nadzor pacijenata još je jedan primjer. Ova poluga će smanjiti pogreške i štetne
učinke liječenja te će poboljšati kvalitetu skrbi i života osoba s kroničnim bolestima. Ali to
će postići smanjenjem potrebe za liječenjem u općim bolnicama i smanjenjem nuspojava
lijekova, nagrizajući neke tradicionalne izvore prihoda za bolnice i klinike.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 51
Potencijal za smanjenje prihoda mogao bi se pokazati kao poticaj za bolnice i klinike da potraže
načine za sudjelovanje u valu novih poslovnih modela i prilika koje poluge velikih podataka
pomažu stvoriti. Te organizacije mogu, na primjer, pokušati analizirati i koristiti baze podataka
pacijenata kako bi proširile svoju ponudu preventivne skrbi. Pojavit će se, naravno, i posve novi
poslovni modeli. Na primjer, osobna zdravstvena evidencija koju nude Google Health i Microsoft
Healthvault omogućuje potrošačima stvaranje osobnih zdravstvenih profila i ciljeva, praćenje
tretmana i recepata te praćenje njihovih iskustava kao pacijenata.
Jasno je da primjereno usklađeni poticaji mogu potaknuti dionike da prihvate velike podatkovne
poluge za poboljšanje učinka. Farmaceutska industrija očit je primjer. Industrija je počela rudariti
i skupljati podatke o prodaji i receptima jer je ova poluga pomogla tvrtkama da poboljšaju svoju
krajnju vrijednost učinkovitijim ciljanjem prodaje, upravljanjem resursima prodajnog osoblja i
odabirom glavnih područja za istraživanje i razvoj.
U isto vrijeme, pružatelji usluga će morati značajno uložiti u uvođenje sustava elektroničkih
medicinskih zapisa, koji pružaju temelj za provođenje komparativnih istraživanja učinkovitosti
liječenja i lijekova. Neke procjene navode da se taj trošak kreće od 80 000 do 100 000 USD po
krevetu.44 Iako će davatelji usluga imati značajne koristi od korištenja takvih sustava (npr.
ušteda vremena od izvlačenja i održavanja papirnatih kartona), primarna ušteda će se prikupiti
platiteljima i pacijentima od identifikacije najviše učinkovite tretmane i manje nuspojava lijekova.
Opet, financijski poticaji morali bi se preusmjeriti - možda kroz vladinu intervenciju - prije nego što
se u cijeloj zemlji dogodi usvajanje elektroničkih medicinskih zapisa i informacijske tehnologije
zdravstvene skrbi.
52
Snaga mnogih poluga velikih podataka koje smo opisali ovisi o pristupu podacima—i to
često na razini većoj od one koju generira pojedinačna organizacija.
Ove poluge mogu zahtijevati kombiniranje različitih skupova podataka kao što su zapisi
pacijenata i podaci o kliničkim zahtjevima. Dionici u industriji često ne dijele postojeće skupove
podataka zbog pravnih ograničenja kao što su zakoni o privatnosti, nedostatak poticaja ili
nekompatibilni IT sustavi ili formati. Osjetljiva priroda zdravstvenih informacija i mogućnost
diskriminacije koja se temelji na njima čini sigurnost i zaštitu prava na privatnost kritičnom.
Mnoge zemlje imaju propise kao što su HIPAA i HITECH, američki zakoni osmišljeni za zaštitu
sigurnosti i privatnosti zdravstvenih zapisa. Kako korištenje velikih podataka postaje sve
važnije za industriju, kreatori politika će možda morati preispitati ove zakone ili intervenirati
kako bi osigurali da je pristup podacima dostupan na sigurnom
način koji također omogućuje optimizaciju ishoda zdravstvene skrbi.
45 Nacionalni centar za zdravstvenu statistiku, Centri za kontrolu i prevenciju bolesti, “Korištenje elektroničkog
medicinskog zapisa/elektroničkog zdravstvenog zapisa od strane ordinacijskih liječnika,” prosinac 2009.;
Ashish K. Jha i sur., "Uporaba elektroničkih zdravstvenih zapisa u američkim bolnicama", New England Journal
of Medicine 360(16), 16. travnja 2009.:1628–38.
46 Za više o izazovima uspješne implementacije IT-a kod pružatelja zdravstvenih usluga i obveznika,
pogledajte “Razbijanje tri vodeće pogrešne percepcije o IT-u u zdravstvenoj skrbi,” Health
International 2010., broj 10.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 53
54
Kao što je pokazalo nedavno istraživanje MGI-a, način na koji će se vlade morati nositi
s takvim ograničenjima jest postizanje koraka promjene u njihovoj (često relativno niskoj)
produktivnosti.47 Iako produktivnost u javnom sektoru nije lako izmjeriti, postoje dokazi da
rast produktivnosti javnog sektora zaostaje za rastom produktivnosti privatnog sektora u
mnogim (ili većini) gospodarstava. Eksperimentalne procjene Ureda za nacionalnu statistiku
Ujedinjenog Kraljevstva pokazale su pad produktivnosti u javnom sektoru od 1995. do 2005.,
dok je istraživanje MGI pokazalo pozitivan rast produktivnosti u tržišnom sektoru.48 U
velikoj mjeri, sve lošija produktivnost javnog sektora Ujedinjenog Kraljevstva rezultat je
vladinog sve većeg zapošljavanja.49
Mogu li veliki podaci pomoći javnom sektoru da poveća svoju produktivnost? Kako
bismo pokušali odgovoriti na ovo pitanje, proučavali smo administrativne aktivnosti javnog
sektora, s fokusom na Europu (vidi Okvir 7, “Kako smo proučavali upravu javnog sektora”).
Otkrili smo da poluge velikih podataka, poput povećanja transparentnosti i primjene napredne
analitike, javnom sektoru nude moćan arsenal strategija i tehnika za povećanje produktivnosti
i postizanje viših razina učinkovitosti i djelotvornosti.
Naše istraživanje pokazuje da bi europski javni sektor potencijalno mogao smanjiti
troškove administrativnih aktivnosti za 15 do 20 posto, stvarajući ekvivalent od 150 do 300
milijardi € (223 do 446 milijardi USD)—ili čak i više—u novoj vrijednosti. Ova procjena
uključuje i povećanje učinkovitosti i smanjenje jaza između stvarne i potencijalne naplate
poreznih prihoda. Ove poluge mogle bi ubrzati godišnji rast produktivnosti za do 0,5
postotnih bodova u sljedećih deset godina.
Vjerujemo da veliki podaci mogu igrati sličnu ulogu iu drugim zemljama i regijama.
Druge vlade diljem svijeta suočavaju se s mnogim istim društvenim i ekonomskim
izazovima, a velike podatkovne prilike o kojima raspravljamo u ovoj studiji slučaja
usmjerenoj na Europu primjenjivat će se i drugdje, posebice u drugim razvijenim zemljama i regijama.
47 Vidi Martin N. Baily, Karen Croxson, Thomas Dohrmann i Lenny Mendonca, Imperativ produktivnosti
javnog sektora, McKinsey & Company, ožujak 2011. (www.mckinsey.com/en/ Client_Service/Public_Sector/
Latest_thinking/~/media/McKinsey/ dotcom/client_service/ Public%20Sector/PDFS/
Public%20Sector%20Productivity%20Imperative_March%202011. ashx); i Tony Danker, Thomas
Dohrmann, Nancy Killefer i Lenny Mendonca, "Kako američka vlada može odgovoriti na svoj izazov
produktivnosti?" McKinsey Quarterly, srpanj 2006. (www. mckinseyquarterly.com). Također pogledajte
izvješća MGI-a Izvan štednje: Put do gospodarskog rasta i obnove u Europi, listopad 2010., i Rast i
obnova u Sjedinjenim Državama: Retooling američkog ekonomskog motora, veljača 2011.
(www.mckinsey.com/.mgi).
48 Imajte na umu da se tržišni sektor odnosi na privatni sektor plus onaj dio javnog sektora koji prodaje
dobra ili usluge uz naknadu. Također, treba napomenuti da su podaci o produktivnosti javnog sektora
eksperimentalni, temeljeni na ishodu (neprilagođeni za vrijednost) i podijeljeni s ukupnim inputima, dok
se podaci o produktivnosti tržišnog sektora temelje na dodanoj vrijednosti i inputima rada.
Eksperimentalne procjene su one napravljene korištenjem najsuvremenijih, i stoga neprovjerenih, metodologija.
49 Od štednje do prosperiteta: Sedam dugoročnih prioriteta, McKinsey Global Institute, studeni 2010.
(www.mckinsey.com/mgi).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 55
Klasičan primjer je rad poreznih agencija i agencija za rad. Glavne djelatnosti poreznih
agencija uključuju obradu podnesaka, preglede, naplatu i usluge poreznim obveznicima,
sve u velikom opsegu. Agencije za zapošljavanje obavljaju različite analitičke funkcije,
uključujući ispitivanje tržišta, provjeru kupaca, a zatim distribuciju odgovarajućih
beneficija i usluga zapošljavanja. Druge agencije, uključujući prijevoz i useljeništvo,
imaju slične funkcije i odgovornosti. Aktivnosti privatnog sektora, uključujući obradu
zahtjeva za osiguranje, također uključuju slične administrativne zadatke, a možemo izvući
dodatne uvide iz onoga što znamo o tim aktivnostima u privatnom sektoru.
IZAZOV
Europski javni sektor čini gotovo polovicu BDP-a, uključujući transferna plaćanja koja čine oko 20
posto.50 Isključujući transferna plaćanja, oko 10 do 30 posto ovog udjela može se pripisati
administraciji.51 Ovaj visoki udio u ukupnom gospodarskom rezultatu stavlja znatne dugotrajne
dugoročni pritisak na europsku proračunsku i dužničku poziciju—iznad utjecaja nedavne globalne
recesije. Danas su razine javnog duga već visoke, a prethodna istraživanja MGI-a pokazuju da je
proces smanjivanja duga nakon recesije dugotrajan.52
51 Transferna plaćanja redistribuiraju dohodak u tržišnom sustavu. Primjeri uključuju socijalnu skrb (financijsku
pomoć), socijalno osiguranje i državne subvencije za određene tvrtke (firme).
56
Prikaz 16
postotak BDP-a
Zapadna Europa Istočna Europa
(EU–15) (EU–10)
10.2 9.2
Mirovine
12.0 9.6
6.9 4.7
Zdravstvena njega
7.9 5.5
1.3 0.3
Dugotrajna njega
1.9 0,5
18.4 14.2
Ukupno
21.8 15.6
Podaci koji se generiraju u upravi javnog sektora prvenstveno su tekstualni ili numerički.
Dakle, u usporedbi sa sektorima kao što je pružanje zdravstvene zaštite koji generiraju
značajne količine multimedijskog sadržaja (opsežne elektroničke slike, na primjer, uz
tekst), nalazimo da uprava javnog sektora ima tendenciju generirati niži — ali još uvijek
značajan — volumen jedinstvenih podataka mjerenih u bajtovima.
Međutim, za razliku od zdravstva, velika većina — do 90 posto — podataka koji se generiraju
u upravi javnog sektora stvara se u digitalnom obliku, dijelom kao rezultat inicijativa e-uprave
poduzetih u posljednjih 15 godina.
Međutim, čak iu zemljama čiji su programi e-uprave najnapredniji, agencije javnog sektora
često ne čine podatke dostupnima na učinkovit način ni u organizacijskim silosima, ni
građanima i poduzećima. Protokoli oblikovanja i unosa često su nedosljedni. Umjesto
elektroničkog premještanja podataka, nije neuobičajeno da zaposlenik jedne agencije
dobije kopiju podataka faksom ili poštom s podacima od druge agencije, iako su ti podaci
možda pohranjeni elektronički. A postoje neka pravila i/ili pravna ograničenja koja
sprječavaju dijeljenje podataka.
Nedostatak transparentnosti podataka o učinku vlade također može biti faktor koji pridonosi
prije spomenutim izazovima produktivnosti. Teško je poboljšati aktivnosti koje se ne mjere,
a relativni nedostatak transparentnosti u metrici učinka i produktivnosti javnog sektora faktor
je koji pridonosi ranije opisanom jazu u produktivnosti.
Javni sektor u Europi i šire ima priliku primijeniti poluge velikih podataka u svakoj od pet
širokih kategorija koje proizlaze iz našeg istraživanja u različitim sektorima.
Poluge o kojima raspravljamo odnose se na porezne agencije i agencije za rad, ali vjerujemo da njihova
uporaba može biti jednako relevantna iu drugim dijelovima javnog sektora.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 57
1. Stvaranje transparentnosti
kao što su državni službenici i agencije mogu poboljšati svoju učinkovitost kada podaci iz velikih baza
podataka javnog sektora postanu dostupniji. Na primjer, vladine agencije redovito prikupljaju veliku količinu
podataka o pojedincima i tvrtkama putem raznih regulatornih i drugih prijava. Ipak, građani i tvrtke često
moraju ispunjavati obrasce za koje su neki od podataka već prikupljeni i pohranjeni. Kad bi agencije unaprijed
ispunjavale obrasce za građane i tvrtke iz podataka koji su već pohranjeni u državnim bazama podataka, to
bi uštedjelo vrijeme podnositeljima obrazaca, kao i državnim agencijama koje ne bi morale ponovno unositi
podatke. Prethodno punjenje bi također imalo prednost smanjenja grešaka i ubrzanja vremena obrade.
Zauzimanje ovog pristupa zahtijevalo bi, međutim, prevladavanje političkih i zakonskih prepreka za dijeljenje
podataka.
Švedska porezna uprava unaprijed ispunjava obrasce za svoje građane, uključujući podatke o
prihodima i plaćenim porezima za prethodnu godinu. Agencija omogućuje građanima da te podatke
potvrde ili izmijene putem usluge kratkih poruka (SMS) putem mobitela ili interneta. Potencijalne uštede
vremena za porezne obveznike mogu biti značajne. U Sjedinjenim Američkim Državama, na primjer,
pojedinačni porezni obveznici potroše otprilike 5 do 20 sati ili više na aktivnosti prijave poreza. Prethodno
ispunjavanje također može znatno uštedjeti vrijeme poreznim vlastima. Jedna je porezna uprava uspjela
preraspodijeliti oko 15 posto osoblja dodijeljenog obradi podnesaka.
Državni službenici i njihove odgovarajuće agencije također mogu imati koristi od stavljanja podataka na
raspolaganje svim agencijama i organizacijskim silosima. To može smanjiti vrijeme pretraživanja između i
unutar agencija, koje može činiti značajan dio vremena državnih službenika. Jedna je porezna agencija
uspjela preraspodijeliti 20 posto svojih zaposlenika s punim radnim vremenom dobivši online pristup bazama
podataka ugovora o prijenosu stambenog prostora umjesto prikupljanja podataka od druge državne agencije
na fizičkim medijima (CD-ima) i ručnog pretraživanja podataka.
Sve više vlada (na svim razinama) počinje usvajati načela "otvorenih podataka" prema kojima
javnosti stavljaju na raspolaganje više neobrađenih vladinih baza podataka. Data.gov.uk u
Ujedinjenom Kraljevstvu i web portal Aporta u Španjolskoj (www. proyectoaporta.es) središnja su web
mjesta koja su primjeri ovog trenda, u kojima vanjski dionici mogu pristupiti sve većem broju baza
podataka. Takvi napori otključali su ogromnu količinu inovacija koje kombiniraju podatke iz više izvora
(npr. "službene" vladine informacije od tijela za provedbu zakona i javnih radova s "neslužbenim"
informacijama koje su građani prijavili s društvenih medija) za stvaranje usluga kao što su hiperlokalne
vijesti koje opisuju događaji specifični za gradsku četvrt. Drugi primjeri, uključujući expectmore.gov i Dr.
Foster Intelligence, koji građanima UK-a pružaju informacije o zdravstvenoj skrbi, osmišljeni su za izravno
mjerenje uspješnosti programa (pogledajte točku 5 u ovom odjeljku o novim poslovnim modelima za daljnju
raspravu o tim mogućnostima).
različitih dijelova vladine agencije koji obavljaju općenito slične funkcije — varijabilnost koja ne pojaviti na
agregatnoj razini. Takve informacije mogu biti vrlo vrijedna prilika za poboljšanje učinka operativnih jedinica
unutar agencije. Na primjer, nadzorne ploče učinka koje prikazuju operativne i financijske podatke omogućuju
agenciji mjerenje i usporedbu učinka svojih različitih jedinica i razvoj pristupa za poboljšanje produktivnosti.
Promatrači obično navode nedostatak vanjske konkurencije kao objašnjenje za relativno nisku produktivnost
u upravi javnog sektora, a to
Machine Translated by Google
58
sigurno igra ulogu. Ali čak i u kontekstu slabog konkurentskog pritiska, sposobnost izlaganja
varijacija u učinku među različitim jedinicama javnog sektora može stvoriti unutarnju konkurenciju
koja povećava učinak. Čak i u nedostatku opipljivih financijskih nagrada za poboljšanje učinka,
menadžeri u podparlamentarnim jedinicama često će htjeti poboljšati tu izvedbu jer se osjećaju
nelagodno kada im se javno pokaže da su pri dnu agencijske hrpe (iako mogu i više raditi na
poboljšanju učinka jer bi to moglo povećati njihove šanse za napredovanje i veću plaću u
nastavku).53
Porezne agencije s najboljom praksom koriste integrirane mjesečne tablice rezultata koje mjere
prikupljeni prihod i prate rezultate zadovoljstva korisnika, rezultate angažmana osoblja i povratne
informacije od javnosti i voditelja agencija. Podizanje donjeg kvartila u smislu izvedbe za jedan ili dva
kvartila može biti velika prilika za poboljšanje učinkovitosti. Dok poslovne jedinice privatnog
sektora mogu varirati u svojoj izvedbi za faktor dva, jedinice javnog sektora mogu varirati za faktor
šest.54 Agencije s kolegama u drugim zemljama mogu proširiti svoje usporedbe uspješnosti s
internih na globalne referentne vrijednosti (Prikaz 17).
Prikaz 17
90
80
70
60 Prosječna
izvedba
50
indeksirana
40 na 50
30
20
10
0
01 2 3 456 7 8 9 10 11 12 13
zemlje
IZVOR: McKinsey porezna benchmarking studija (uključuje analizu 13 zemalja: Australija, Belgija, Brazil, Kanada, Čile,
Danska, Francuska, Irska, Norveška, Južnoafrička Republika, Španjolska, Švedska i Sjedinjene Države)
53 Neki menadžeri u javnom sektoru primaju bonuse za dobre rezultate. Za više o korištenju
statusnih nagrada za motiviranje dobrog učinka, vidi Timothy Besley i Maitreesh Ghatak,
“Statusni poticaji,” American Economic Review 98(2), 2008: 206–11.
54 McKinsey je 2008. i 2009. proveo dubinsku usporednu analizu 13 poreznih agencija na globalnoj razini.
Za nalaze pogledajte Thomas Dohrmann i Gary Pinshaw, Put do poboljšane usklađenosti, McKinsey
white paper, rujan 2009.
55 posto kao osnova troška nabave; vidi Christian Husted i Nicolas Reinecke, “Poboljšanje
nabave u javnom sektoru,” McKinsey on Government, 2009.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 59
Građani i vanjski dionici također mogu koristiti podatke javnog sektora koji otkrivaju
varijabilnost u izvedbi. U Ujedinjenom Kraljevstvu vlada stavlja na raspolaganje podatke o ishodima
zdravstvene skrbi kako bi građani mogli donositi informiranije odluke
Slično tome, porezne agencije najbolje prakse koriste velike podatke za segmentiranje
pojedinačnih i poslovnih poreznih obveznika, odvajajući ih u kategorije i klase za aktivnosti
pregleda i prikupljanja. Na primjer, ove agencije mogu kategorizirati porezne obveznike
prema zemljopisnom području, njihovoj povijesti ispunjavanja obveza, potencijalnom riziku
neplaćanja, poteškoćama u naplati i, naravno, razini prihoda i demografskim podacima. Korištenje
učinkovite segmentacije može pomoći u smanjivanju jaza između stvarnih i potencijalnih kolekcija
do 10 posto. U isto vrijeme, bolje ciljane interakcije mogu povećati zadovoljstvo kupaca za čak 15 posto.
skupova podataka kako bi pomogli u donošenju boljih odluka. Ove vrste tehnika često se
mogu vrlo učinkovito primijeniti u aktivnostima usklađivanja, na primjer, među agencijama
javnog sektora koje trebaju pronaći anomalije u plaćanjima kao što su naplata poreza ili isplate
naknada od odjela za rad ili socijalnu sigurnost. Sofisticirane porezne agencije primjenjuju
automatizirane algoritme koji obavljaju sustavne višerazinske provjere poreznih prijava i
automatski označavaju prijave koje zahtijevaju daljnje ispitivanje ili reviziju. Ovaj pristup može
značajno poboljšati naplatu, smanjujući porezni jaz do 10 postotnih bodova. Slične metode mogu
koristiti i druge agencije kako bi imale učinkovitu ulogu u borbi protiv terorizma i zaštiti djece.
60
(odabir predmeta za daljnje ispitivanje koji nema problem) i lažno negativni (neodabir predmeta za
daljnje ispitivanje gdje postoji problem). Nakon korištenja automatiziranih analiza, BA je izvijestio o
smanjenju pogrešno isplaćenih naknada za 20 posto.
Bundesagentur für Arbeit (Njemačka savezna agencija za rad ili skraćeno BA), s
godišnjim proračunom od 54 milijarde eura i 120 000 zaposlenih s punim radnim
vremenom, oštro je poboljšala svoje korisničke usluge i smanjila troškove za oko 10
milijardi eura posljednjih godina koristeći velike podatkovne strategije (prikaz 18). BA
zapošljava nezaposlene i pruža cijeli niz usluga savjetovanja i podrške putem deset
regionalnih centara i 178 agencija za zapošljavanje.
Prikaz 18
10.3
5. Inoviranje novih poslovnih modela, proizvoda i usluga s velikim podacima Veliki podaci iz vlade
Zaklada je koristila baze podataka koje su dostupne kroz vladinu inicijativu otvorenih podataka za
razvoj wheredoesmymoneygo.org, stranice koja građanima olakšava pregled i razumijevanje
javne potrošnje Ujedinjenog Kraljevstva analizom i vizualizacijom podataka.56
Startup tvrtka BrightScope iskopala je podatke Ministarstva rada SAD-a o 401 (k) naknadama za
upravljanje koje plaćaju poslodavci i otkrila da male tvrtke plaćaju više od 4 milijarde dolara
više u naknadama za upravljanje od većih tvrtki. Na temelju tih podataka i podataka iz nekoliko
javnih izvora kao što su Securities and Exchange Commission i US Census Bureau, BrightScope
sada nudi online alat za kvantitativno ocjenjivanje planova 401(k).
Kao iu drugim industrijskim i poslovnim sektorima koje smo proučavali, značajna vrijednost
može se uhvatiti samo ako su podaci dostupni i transparentni (i primjenom jednostavne
analitike). Potencijalni dobici naglo rastu kako dionici prelaze na napredne analitičke tehnike kao
što je primjena složenih algoritama i tehnika segmentacije.
U cijelom europskom javnom sektoru, poluge velikih podataka koje smo identificirali za
administraciju mogu donijeti tri glavne kategorije mjerljive novčane vrijednosti sve dok postoje
prave politike i pokretači. To su uštede troškova od operativne učinkovitosti, smanjenje troškova
pogrešaka i prijevara u upravljanju naknadama te povećanje poreznih primitaka smanjenjem
poreznog jaza. Procjenjujemo da se poluge učinkovitosti koje smo identificirali primjenjuju na 20 do
25 posto operativnih proračuna s potencijalnim uštedama od 15 do 20 posto. Smanjenje pogreške
i troškova primanja na prijevaru moguće je u procijenjenih 1 do 3 posto transfernih plaćanja (imajte
na umu da se ovo odnosi na dio transfernih plaćanja koji imaju nezanemarive iznose pogrešaka i
prijevare i procijenjeni postotak troškova pogreške i prijevare) , štedeći do 40 posto troškova
nastalih iz tih izvora.57 Što se tiče povećanja poreznih primitaka, procjenjujemo da će porezni jaz
biti u rasponu od 5 do 10 posto ukupnih europskih poreznih primitaka i da će do 20 posto toga
može se nadoknaditi. Sveukupno, javni sektori 23 najveće europske vlade mogli bi potencijalno
stvoriti 150 do 300 milijardi €—i potencijalno više—u novoj vrijednosti godišnje tijekom deset
godina. To implicira povećanje godišnjih stopa rasta produktivnosti u javnom sektoru za oko 0,5
postotnih bodova iznad očekivanih, ako se trenutni trendovi održe (Prikaz 19).
56 Vidi Jason Baumgarten i Michael Chui, “E-government 2.0,” McKinsey Quarterly, srpanj 2009. za priču o
Zakladi Sunlight, organizaciji koja je stvorila sličnu stranicu u Sjedinjenim Državama.
57 Na temelju studija koje su provele vlade, procjenjujemo da prijevara ili pogreška mogu utjecati na
približno 55 posto transfernih plaćanja i da ta pogreška i prijevara mogu povećati troškove do 3 posto.
Machine Translated by Google
62
Prikaz 19
Veliki podaci imaju potencijal stvoriti vrijednost od 150 do 300 milijardi eura ili
više u cijelom javnom sektoru OECD-a u Europi
Operativni 4000 20–25 (prikaz, stručni). 15–20 (prikaz, stručni). 120–200 (prikaz, stručni).
Uštede
rashodi
operativne
učinkovitosti
prijevara i prijenosom
greška
Porezni prihod 5400 5–103 (prikaz, ostalo). 10–20 (prikaz, stručni). 25–110 (prikaz, stručni).
Povećanje
naplate poreza
150–300+
1 Osnovica za uštede operativne učinkovitosti su ukupni državni rashodi neto transfernih plaćanja; osnova za smanjenje prijevara je
ukupna državna transferna plaćanja; osnova za povećanje naplate poreza su porezni prihodi.
2 Uzima u obzir postotak transfernog plaćanja koje može imati prijevaru/pogrešku kao i procijenjeni trošak pogreške i prijevare.
3 U slučaju naplate poreza, postotak koji se može adresirati odnosi se na postotak procijenjenog poreznog jaza.
NAPOMENA: Brojevi se možda neće zbrojiti zbog zaokruživanja.
Osim toga, veliki podaci mogu donijeti niz značajnih nemonetarnih dobitaka u javnom sektoru,
uključujući poboljšanu raspodjelu sredstava u programe, kvalitetnije usluge, povećanu odgovornost
javnog sektora, bolje informirano građanstvo i gotovo sigurno povećano povjerenje javnosti u vlada.58
Nakon što je jedna od agencija za rad u EU počela segmentirati svoje usluge, došlo je do
dokumentiranog povećanja kvalitete interakcije između klijenata agencije i voditelja slučaja. Građani
i tvrtke mogu potrošiti manje vremena i truda u interakciji s vladinim agencijama i dobiti usluge koje
su bolje usmjerene na njihove potrebe. Veća transparentnost informacija stvara bolju odgovornost u
agencijama javnog sektora i veće povjerenje javnosti.
Čelnici javnog sektora koji žele ostvariti vrijednosni potencijal koji nude veliki podaci moraju se
pozabaviti brojnim unutarnjim i vanjskim problemima. To uključuje implementaciju odgovarajuće
tehnologije, regrutiranje i obuku talentiranog osoblja i upravljanje promjenama unutar njihovih
organizacija. Jednako važno, vlada će morati upotrijebiti politiku kako bi podržala prikupljanje
vrijednosti velikih podataka i dijeljenje podataka između agencija.
Prvi zadatak je uspostaviti kulturu unutar javnog sektora u kojoj se odluke usmjerene na poboljšanje
učinka donose na temelju podataka. Tek kada vlada svoje ciljeve učinka i popratne podatke učini
transparentnima, vladine će se agencije i javnost značajnije uključiti u te ciljeve. Kada
64
Ovo je područje u kojem digitalni podaci igraju sve veću ulogu jer potrošači pretražuju, istražuju,
uspoređuju, kupuju i dobivaju podršku na mreži, a proizvodi koje prodaju trgovci sve više generiraju
vlastite digitalne podatke. Naravno, vrijednost koju će igrači u maloprodajnom sektoru i njihovi kupci stvarno
uhvatiti ovisit će kritično o akcijama trgovaca na malo da prevladaju prepreke povezane s tehnologijom,
Ova studija fokusirana je na američki maloprodajni sektor, ali također se oslanjamo na najbolju praksu i
iskustva kompanija širom svijeta. Potencijalni pozitivni učinak većine poluga velikih podataka koje opisujemo
gotovo bi sigurno bio sličan u drugim razvijenim zemljama. Ispitali smo primjenu velikih podataka u većini
maloprodajnih podsektora kako je opisano standardnim sjevernoameričkim sustavom klasifikacije djelatnosti
(NAICS). Konkretno, u našu analizu uključujemo one podsektore u kojima kupci obavljaju male do umjerene
prosječne pojedinačne kupnje i one s umjerenom do visokom učestalošću interakcije (vidi okvir 9, „Koje smo
maloprodajne podsektore proučavali?“). Ne uključujemo tvrtke privatnih robnih marki trgovaca na malo. U
našoj studiji slučaja o proizvodnji pokrivamo dobavljače robe.
njega; Opća trgovačka roba; građevinski materijal i vrtna oprema; trgovci na malo izvan trgovina;
hrane i pića; odjeća i dodaci; sportska oprema, hobi, knjige i glazba; elektronika i uređaji; razno; te
namještaj i pokućstvo.
Nismo uključili trgovce motornim vozilima i dijelovima niti benzinske postaje. Primarni razlog za
isključivanje trgovaca motornim vozilima bio je taj što je učestalost kupnje motornih vozila, često
drugog najvrjednijeg predmeta u kućanstvu nakon samog doma, relativno rijetka, tako da je razina
čini manje usporedivom s drugim podsektorima maloprodaje s daleko većom raznolikošću proizvoda
i čijim ulaznim troškovima manje dominira jedan promjenjivi čimbenik (cijene nafte).
Maloprodaja čini znatan dio gospodarstva SAD-a. Godine 2009. taj je udio iznosio procijenjenih 6
posto gospodarstva, što je postotni bod manje u odnosu na 2000. Predviđanja industrije ukazuju na
samo skroman rast u sljedećih pet godina jer će sektor postojano,
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 65
ali se polako oporavlja od recesije. Povijesni trendovi pokazali su da postoji bliska veza između
rasta maloprodaje i rasta razvijenih tržišnih gospodarstava u cjelini. Za referencu, Međunarodni
monetarni fond (MMF) predviđa godišnji rast američkog BDP-a od 2,7 posto do 2015. godine.
Prikaz 20
100 100
90 90 Za svakih 1,00 $
operativne dobiti
80 80
Trgovac danas, trgovci dobivaju
70 70
40 40
Daljnji pritisci na
30 30 cijene smanjit će 0,31
USD operativne dobiti
CPG
20 20
koju trgovac trenutno
kontrolira
10 10
Niz razvoja velikih podataka izvršit će veći pritisak na snižavanje cijena na trgovce.
Taj će pritisak doći zbog niza novih tehnologija koje kupcima daju moćne informacije o
cijenama, promocijama i proizvodima, često u stvarnom vremenu. Aplikacije kao što je
RedLaser, na primjer, omogućuju kupcima da svojim pametnim telefonima skeniraju crtični
kod artikla u trgovini i odmah dobiju usporedbu cijena i proizvoda. Osim toga, usvajanje
internetske i mobilne trgovine (više od 50 posto maloprodaje bit će online ili pod utjecajem
online kanala do 2014.) moglo bi osigurati veliko povećanje transparentnosti cijena koje će
prenijeti ogromnu vrijednost na potrošače (Prikaz 21). Ovaj će trend vjerojatno smanjiti
marže za trgovce na malo koji se natječu isključivo cijenom. Već je jasno da tamo gdje kupci
imaju lak pristup usporedbi cijena među trgovcima na malo, cijene su znatno niže.60
60 Postoji duga povijest akademske literature o odnosu između oglašavanja (online i offline) i
cijena koja je pokrivala proizvode od naočala do alkohola i usluga kao što su odvjetnici. Vidi,
na primjer, Lee Benham, “Učinak oglašavanja na cijenu naočala,” Journal of Law and Economics
15(2), listopad 1972.: 337–352.
Machine Translated by Google
66
Prikaz 21
1,658
1,542
1,423 249
230
1,307
210
1,194
192
1,072 173
Internetska maloprodaja 155
1,409
1,312
1,213
Maloprodaja pod 1,115
917 1,021
utjecajem weba
% od ukupnog broja
42 46 48 50 51 53
prodaja u SAD-u
IZVOR: Forrester Research Prognoza maloprodaje pod utjecajem interneta, prosinac 2009
Iako veliki podaci povezani s novom tehnologijom na neki način potiskuju industriju,
oni također nude značajne nove prilike za stvaranje vrijednosti. Trgovci u sektoru i
njihovi konkurenti u stalnoj su utrci za prepoznavanje i implementaciju onih poluga
velikih podataka koje će im dati prednost na tržištu. Količina podataka nezaustavljivo
raste jer trgovci ne samo da bilježe svaku kupčevu transakciju i operaciju, već također
prate nove izvore podataka kao što su čipovi za radiofrekvencijsku identifikaciju (RFID)
koji prate proizvode te ponašanje i raspoloženje kupaca na mreži.
61 Paket Wrigley's žvakaćih guma bio je prvi artikl u trgovini skeniran pomoću Universala
Kod proizvoda—u supermarketu Marsh u Troyu, Ohio, 1974.
kapital i produktivnost rada trgovca na malo i troškovni položaj. Kad su 1990-ih drugi trgovci krenuli
oponašati ono što je Wal-Mart bio pionir kako bi ostali konkurentni, produktivnost je porasla u cijeloj
industriji.
Danas vodeći igrači istražuju podatke o kupcima kako bi informirali odluke koje donose o upravljanju
svojim opskrbnim lancem do prodaje i cijena. Wal-Martovo detaljno i troškovno učinkovito praćenje
kupaca daje trgovcu mogućnost istraživanja petabajta podataka o preferencijama kupaca i kupovnom
ponašanju, te na taj način dobiva važne ustupke u određivanju cijena i distribuciji od tvrtki za robu
široke potrošnje.
Trgovci na malo u cijeloj industriji postaju sve sofisticiraniji u rezanju velikih podataka koje prikupljaju
iz višestrukih prodajnih kanala, kataloga, trgovina i online interakcija. Široko rasprostranjena
upotreba sve preciznijih podataka o kupcima može omogućiti trgovcima na malo da poboljšaju
učinkovitost svog marketinga i merchandisinga. Poluge velikih podataka primijenjene na operacije i
opskrbne lance nastavit će smanjivati troškove i sve više stvarati nove konkurentske prednosti i
strategije za rastuće trgovce na malo.
prihod.
Identificirali smo 16 velikih maloprodajnih poluga koje trgovci mogu koristiti duž lanca vrijednosti.
Ove poluge spadaju u pet glavnih kategorija marketinga, prodaje robe, operacija, opskrbnog lanca i
novih poslovnih modela (Prikaz 22).
Prikaz 22
Marketing podataka
Unakrsna prodaja Marketing
temeljen na lokaciji Analiza
ponašanja u trgovini Mikrosegmentacija
kupaca Analiza sentimenta
Poboljšanje višekanalnog iskustva
potrošača
Marketing
1. Unakrsna prodaja. Najsuvremenija unakrsna prodaja koristi sve podatke koji se mogu znati o
kupcu, uključujući kupčeve demografske podatke, povijest kupovine, preferencije, lokacije u
stvarnom vremenu i druge činjenice za povećanje prosječne veličine kupnje. Na primjer,
Amazon.com koristi kolaborativno filtriranje za generiranje upita "možda biste i vi željeli" za svaki
kupljeni ili posjećeni proizvod. U jednom je trenutku Amazon izvijestio da je 30 posto prodaje bilo
zahvaljujući njegovom mehanizmu preporuka. Još jedan primjer ove poluge je korištenje analize
velikih podataka za optimizaciju promocija u trgovini koje povezuju komplementarne artikle i
proizvode u paketu.
Machine Translated by Google
68
Trgovci sada mogu ažurirati ove sve preciznije podatke u gotovo stvarnom vremenu kako bi
se prilagodili promjenama kupaca. Neiman Marcus, vrhunski trgovac na malo, razvio je
segmentaciju ponašanja i višeslojni program nagrađivanja članstva, a ta je kombinacija
dovela do znatno veće kupnje proizvoda s višom maržom od njegovih najimućnijih kupaca s
višom maržom.
5. Analiza sentimenta. Analiza sentimenta iskorištava opsežne tokove podataka koje generiraju
potrošači u različitim oblicima društvenih medija kako bi pomogla u donošenju raznih
poslovnih odluka. Na primjer, trgovci na malo mogu koristiti analizu raspoloženja kako bi
procijenili odgovor u stvarnom vremenu na marketinške kampanje i prilagodili smjer prema
tome. Razvojno polje analize podataka društvenih medija igra ključnu ulogu jer se potrošači
sve više oslanjaju na mišljenje i preporuke kolega pri donošenju odluka o kupnji. Pojavili su
se različiti alati za praćenje u stvarnom vremenu i odgovor na ponašanje i odabire potrošača
na webu.
Trgovanje robom
2. Optimizacija cijena. Trgovci na malo danas mogu iskoristiti sve veću granularnost
podataka o cijenama i prodaji i koristiti više razine analitičke snage kako bi
optimizaciju cijena podigli na novu razinu. Razni izvori podataka mogu se koristiti za
procjenu i donošenje odluka o cijenama u gotovo stvarnom vremenu. Složeni modeli
elastičnosti potražnje ispituju povijesne podatke o prodaji kako bi dobili uvid u cijene na
razini SKU-a, uključujući smanjenje cijena i raspored. Prodavci mogu upotrijebiti dobivene
podatke za analizu promotivnih događaja i procijeniti izvore porasta prodaje i sve temeljne
troškove koje bi oni mogli uključiti. Jedan trgovac hranom ispituje cjenovnu elastičnost
među svojim kupcima za različite kategorije. Ruralni potrošači hrane, na primjer, vide
maslac i rižu kao viši prioritet pri kupnji i stoga su ti proizvodi možda manje cjenovno
elastični nego što bi bili za urbane kupce. Urbani potrošači, u međuvremenu, teže
stavljati žitarice i slatkiše na viši nivo među svojim prioritetima.
3. Optimizacija postavljanja i dizajna. Fizički trgovci na malo također mogu značajno dobiti
optimiziranjem postavljanja robe i vizualnog dizajna (npr. završnih kapa, polica) rudarenjem
podataka o prodaji na razini SKU-a — u biti, lokalne verzije vrsta optimizacije koje zahtijevaju
prednost podataka o pješačkom prometu. Mrežni trgovci na malo mogu prilagoditi
položaje web stranica na temelju podataka o interakciji stranice kao što su pomicanje,
klikovi i prelasci mišem. Na primjer, eBay je proveo tisuće eksperimenata s različitim
aspektima svoje web stranice kako bi odredio optimalan izgled i druge značajke od navigacije
do veličine svojih fotografija.
Operacije 1.
2. Optimizacija utroška rada. Još jedna operativna poluga koja može stvoriti vrijednost
kroz smanjenje troškova uz održavanje razine usluge je oko optimizacije inputa rada,
automatiziranog praćenja radnog vremena i prisutnosti te poboljšanog rasporeda rada. Ova
poluga može stvoriti točnija predviđanja potreba za osobljem, posebno tijekom vršnih
razdoblja, tako da se može izbjeći preveliki kapacitet. Budući da rad u trgovini predstavlja
približno 30 posto fiksnih troškova prosječnog trgovca, korištenje ove poluge se itekako
isplati.
Machine Translated by Google
70
Lanac opskrbe
1. Upravljanje zalihama. S dodatnim detaljima koje nudi napredno analitičko rudarenje višestrukih skupova
podataka, veliki podaci mogu nastaviti poboljšavati upravljanje zalihama trgovaca, najbolje u klasi
upravljanje zalihama pruža potpunu transparentnost na razini SKU-a, dok sustavi crtičnog koda
povezani s automatiziranim procesima nadopunjavanja smanjuju incidente nestanka zaliha. Vodeći
trgovci na malo poboljšavaju predviđanje zaliha kombiniranjem više skupova podataka kao što su
povijest prodaje, vremenska predviđanja i sezonski ciklusi prodaje. Zajedno, poboljšano upravljanje
zalihama omogućuje trgovcima na malo da drže nižu razinu zaliha jer su zalihe mnogo čvršće
povezane sa signalima potražnje, istovremeno smanjujući broj izgubljenih prodaja zbog nestašice
robe.
2. Optimizacija distribucije i logistike. Vodeći trgovci na malo također optimiziraju prijevoz korištenjem
velike podatkovne telematike s omogućenim GPS-om (tj. daljinsko izvješćivanje o položaju, itd.) i
optimizacijom ruta kako bi poboljšali upravljanje svojim voznim parkom i distribucijom. Transportna
analitika može poboljšati produktivnost optimiziranjem učinkovitosti goriva, preventivnog
održavanja, ponašanja vozača i rutiranja vozila.
3. Informiranje pregovora s dobavljačima. U svijetu velikih podataka, vodeći trgovci na malo mogu
analizirati preferencije kupaca i kupovno ponašanje kako bi informirali svoje pregovore s
dobavljačima. Oni mogu koristiti podatke o cijenama i transakcijama kako bi usmjerili dogovorene
koncesije na ključne proizvode, na primjer. Korištenje velikih podataka u ovoj areni značajna je
prilika, s obzirom na to da cijena prodane robe čini najveći dio troškova za trgovca na malo.
Međutim, trebali bismo primijetiti da dobavljači također prepoznaju važnost razumijevanja
preferencija kupaca te aktivno dobivaju pristup i analiziraju podatke o ponašanju potrošača kako
bi otkrili uvide koji jačaju njihovu ulogu u pregovorima s trgovcima na malo.
Lavina podataka u maloprodajnoj industriji, zajedno s drugim naprecima u poslovanju, omogućuje pojavu
inovativnih poslovnih modela. Ti su modeli najintrigantniji i najinovativniji—ali i potencijalno najopasniji—
za tradicionalne trgovce. Dva nova poslovna modela s najvećom privlačnošću danas su usluge usporedbe
cijena i tržišta temeljena na webu.
2. Tržišta temeljena na webu. Tržišta temeljena na webu, poput onih koje nudi
Amazon i eBay pružaju pretražive popise proizvoda velikog broja dobavljača. Osim
transparentnosti cijena, oni nude pristup velikom broju prodajnih niša koji inače nemaju
marketinšku ili prodajnu snagu da dođu do potrošača. Oni također pružaju ogromnu
količinu korisnih informacija o proizvodu, uključujući recenzije koje generiraju potrošači i
koje potrošačima pružaju dodatnu transparentnost.
Budući da smo se oslanjali na najbolju globalnu praksu, nalazi ove studije slučaja mogu se
primijeniti na druge zemlje i regije—uz određene rezerve. Razvijena gospodarstva naći će poluge
koje smo identificirali i rezultirajuće analize izravno primjenjivima. Ali potencijalne prilike mogle
bi biti još veće u područjima koja još nisu počela koristiti velike podatke kao pokretač rasta. U
regijama kao što je Europa gdje su zakoni o radu relativno rigidniji, poluge optimizacije radnih
resursa mogu dati manje dramatične rezultate.
Procijenili smo potencijalni učinak svake od 16 poluga velikih podataka koje smo opisali,
koristeći kombinaciju vlastitih studija slučaja, akademskog i industrijskog istraživanja te
intervjua sa stručnjacima; za više o našoj metodologiji pogledajte dodatak. Iako procjenjujemo
ukupnu potencijalnu vrijednost koju veliki podaci mogu omogućiti, ne predviđamo koju će
vrijednost sektor stvarno ostvariti jer to uvelike ovisi o radnjama koje poduzimaju trgovci na malo
kako bi prevladali brojne prepreke, uključujući prepreke povezane s tehnologijom, talentom i
kulturom , kao i vanjski čimbenici poput toga jesu li potrošači spremni na istraživanje podataka
o njihovom ponašanju i sposobnost dobavljača da iskoriste neke od istih poluga u pregovorima.
Ukupan potencijalni učinak pojedinačnih poluga velikih podataka značajno se razlikuje među
maloprodajnim podsektorima (Prikaz 24). Neki će podsektori već povući velike podatkovne poluge
više od drugih, djelomično objašnjavajući ovu varijaciju.
Machine Translated by Google
72
Prikaz 23
Različite poluge imaju različite utjecaje na operativne marže poduzeća
Utjecaj na operativnu maržu %
Marketing
Trgovanje robom
Operacije
Lanac opskrbe
Transparentnost cijena
IZVOR: Razgovori stručnjaka; javno dostupni podaci; McKinsey studije slučaja; Analiza McKinsey Global Institute
Dokaz 24
Potencijal velike vrijednosti podataka u maloprodaji Najveća relevantnost
Poboljšana unakrsna
prodaja
Marketing temeljen
na lokaciji
Analiza ponašanja u
trgovini
Marketing
Mikro segmentacija
kupaca
Analiza
sentimenta
Poboljšanje
višekanalnog
iskustva
Asortiman
optimizacija
Optimizacija cijena
Optimizacija
postavljanja i dizajna
Transparentnost
Trgovačke
operacije
izvedbe
Optimizacija
utroška rada
Poboljšano
upravljanje
zalihama
Optimizacija
opskrbe
Lanac
distribucije i logistike
Informiranje
pregovora s
dobavljačima
posao
Novi
1 Usluge
usporedbe
cijena
1 Utjecaj tržišta temeljenih na webu vrlo je teško kvantificirati i to nije ovdje uključeno.
Dok pojedinačni igrači mogu koristiti velike podatkovne poluge za rast svojih vrhunskih
linija i operativnih marži, ti će dobici uvelike promijeniti vrijednost unutar industrije, a ne
povećati njezinu ukupnu veličinu. Tvrtke koje su relativno bolje u implementaciji poluga
velikih podataka doživjet će značajne dobitke nauštrb onih koje to ne provode dobro.
Ukupni pobjednici trebali bi biti potrošači koji će imati koristi od robe koja bolje odgovara
njihovim potrebama.
Ali mnogi ljudi ostaju neinformirani o tome kako, gdje i u kojoj mjeri se te informacije
koriste u ciljanom oglašavanju i drugim marketinškim strategijama.
64 Stephen Oliner i Daniel Sichel, “Informacijska tehnologija i produktivnost: Gdje smo sada i kamo
idemo?”, Federal Reserve Bank of Atlanta Economic Review, 2002.
Machine Translated by Google
74
Diljem svijeta promatramo pojavu različitih koncepata elektroničke privatnosti. Njemačka je,
primjerice, ograničila korištenje Street View funkcije Google karata. Ovisno o nadležnosti i
svrsi, postoje različite definicije osobnih podataka (PII)—što se zakonski računa kao informacije
koje identificiraju osobu za razne svrhe. Neke su definicije općenitije od drugih, a veliki igrači bi
imali koristi od standarda jedne zemlje ili industrije.
Sa svoje strane, rukovoditelji maloprodaje moraju upravljati i prevladati brojne prepreke kako
bi ostvarili puni potencijal velikih podataka. Prvi je način razmišljanja zaposlenika i tvrtki; mnogi
ljudi još uvijek IT vide kao back-office funkciju i stoga kao veliko troškovno središte, a ne kao
pokretač poslovnog rasta. Nasuprot tome, vodeće tvrtke u svom korištenju velikih podataka
shvaćaju da će njihove IT inicijative biti ključni izvor konkurentske prednosti. Te se tvrtke moraju
pobrinuti da poslovni i IT čelnici blisko surađuju kako bi upotreba velikih podataka poduprla
poboljšanja u poboljšanju učinkovitosti i prilike za stvaranje vrijednosti. Tvrtke bi također trebale
aktivno tražiti i implementirati inovacije temeljene na velikim podacima koje će im dati dugoročne
konkurentske prednosti.
Još jedna uobičajena prepreka predvodnicima velikih podataka su njihovi naslijeđeni IT sustavi.
Mnogi od ovih sustava instalirani su prije nekoliko desetljeća, mnogo prije nego što su današnje
prilike za velike podatke bile razmatrane ili čak moguće. Ovi naslijeđeni sustavi obično uključuju više
silosa informacija generiranih u nekompatibilnim standardima i formatima tako da ih nije moguće lako
integrirati, pristupiti im i analizirati. Pokušaji nadogradnje i integracije ovih sustava mogu biti toliko
teški i opterećeni potencijalom uvođenja novih grešaka u sustavu da se jedan maloprodajni
stručnjak požalio da je takav pokušaj "puno gori od pokretanja od nule".
76
Proizvođači su također optimizirali svoj globalni otisak postavljanjem lokacija u regije s niskim
troškovima ili eksternalizacijom proizvodnje u regije s niskim troškovima. No unatoč takvom
napretku, proizvodnja se, nedvojbeno više od većine drugih sektora, suočava s izazovom stvaranja
značajnog poboljšanja produktivnosti u industrijama koje su već postale relativno učinkovite.
Vjerujemo da veliki podaci mogu poduprijeti još jedan znatan val dobitaka.65
Ove zaključke temeljimo na ispitivanju višestrukih proizvodnih podsektora koji obuhvaćaju diskretnu
i procesnu proizvodnju, od osnovnih proizvodnih podsektora kao što su roba široke potrošnje i
hrana, do naprednih proizvodnih podsektora kao što su automobilska i zrakoplovna industrija.
Naslonili smo se na primjere najbolje globalne prakse upotrebe velikih podataka kako bismo
identificirali sedam poluga stvaranja vrijednosti, opisali raspon potencijalnog utjecaja i prepreke koje
je potrebno prevladati da bi se uhvatila ta vrijednost.66
razvojni put i stvorio sve složenije mreže vrijednosnih lanaca koji obuhvaćaju svijet.67
Sve globalniji i fragmentirani proizvodni lanci vrijednosti stvaraju nove izazove koje
proizvođači moraju prevladati kako bi održali rast produktivnosti. U mnogim su
slučajevima tehnološke promjene i globalizacija omogućile zemljama da se specijaliziraju
za određene faze proizvodnog procesa. Kao rezultat toga, proizvođači su okupili globalnu
proizvodnju i mreže opskrbnog lanca kako bi postigli troškovne prednosti. Na primjer,
tipični globalni proizvođač potrošačke elektronike ima proizvodne pogone na gotovo
svim kontinentima, odmjeravajući troškove logistike u odnosu na troškove proizvodnje
kako bi optimizirao otisak svojih pogona. Napredni proizvođači također često imaju
velik broj dobavljača, specijaliziranih za proizvodnju specifičnih vrsta komponenti gdje imaju
održive prednosti i u cijeni i u kvaliteti. Tipično je da veliku tvornicu za montažu
proizvođača originalne automobilske opreme (OEM) opskrbljuje do 4000 vanjskih dobavljača.
67 Dok je prijelaz na postindustrijsko gospodarstvo trajao oko 200 godina u Ujedinjenom Kraljevstvu
i oko 130 godina u Njemačkoj, Južnoj Koreji trebalo je oko 60 godina. Vidi Eberhard Abele,
Tobias Meyer, Ulrich Näher, Gernot Strube i Richard Sykes, ur., Globalna proizvodnja: priručnik
za strategiju i provedbu (Berlin: Springer, 2008.).
Machine Translated by Google
78
Dokaz 25
68 Imajte na umu da osim smanjenja vremena razvoja, proizvođači, kao rezultat korištenja
integrirani PLM, mogu poboljšati kvalitetu i smanjiti resurse kako bi razvili više izvedenica ili
proširenja proizvoda.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 79
2. Dizajn prema vrijednosti. Dok dobivanje ulaznih podataka od kupaca kroz istraživanje tržišta ima
Tradicionalno dio procesa dizajna proizvoda, mnogi proizvođači tek trebaju sustavno izvući ključne
uvide iz sve veće količine podataka o kupcima kako bi poboljšali postojeće dizajne i pomogli u razvoju
specifikacija za nove modele i varijante. Najbolji proizvođači u klasi provode zajedničke analize kako bi
odredili koliko su kupci spremni platiti za određene značajke i kako bi razumjeli koje su značajke
najvažnije za uspjeh na tržištu.69 Te tvrtke nadopunjuju takve napore dodatnim kvantitativnim
uvidima o kupcima iz izvora kao što su kao podaci o prodajnom mjestu i povratne informacije kupaca.
Novi izvori podataka koje proizvođači počinju iskopavati uključuju komentare kupaca na društvenim
mrežama i podatke senzora koji opisuju stvarnu upotrebu proizvoda.
Tvrtke koje se bave proizvodnjom robe široke potrošnje kao što su Kraft i Procter and Gamble
pozivaju svoje potrošače na ideje, kao i surađuju s vanjskim stručnjacima, uključujući akademike i
industrijske istraživače, na razvoju novih proizvoda. Početkom 2000-ih, P&G se suočio s problemom
rastućih troškova istraživanja i razvoja, ali sve manjom isplativošću. Kao odgovor na to, tvrtka je
stvorila program otvorenih inovacija Connect and Develop, čiji je jedan element bio iskorištavanje
InnoCentivea, web platforme koja poziva stručnjake da riješe tehničke izazove s kojima se P&G
suočava.
Danas polovica novih proizvoda ima elemente koji su nastali izvan tvrtke, što je porast u odnosu na
15 posto u 2000. Produktivnost istraživanja i razvoja u P&G-u porasla je za 60 posto, a udio
istraživanja i razvoja u prihodu pao je s 4,8 na 3,4 posto. Ali koliko god uspješne ove otvorene
inovacijske inicijative mogle biti, jedan ključni problem je kako izvući, na učinkovit način, istinski
vrijedne ideje iz potencijalno velikog broja inputa koje ovi programi mogu generirati. To je zadatak koji
tehnike velikih podataka poput automatiziranih algoritama mogu pomoći riješiti.
Otvorene inovacije putem velikih podataka proširene su i na napredne industrije. BMW je, na
primjer, stvorio "sustav za upravljanje idejama" kako bi pomogao u procjeni ideja predanih putem
svoje "virtualne agencije za inovacije". Ovo je presjeklo
80
je da je tvrtka svake godine u svoje modele uključila dvije ili tri glavne ideje iz svojih napora
otvorenih inovacija. Dodatna prednost ovih tehnika otvorene inovacije je da stvaraju više
angažmana robne marke kod sudionika u tim naporima, kao i pozitivan "halo" učinak kako ove
inicijative postaju šire prepoznate.
Lanac opskrbe
Proizvođači, posebno oni koji proizvode robu široke potrošnje, imaju značajne dodatne
mogućnosti za poboljšanje predviđanja potražnje i planiranja opskrbnog lanca. Nestalnost potražnje
kritično je pitanje za proizvođače. Njihovi kupci u maloprodaji snažno su se zalagali za veću fleksibilnost
i osjetljivost dobavljača, s obzirom na različite i stalno mijenjajuće preferencije potrošača.
Ostali trendovi, poput sve većeg korištenja promocija i taktičkog određivanja cijena, samo su povećali
probleme volatilnosti s kojima se dobavljači suočavaju.
Proizvodnja
70 “Internet stvari” odnosi se na senzore i aktuatore unutar mreža fizičkih objekata. Za više
informacija pogledajte Michael Chui, Markus Löffler i Roger Roberts, “The Internet of Things”,
McKinsey Quarterly, ožujak 2010.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 81
smo opisali, proizvodne tvrtke koriste podatke iz interakcija s kupcima ne samo za poboljšanje
marketinga i prodaje, već i za donošenje odluka o razvoju proizvoda. Sve je više ekonomski
izvedivo ugraditi senzore u proizvode koji mogu "telefonirati kući", generirajući podatke o
stvarnom korištenju i izvedbi proizvoda. Proizvođači sada mogu u stvarnom vremenu dobiti
podatke o nedostacima koji se pojavljuju i odmah prilagoditi proizvodni proces. Operacije
istraživanja i razvoja mogu dijeliti te podatke za redizajn i razvoj novih proizvoda. Mnogi
proizvođači građevinske opreme već ugrađuju senzore u svoje proizvode, a to može pružiti
precizne podatke u stvarnom vremenu o korištenju i obrascima korištenja, omogućujući tim
proizvođačima da poboljšaju predviđanja potražnje, kao i njihov budući razvoj proizvoda.
82
tehničar može biti poslan prije nego što kupac uopće shvati da će komponenta
vjerojatno pokvariti. Drugi su proizvođači uspjeli transformirati komercijalni odnos s
kupcima iz odnosa u kojem prodaju proizvod u odnos u kojem prodaju uslugu. Primjer su
proizvođači mlaznih motora koji prodaju "snagu po satu".
Prikaz 26
opskrbe ponude
IZVOR: Razgovori stručnjaka; pretraživanje tiska i literature; Analiza McKinsey Global Institute
Velik dio vrijednosti koju veliki podaci mogu stvoriti u proizvodnji zahtijeva pristup i
raznoliku upotrebu podataka iz više izvora u cijelom proširenom poduzeću. Dakle,
da bi se ispunio potencijal za stvaranje vrijednosti u ovom sektoru, od proizvodnih će
tvrtki biti potrebno ulaganje u IT kao i organizacijske promjene. Potrebna dodatna IT
ulaganja možda nisu beznačajna. Neke od poluga velikih podataka o kojima smo
raspravljali, uključujući ažuriranje PLM platforme koja može povezati različite IT sustave,
bit će skupe. Ipak, dugoročna isplativost trebala bi nadmašiti trošak. Ostala ulaganja
bit će potrebna za razvoj sučelja i protokola za učinkovito dijeljenje podataka u proširenom
poduzeću. Standardizacija sučelja bit će ključna i može zahtijevati partnerstva u cijeloj
industriji. Snažno podijeljene tvrtke, s više IT sustava i preklapajućim i/ili suvišnim
podacima u različitim operacijama i odjelima, očito su u nepovoljnijem položaju. Na
primjer, kako bi ostvarila prednosti dizajna prema vrijednosti, tvrtka mora imati besplatnu
razmjenu podataka između marketinga i prodaje, istraživanja i razvoja i proizvodnje. Dakle,
u mnogim će organizacijama postizanje uspjeha zahtijevati snažno vodstvo i kulturološki
pomak kako bi se uspostavili načini razmišljanja i ponašanja koji će probiti današnje
silose. Mnoge će organizacije morati poduzeti programe organizacijskih promjena kako bi
izvršile nužnu promjenu—grupe koje nikada nisu dijelile svoje podatke neće to početi
činiti samo zato što su IT sustavi na mjestu.
84
Konačno, tamo gdje velike podatkovne aplikacije dotiču potrošače i druge krajnje korisnike,
postoje problemi s privatnošću. Jedna od ideja koja najviše obećava korištenje je podataka
senzora proizvoda za stvaranje fino ciljanih usluga nakon prodaje ili dodatne prodaje. Ali
korištenje ove poluge bit će moguće samo ako se potrošači ne bune protiv toga da dobavljači
nadziru kako koriste njihove proizvode. Proizvođači se stoga moraju proaktivno pozabaviti
pitanjima privatnosti, u suradnji s kreatorima politike, i komunicirati s krajnjim korisnicima o
izborima i transparentnosti podataka.
Svjedoci smo eksplozije u količini dostupnih informacija o tome gdje se ljudi nalaze u
svijetu. Tehnologije poput GPS-a omogućuju nam brzo lociranje uređaja malenog poput
mobilnog telefona unutar nekoliko desetaka metara, a vidimo kako se osobni podaci o
lokaciji koriste za stvaranje vala novih poduzeća i inovativnih poslovnih modela koji dotiču
živote ljudi širom zemaljske kugle. Ova će se revolucija nastaviti tijekom sljedećeg
desetljeća i nakon toga s prilikama koje ne možemo ni zamisliti. Kvaliteta, dostupnost i
količina osobnih podataka o lokaciji poboljšat će se i proširiti, dosežući u mnoge poslovne
sektore i stvarajući transformacijske financijske prilike daleko iznad onih kojima danas
svjedočimo.
Za razliku od drugih domena koje smo ispitali, novi skupovi osobnih podataka o lokaciji nisu
ograničeni na jedan sektor, već sijeku mnoge industrije, uključujući telekomunikacije,
maloprodaju i medije. Ova domena nudi potencijal za stvaranje velike nove vrijednosti u
sljedećih deset godina koju procjenjujemo na više od 100 milijardi dolara prihoda za
pružatelje usluga i čak 700 milijardi dolara vrijednosti za krajnje potrošače i poslovne
korisnike. Ostvarivanje ove vrijednosti zahtijevat će prave pokretače, uključujući dostatna
ulaganja u tehnologiju, infrastrukturu i osoblje, kao i odgovarajuće vladine mjere.
U ovoj smo analizi ispitali osobne podatke o lokaciji koji točno određuju — unutar nekoliko
gradskih blokova — gdje se osoba (ili uređaj) nalazi u stvarnom vremenu, obično izraženo
u digitalnom kodu koji prikazuje lokaciju pojedinca na mreži razapetoj preko površine
Zemlje (vidi okvir 10, "Kako smo definirali opseg osobnih podataka o lokaciji?").
Rani izvor osobnih podataka o lokaciji bila su plaćanja kreditnim i debitnim karticama
pojedinaca, povezana s osobnim identifikacijskim podacima s kartica koje su uvučene
na prodajnim terminalima (POS) obično na fiksnim lokacijama. Slična veza bila je moguća
korištenjem transakcija izvršenih na bankomatima. U svijetu je 2008. bilo 90 do 100
milijardi takvih transakcija izvan mreže koje su se mogle povezati s POS uređajima. Zakon
provedbene istrage redovito koriste takve podatke za utvrđivanje fizičke lokacije.
Kako se broj ljudi koji koriste mobilne telefone povećao, uporaba signala mobilnih tornjeva
za triangulaciju lokacije takvih uređaja postala je sve češća.
Ova tehnologija ima potencijal identificirati lokaciju vlasnika gotovo 5 milijardi diljem
svijeta. Prodor pametnih telefona također je sve veći. U 2010. već je bilo u upotrebi oko
600 milijuna uređaja, a predviđa se da će njihov broj rasti oko 20 posto godišnje.
Pametni telefoni imaju GPS, tehnologiju koja triangulira lokaciju unutar otprilike 15 metara
pomoću konstelacije satelita u orbiti.
Mnogi pametni telefoni također imaju Wi-Fi umrežavanje, dodatni izvor podataka za
određivanje lokacije. Usluge kao što je Skyhook mapirale su fizičku lokaciju raznih Wi-Fi
mreža koje emitiraju svoj identitet (identifikator skupa usluga ili SSID) i stoga omogućuju
mobilnom uređaju da povezuje Wi-Fi mreže koje detektira s fizičkom lokacijom. Ove
tehnologije pametnih telefona čine osobne podatke o lokaciji preciznijima i daleko
dostupnijima, osobito programerima aplikacija za mobilne uređaje.
Osim toga, razvijaju se nove tehnologije koje određuju osobnu lokaciju unutar zgrada u
kojima su GPS signali notorno slabi. Shopkick je aplikacija za mobilni telefon koja trgovcima
omogućuje praćenje svojih kupaca od trenutka kada uđu u trgovinu hvatajući nečujne
zvukove koje emitiraju uređaji u trgovini na
Machine Translated by Google
86
mikrofon mobilnog telefona. Još jedan primjer takve inovacije je tvrtka Path Intelligence sa
sjedištem u Velikoj Britaniji, koja može pratiti pješački promet unutar trgovačkih centara ili
zabavnih parkova pasivnim praćenjem identifikacijskih signala koje šalju pojedinačni mobilni telefoni.
koordinate, kao što su podaci izvedeni iz satova koji prate udaljenosti trčanja i raznih
senzora kretanja.
Također smo isključili podatke o lokaciji ne-ljudskih objekata kao što su paketi
koji se prate kao inventar ili kontejneri za otpremu koji su označeni GPS senzorima.
Praćenje lokacije objekata može omogućiti ogromnu ekonomsku vrijednost. Na
primjer, globalna lokacija robe visoke vrijednosti i/ili kvarljive robe dok je u otpremi, npr.
farmaceutskih proizvoda ili komponenti visoke tehnologije, podaci su od velike vrijednosti
i za dobavljače i za kupce tih proizvoda. Neke logističke tvrtke već nude mogućnost
pružanja ovih podataka svojim klijentima, kombinirajući lokaciju s drugim podacima sa
senzora na brodu paketa koji prevoze tu robu, npr. temperaturu ili fizičke šokove koje su
pretrpjeli tijekom prijevoza. Neke od prednosti praćenja lokacije objekata već su se
pokazale u našem istraživanju maloprodaje i proizvodnje. Za ovu smo studiju slučaja
proučavali primjene podataka o lokaciji o pojedincima kako bismo se usredotočili na skup
novih aplikacija i aplikacija u nastajanju te ograničili naše istraživanje na opseg kojim se
može upravljati.
Kombinacija navigacijskih uređaja, praćenja mobilnih tornjeva i pametnih telefona čini većinu
osobnih podataka o lokaciji danas. Navigacijski uređaji glavni su izvor količine podataka jer tako
često ažuriraju svoje lokacije. Mobilni tornjevi generiraju veliku količinu osobnih podataka o
lokaciji jednostavno zato što postoji toliko mnogo korisnika mobilnih telefona diljem svijeta. A
pametni telefoni su ogroman i brzo rastući izvor tih podataka jer većina korisnika koristi aplikacije
koje zahtijevaju praćenje njihove lokacije.
Naše istraživanje procjenjuje da je globalni skup generiranih osobnih podataka o lokaciji bio
najmanje 1 petabajt u 2009. i da taj skup raste za oko 20 posto godišnje (Prikaz 27).74 (Imajte na
umu da ne uključujemo potencijalnu količinu podataka iz triangulacija staničnih tornjeva.)75
Eksplozivan rast upotrebe pametnih telefona s GPS-om je
glavni pokretač ove ekspanzije.76 U usporedbi s drugim sektorima, kao što je zdravstvo, koji
mjere veličinu ukupnih podataka u eksabajtima (1 eksabajt je 1000 puta PB), ukupna veličina
podataka o čistoj osobnoj lokaciji relativno je mala jer količina podataka potrebna za snimanje jedne
lokacije je samo nekoliko bajtova, dok je veličina svake slike ili videa u megabajtima. Međutim,
relativno mala količina podataka koju generira domena osobne lokacije sugerira da ova vrsta podataka
potencijalno nudi mnogo veću vrijednost po generiranom bajtu, kao što ćemo raspravljati.
Prikaz 27
Ukupni podaci o osobnoj lokaciji iznose više od 1 petabajta godišnje na globalnoj razini
Podaci o osobnoj lokaciji generirani globalno, 2009
Terabajti
1000–
400–2.500 3000+
5–20 0 <1–2
npr. igre
1 Moderne usluge hitnih poziva, kao što je North American Enhanced 911, izvješćuju o lokaciji kada se uputi hitni poziv.
IZVOR: Press pretraga; stručni razgovori; strateška analitika; Analiza McKinsey Global Institute
Azija je vodeća regija za generiranje osobnih podataka o lokaciji jednostavno zato što se tamo koristi
toliko mnogo mobilnih telefona. Na primjer, Kina ima više mobilnih telefona u upotrebi nego bilo koja
druga zemlja s procijenjenih 800 milijuna uređaja u 2010.
Indija je na drugom mjestu u tom pogledu s više od 650 milijuna mobilnih telefona u upotrebi,
dok je Sjeverna Amerika na trećem mjestu sa svojih 300 milijuna mobilnih telefona u 2010. zasjenila.
Očekuje se da će rast upotrebe mobilne telefonije brzo rasti na tržištima u razvoju, a posebice
upotreba naprednih uređaja na tržištima u razvoju.77 U Kini, na primjer, očekujemo da će se
broj osnovnih telefona smanjiti na stopa od 13 posto godišnje između 2010. i 2015., no korištenje
uređaja s pametnim značajkama povećat će se za procijenjenih 5 posto godišnje tijekom tog razdoblja,
a korištenje naprednih telefona za nevjerojatnih 33 posto. Predviđamo da će se uglavnom slični
trendovi odvijati u Indiji (Prikaz 28).
76 Podaci o lokaciji koje generiraju pametni telefoni i njihove aplikacije rastu dvostruko više od
prosječne stope rasta za sve podatke o lokaciji (što također uključuje, na primjer,
navigacijske uređaje) zbog brzog rasta prihvaćanja pametnih telefona.
77 Yankee Group dijeli mobilne telefone u tri kategorije: osnovni telefoni, pametne značajke i napredni
operativni sustav (OS). Napredni operativni sustav (OS) najbliže je značenju pametnih telefona
koji se danas koriste u medijima. Pogledajte Globalnu mobilnu prognozu, Yankee Group, prosinac
2010.
Machine Translated by Google
88
Prikaz 28
Baza instaliranih mobilnih telefona, 2010 Složena godišnja stopa rasta 2010–
Milijuni 15, %
Bliski istok,
Sjeverna Afrika
76 517 87 680 -23 3 22
78 Navigaciju koja koristi prometne podatke u stvarnom vremenu smatramo aplikacijom velikih podataka jer
zahtijeva analizu velikog skupa podataka o trenutnom prometnom zagušenju. “Tradicionalni” navigacijski
sustavi koji ne koriste podatke o prometu u stvarnom vremenu još uvijek su prilično česti i mogu
pružiti značajnu korist. Na primjer, vlasnički istraživački projekt NAVTEQ proveden u Njemačkoj
pokazao je da vozači koji koriste navigacijske uređaje voze kraće udaljenosti i provode manje vremena
u vožnji (uključujući poboljšanje učinkovitosti goriva za 12 posto).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 89
3. Usluge mobilnog telefona temeljene na lokaciji. Također postoji niz drugih usluga temeljenih
na lokaciji (LBS) koje se brzo razvijaju i šire na mobilnim telefonima. Ove usluge uključuju
sigurnosne aplikacije za praćenje djece i drugih članova obitelji ili pronalaženje prijatelja.
Primjeri koji se već danas nalaze uključuju Foursquare (više od 8 milijuna korisnika od travnja
2011.) i Loopt (više od 5 milijuna korisnika u travnju 2011.). Loopt, osnovan 2006. godine u
Mountain Viewu u Kaliforniji, je aplikacija za pametne telefone koja se može preuzeti i koja
korisnicima omogućuje dijeljenje informacija o lokaciji u stvarnom vremenu, statusnih poruka i
geo-označenih fotografija sa zajednicom prijatelja. Detaljne karte koje su dostupne na svim
većim mrežama u SAD-u i iz nekoliko trgovina aplikacijama pokazuju gdje su prijatelji, što rade
i kako se naći s njima. Loopt generira prihod prvenstveno kroz geografski ciljane oglase i
promocije.
Postoje i mobilne usluge temeljene na lokaciji koje pronalaze zanimljiva mjesta i pružaju
dodatne informacije o, na primjer, najbližoj kemijskoj čistionici ili kineskom restoranu ili najboljim
lokacijama s kojih možete pozvati taksi u prenapučenim gradovima. U
budućih godina osobni podaci o lokaciji omogućit će mobilno igranje poput lova na čistače ili
vojnih simulacija temeljenih na lokacijama igrača (Prikaz 29).
79 Koristimo McKinseyjev vlasnički model kako bismo došli do ove procjene projiciranih globalnih emisija
iz cestovnog prometa u 2020.
Machine Translated by Google
90
Prikaz 29
1 Navigacijske i druge aplikacije za neindividualnu upotrebu procijenjene su zasebno i nisu ovdje uključene.
IZVOR: Press pretraga; Analiza McKinsey Global Institute
80 Potrošači koji potiču digitalni pristup: ekonomska vrijednost usluga koje se temelje na online oglašavanju
za potrošače, McKinsey & Company za IAB Europe, rujan 2010.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 91
ShopAlerts, koji je razvio PlaceCast iz San Francisca i New Yorka, proizvod je "push SMS"
zasnovan na lokaciji koji tvrtke uključujući Starbucks, North Face, Sonic, REI i American Eagle
Outfitters već koriste za privlačenje prometa u svoje trgovine. Oglašivači definiraju geografsku
granicu u kojoj se korisnicima koji su se uključili šalju push SMS tipično u obliku promocije ili
oglasa za posjet određenoj trgovini; općenito, korisnik ne bi primio više od tri takva upozorenja
tjedno. ShopAlerts tvrdi da ima 1 milijun korisnika širom svijeta. U Sjedinjenim Državama, tvrtka
kaže da može locirati više od 90 posto mobilnih telefona koji se koriste diljem zemlje. Tvrtka
izvještava da 79 posto ispitanih potrošača kaže da je vjerojatnije da će posjetiti trgovinu kada
prime relevantan SMS; 65 posto ispitanika reklo je da su kupili zbog poruke; a 73 posto je reklo da
će vjerojatno ili sigurno koristiti uslugu u budućnosti.
ponašaju se na manje rizičan način kada znaju da su nadzirani. Ovaj učinak treba dokazati, ali ono
što se čini sigurnim jest da tehnologije koje se brzo poboljšavaju temeljene na osobnim podacima o
lokaciji imaju potencijal pomoći osiguravateljima u razvoju drugih usluga za poticanje sigurnije vožnje.
Na primjer, osiguravatelji bi mogli početi nuditi upozorenja u stvarnom vremenu o prometnim i
vremenskim uvjetima (kao što smo vidjeli u slučaju pametnog rutiranja), visokorizičnim parkiralištima
i promjenama ograničenja brzine.
4. Hitni odgovor. Sve veća dostupnost osobnih podataka o lokaciji, promet u stvarnom vremenu i GPS
telematika jasno nude prostor za brže i učinkovitije vrijeme odgovora službenika za provođenje
zakona, vatrogasaca i osoblja hitne pomoći. Ove tehnologije omogućuju dispečerima hitnih službi
da brzo identificiraju lokaciju osobe koja prijavljuje hitan slučaj, osiguravaju da osoblje može
odgovoriti što je brže moguće (putem pametnog usmjeravanja) i nadziru vlastitu sigurnost u često
opasnim okruženjima.
prilično različita područja donošenja odluka koja mogu imati koristi od analize podataka o osobnoj
lokaciji u agregatu su urbanističko planiranje i maloprodajna poslovna inteligencija, koje ovdje ističemo.
Međutim, uvjereni smo da će se pojaviti mnoge druge aplikacije i poslovni modeli kako se ove tehnologije
budu poboljšavale, a njihova upotreba sve veća.
92
2. Maloprodajna poslovna inteligencija. Trgovci mogu koristiti osobne podatke o lokaciji za razumijevanje
obrasci kupnje, prikupljanje informacija o gustoći pješačkog prometa i brzini
radi generiranja detaljnih uvida o tome gdje kupci usporavaju i ubrzavaju kao odgovor
na promocije i oglašavanje, a zatim povezivanje tih obrazaca s podacima o kupnji
proizvoda, demografskim podacima kupaca i povijesnim obrascima kupnje. Takva
detaljna inteligencija može pomoći u poboljšanju niza poslovnih odluka od rasporeda
u trgovini do prodaje (pogledajte okvir 12, "Kako funkcionira praćenje kretanja kupaca?").
Dokaz 30
Kako funkcionira praćenje lokacije?
Ulazni Izlaz
RFID oznaka
+ Mobilni telefoni
Video
Osobno
praćenje
3. Neki novi poslovni modeli. Kako dostupnost osobnih podataka o lokaciji postaje sve
češća i svijest o njihovoj vrijednosti sve raširenija, druga će se tržišta razviti i za
agregirane i za neobrađene podatke. Na primjer, Sense Networks komercijalizira
Macrosense, model tehnologije strojnog učenja koji agregira povijesne podatke i
podatke o lokaciji mobilnog telefona u stvarnom vremenu kako bi, na primjer,
identificirao najbolje uglove ulica s kojih možete zaustaviti taksi (pogledajte okvir 13,
„Sense mreže : Analiza agregiranih informacija o lokaciji”). Kao još jedan primjer,
grad Boston pokrenuo je aplikaciju pod nazivom Street Bump koja koristi podatke o
osobnoj lokaciji za otkrivanje rupa. Street Bump koristi tehnologiju već ugrađenu u
pametne telefone, uključujući GPS i akcelerometre, te bilježi lokaciju automobila i
veličinu rupa kroz koje prolazi. Grad je uputio javni izazov korisnicima da pronađu
najbolju metodologiju za mapiranje stanja na ulicama i da Street Bump budu što
korisniji.
ZNAČAJAN I RASTUĆI
Naša detaljna analiza glavnih primjena osobnih podataka o lokaciji danas iu bliskoj
budućnosti otkriva da, za deset godina, te aplikacije imaju potencijal stvoriti vrijednost
od 100 milijardi dolara ili više samo za pružatelje usluga. Ova dodatna vrijednost
vjerojatno će prvenstveno doći od prodaje navigacijskog hardvera i prihoda od LBS-a,
mobilnih LBS premija i geo-ciljanog oglašavanja.81 Poduzetnici će razviti mnoge od ovih
usluga i aplikacija, s obzirom na činjenicu da model trgovine aplikacija za mobilne
uređaje već nudi spremne prodajne i marketinške kanale, uvelike smanjujući prepreke
ulasku novih inovativnih igrača.
94
aplikacija). Preostalih 30 posto ukupnog iznosa koji će pripasti kupcima bit će dodatna
vrijednost koju će dobiti tvrtke koje koriste poluge omogućene podacima o lokaciji, kao što
je povrat marketinških stručnjaka na geografsko ciljano mobilno oglašavanje.
Dokaz 31
Vrijednost glavnih poluga povećava se na više od 800 milijardi dolara do 2020. milijarde
dolara godišnje
mjesto
OnStar)
Geografski ciljano mobilno oglašavanje1 30–40 (prikaz, stručni). 75–100 (prikaz, stručni).
organizacije
Promjena vrijednosti
od 8 do 15 milijardi dolara
1 Za dimenzioniranje vrijednosti geo-ciljanog mobilnog oglašavanja, pružatelji usluga definirani su kao oni koji prodaju oglasni inventar,
npr. pružatelji platformi za oglašavanje; kupci se definiraju kao trgovci koji kupuju oglasni inventar.
2 Pojedinačni trgovac na malo dobit će povećanje prihoda, što predstavlja promjenu vrijednosti, a ne stvaranje vrijednosti na makrorazini.
NAPOMENA: Brojevi se možda neće zbrojiti zbog zaokruživanja.
Kako se obujam i točnost podataka o osobnoj lokaciji povećava, tako će rasti i zabrinutost za
privatnost i sigurnost. Zakoni su općenito nejasni o tome koja skupina - od mobilnih operatera,
vlasnika platformi, programera aplikacija i proizvođača mobilnih telefona do stvarnih korisnika
- posjeduje pravo prikupljanja, prikupljanja, širenja i korištenja osobnih podataka o lokaciji u
komercijalne svrhe. Mnoga komercijalna poduzeća koja su izjavila da će štititi privatnost ovih
podataka mogla su ih koristiti relativno slobodno. Ali ima poziva građana koji žele znati da su
njihova privatnost i sigurnost osobnih podataka o lokaciji zaštićeni i koji smatraju da su opt-in/opt-
out ugovori nejasni. Okvir koji jasno opisuje dopušteno i zabranjeno korištenje tih podataka bio bi
koristan za sve dionike.
A bit će i tehnoloških izazova. Na primjer, operateri koji razvijaju aplikacije morat će paziti na
mogućnost novih komplikacija i pogrešaka.
Nizozemska vlada, prikupljajući i analizirajući podatke o zagušenosti na autocesti na temelju
gustoće položaja mobilnih telefona, primijetila je da je određeni segment autoceste imao neobičnu
vršnu zagušenost koja se pojavljivala i naglo nestajala svaki sat.
Ispostavilo se da je autocesta blizu prigradske željeznice kojom prolazi vlak u vrijeme najveće
gužve.
Svi ovi aspekti domene osobnih podataka o lokaciji koja se razvija predstavljaju značajne izazove
za rukovoditelje i kreatore politike. Poslovni čelnici već bi trebali razmotriti potencijalne prednosti
iskorištavanja ovih podataka, posebno u područjima marketinga i poboljšanja operativne
učinkovitosti, te izgradnje poslovnih slučajeva oko današnjih uočljivih prilika. Ali također bi
trebali eksperimentirati s novim poslovnim modelima kako bi izvukli maksimalnu vrijednost.
Rukovoditelji bi trebali raditi u
Za kreatore politike, prvi prioritet u ovoj domeni koja se brzo razvija je osigurati postojanje
odgovarajućih poticaja za inovacije, uključujući razvoj ažurnog okvira za pravila i prava
intelektualnog vlasništva, financiranje istraživanja i razvoja u potencijalnim prodornim područjima
i osiguravanje da infrastruktura, uključujući politiku spektra, optimalna.
Machine Translated by Google
96
Primjena osobnih podataka o lokaciji ima potencijal pružiti više od 800 milijardi dolara
ekonomske vrijednosti pojedinačnim potrošačima i organizacijama tijekom sljedećeg
desetljeća, u procesu kataliziranja razvoja širokog spektra inovativnih poduzeća u mnogim
sektorima. Samo pametne navigacijske aplikacije mogle bi globalnim potrošačima ponuditi
oko 500 milijardi dolara vrijednosti ušteđenog vremena i goriva do 2020.
Geo-ciljano oglašavanje pojavljuje se kao vrlo učinkovito marketinško sredstvo koje bi
do 2020. moglo predstavljati više od 5 posto ukupne globalne potrošnje na oglašavanje.
Rukovoditelji i kreatori politika trebaju raditi zajedno kako bi omogućili rast ove domene
podataka i oslobodili njezin puni potencijal.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 97
Identificirali smo pet široko primjenjivih načina za iskorištavanje velikih podataka koji
nude transformacijski potencijal za stvaranje vrijednosti i imaju implikacije na način na koji će
pojedinačne organizacije morati biti dizajnirane, organizirane i upravljane. Pitanja koja postavljaju
ovi nalazi uključuju: Kako će se korporativne marketinške funkcije i aktivnosti morati razvijati ako
je moguće eksperimentiranje velikih razmjera i kako će se poslovni procesi vjerojatno promijeniti?
Kako će tvrtke vrednovati i iskoristiti svoju imovinu (osobito podatkovnu imovinu) i može li njihov
pristup i analiza podataka zapravo stvoriti veću vrijednost od, recimo, robne marke? Kako veliki
podaci mogu poremetiti uspostavljene poslovne modele? Na primjer, neke industrijske dinamike
počivaju na činjenici da postoje informacijske asimetrije — kako bi se ta dinamika promijenila da
transparentnost oko podataka umjesto toga proizvodi informacijsku simetriju? Kako će se postojeće
tvrtke s naslijeđenim poslovnim modelima i infrastrukturom natjecati s novopridošlicama koje se
ne suočavaju s takvim ograničenjima? A kako će svijet izgledati kada se višak počne seliti s
dobavljača na kupce?
1. Stvaranje transparentnosti
Olakšavanje dostupnosti velikih podataka relevantnim dionicima na pravo vrijeme može stvoriti
ogromnu vrijednost. Uistinu, ovaj aspekt stvaranja vrijednosti preduvjet je za sve druge poluge i
najneposredniji je način da poduzeća i sektori koji su danas manje napredni u prihvaćanju velikih
podataka i njihovih poluga iskoriste taj potencijal. U mnogim slučajevima te mogućnosti postoje
tamo gdje postoji neusklađenost poticaja za stvaranje transparentnosti podataka, kao što je
nedostatak imperativa izvedbe. Na primjer, u javnom sektoru otkrili smo slučajeve u kojima je osoblje
odjela trošilo 20 posto svog vremena tražeći informacije od drugih državnih odjela koristeći
nedigitalna sredstva (npr. papirnate imenike i pozivajući ljude), a zatim su te informacije dobivale
putujući na druga mjesta i prikupljanje podataka na fizičkim medijima kao što su kompaktni diskovi.
Takav uzaludan trud uvelike je smanjen u organizacijama koje su iskoristile velike podatke za
digitalizaciju tih informacija, učinile ih dostupnima putem mreža i implementirale alate za
pretraživanje kako bi se relevantne informacije lakše pronašle.
Međutim, čak iu sektorima koji su prihvatili IT i velike podatke i gdje postoje značajni
poticaji za veću izvedbu, pronašli smo prostor za povećanje transparentnosti i dijeljenje
velikih podataka. U proizvodnji su mnoge tvrtke koristile velike podatke za poboljšanje učinka u
istraživanju i razvoju (npr. složene simulacije) ili u upravljanju
Machine Translated by Google
98
njihovih opskrbnih lanaca. Međutim, ove aplikacije često iskorištavaju samo one podatke koji
su sadržani unutar jedne funkcionalne grupe u tvrtki. Integriranje podataka iz istraživačkih i
razvojnih, inženjerskih i proizvodnih jedinica, potencijalno u nekoliko poduzeća, može omogućiti
istodobne inženjerske tehnike koje mogu uvelike smanjiti gubitak uzrokovan preradom dizajna i tako
ubrzati vrijeme do tržišta.
omogućuje prikupljanje podataka—i osjećaju da se svijet neprestano poboljšava. Sve više tvrtki
digitalizira i pohranjuje sve veću količinu vrlo detaljnih podataka o transakcijama. Sve se više senzora
ugrađuje u fizičke uređaje - od opreme za pokretne trake do automobila i mobilnih telefona - koji
mjere procese, upotrebu krajnjih proizvoda i ljudsko ponašanje. Pojedinačni potrošači također
stvaraju i dijele ogromnu količinu podataka putem bloganja, ažuriranja statusa i objavljivanja
fotografija i videa. Velik dio tih podataka sada se može prikupiti u stvarnom ili gotovo stvarnom
vremenu.
Imati pristup svim tim podacima i u nekim slučajevima mogućnost manipuliranja uvjetima pod
kojima su generirani omogućava vrlo drugačiji način donošenja odluka koji uključuje uvođenje
više znanosti u upravljanje—tj. primjenu klasičnih znanstvenih metoda u praksi upravljanja. 82
Konkretno, menadžeri sada mogu koristiti znanstveni proces kontroliranog eksperimentiranja koji
uključuje formuliranje specifičnih hipoteza, dizajniranje i provođenje eksperimenata (uključujući
kontrolne i terapijske skupine) za testiranje tih hipoteza, a zatim rigoroznu analizu kvantitativnih
rezultata prije donošenja odluke. Mnoge tvrtke donose odluke na vrlo ad hoc način - kako su neki
rekli, kroz "upravljanje HiPPO-a, mišljenja najplaćenijih osoba."83 Organizacija vođena podacima
donosi odluke na temelju empirijskih rezultata i prednosti takav pristup podacima pokazao je
akademsko istraživanje.84
Čelnici u mnogim sektorima već počinju koristiti kontrolirane eksperimente za donošenje boljih
odluka. Na primjer, zdravstveni sektor sada provodi komparativne studije učinkovitosti na
kliničkim podacima za cijelu populaciju kako bi identificirao i razumio izvore varijabilnosti u
liječenju i ishodima, identificirao protokole liječenja koji su najučinkovitiji i najučinkovitiji te
pomogao donositeljima odluka u stvaranju smjernica osmišljenih za osigurati da se odluke o
liječenju temelje na najboljoj znanosti. Trgovci, posebno oni koji posluju online, ali sve više i oni s
fizičkim trgovinama, prilagođavaju cijene i promocije u pokušaju da eksperimentiraju koja
kombinacija najbolje privlači promet i prodaju.
Nije uvijek moguće (možda iz etičkih razloga ili izvedivosti) postaviti kontrolirani eksperiment za
manipuliranje nezavisnom varijablom. Alternativa je traženje "prirodnih eksperimenata" za utvrđivanje
postojeće varijabilnosti u metrikama izvedbe. Razumijevanje pokretača ove prirodne varijabilnosti
može se koristiti kao smjernica
82 Janaki Akella, Timo Kubach, Markus Löffler i Uwe Schmid, Upravljanje temeljeno na podacima:
Bringing more science into management, McKinsey Technology Initiative Perspective, 2008.
83 Najranije spominjanje ove kratice dao je evanđelist Googleove analitike Avinash Kaushik. Pogledajte
Sedam koraka za stvaranje kulture odlučivanja vođene podacima, listopad 2006. (www.kaushik.net/
avinash/2006/10/seven-steps-to-creating-a-data-driven-decision-making culture.html).
84 Erik Brynjolfsson, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako
odlučivanje temeljeno na podacima utječe na izvedbu poduzeća?, travanj 2011., dostupno na SSRN
(ssrn.com/ abstract=1819486).
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 99
upravljačke poluge za poboljšanje tog učinka. U javnom sektoru pronašli smo velike agencije koje
su otkrile velike razlike u produktivnosti i točnosti rada na različitim mjestima obavljajući gotovo
identične zadatke. Jednostavno stavljanje ovih informacija na raspolaganje na svim web-lokacijama
potaknulo je lokacije koje su kasnile da značajno poboljšaju svoju izvedbu. Nikakve promjene u
naknadi nisu obećane; nakon što su ljudi shvatili da su loši, njihova natjecateljska priroda proradila
je i njihovo promatranje najboljih praksi na stranicama s najboljim rezultatima pomoglo im je promijeniti
njihovu izvedbu bez novčanih poticaja.
uvide koji bi inače ostali skriveni. Big data pruža sirovinu potrebnu za razvoj algoritama ili za rad tih
algoritama. Porezne agencije s najboljom praksom, na primjer, koriste automatizirane mehanizme za
rizik koji koriste velike podatke za označavanje kandidata za daljnje ispitivanje. Algoritmi za velike
podatke u maloprodaji mogu optimizirati procese odlučivanja, omogućujući automatsko fino
podešavanje zaliha i određivanje cijena kao odgovor na prodaju u trgovini i na mreži u stvarnom
vremenu. Proizvodne tvrtke mogu automatski prilagoditi proizvodne linije kako bi optimizirale
učinkovitost, smanjile otpad i izbjegle opasne uvjete. U nekim slučajevima, tvrtke neće nužno
automatizirati odluke, ali će ih olakšati analizom skupova podataka koji su daleko veći od onih
skupova podataka kojima pojedinac može upravljati pomoću proračunske tablice. Neke organizacije
već donose učinkovitije odluke analizirajući čitave skupove podataka kupaca i zaposlenika ili čak
senzora ugrađenih u proizvode. Analitika temeljena na velikim podacima danas uključuje sustave
temeljene na pravilima, statističke analize i tehnike strojnog učenja kao što su neuronske mreže.
Ovo je područje koje se brzo mijenja i stalno se razvijaju novi oblici analitike temeljene na podacima.
(Pogledajte poglavlje “Tehnike i tehnologije velikih podataka.”)
100
Dokaz 32
Grozd A Grozd D
Neki su sektori pozicionirani za veće dobitke od upotrebe
Grozd B Grozd E
velikih podataka. Povijesni rast produktivnosti u Sjedinjenim
Grozd C
Državama, 2000. – 2008. % 24,0
Veličine mjehurića
označavaju relativne veličine BDP-a
23.5
23.0
22.5
Računalni i elektronički proizvodi
Informacija
9.0
-2,0
Druge usluge Obrazovne usluge
-2.5
-3,0 Izgradnja
-3.5
Niska visoko
Indeks potencijalnih vrijednosti velikih podataka1
1 Pogledajte dodatak za detaljne definicije i metriku koja se koristi za indeks potencijala vrijednosti.
IZVOR: Američki ured za statistiku rada; Analiza McKinsey Global Institute
85 Proučavali smo Sjedinjene Države posebno zbog relativne dostupnosti relevantnih podataka
oko brojeva i veličina pojedinih tvrtki. Primjenjivost ovih specifičnih nalaza u drugim zemljopisnim
područjima varirat će ovisno o sličnostima pojedinih sektora.
86 Indeks potencijalne vrijednosti sastoji se od pet metrika koje su osmišljene kao zamjene za
označavanje (1) količine podataka dostupnih za korištenje i analizu; (2) varijabilnost u izvedbi;
(3) broj dionika (kupaca i dobavljača) s kojima organizacija u prosjeku posluje; (4) intenzitet
transakcije; i (5) turbulencija svojstvena sektoru. Vjerujemo da su to karakteristike zbog kojih je
više ili manje vjerojatno da će sektor iskoristiti pet transformativnih prilika za velike podatke.
Za više detalja pogledajte dodatak.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 101
inovativnost je vrlo visoka (npr. brzo uvođenje proizvoda u potrošačku elektroniku). Čak iu bliskoj
budućnosti vidimo značajan prostor za dobivanje veće vrijednosti velikih podataka.
Nekoliko sektora (klaster C), uključujući graditeljstvo, obrazovne usluge te umjetnost i zabavu,
zabilježilo je negativan rast produktivnosti, što vjerojatno ukazuje na to da se ti sektori
suočavaju sa jakim sistemskim preprekama povećanju produktivnosti.
Ipak, ako se te prepreke mogu prevladati, mislimo da veliki podaci mogu omogućiti povećanje
produktivnosti čak iu ovim sektorima. Primjeri gdje postoji potencijal uključuju mjerenje varijacija
u učinku nastavnika u poboljšanju akademskog uspjeha učenika – dodana vrijednost za
nastavnike – što može biti učinkovit
Među preostalim sektorima, sektori kojima se trguje na globalnoj razini (uglavnom klaster
D) (npr. proizvodnja, trgovina na veliko) obično su doživjeli veći povijesni rast produktivnosti,
dok lokalne usluge (uglavnom klaster E) (npr. maloprodaja, pružatelji zdravstvenih usluga,
smještaj i hrana) ) ostvarili niži rast. Mnogi od tih sektora mogu izvući značajnu vrijednost iz
velikih podataka, iako će to ovisiti o opsegu u kojem su prepreke prevladane. Sektori koji mogu
imati umjereniji potencijal od upotrebe velikih podataka, kao što su građevinarstvo i
administrativne usluge, obično nemaju karakteristike koje bi mogle iskorištavanje velikih podataka
učiniti izazovnijim nego u drugim sektorima. Oni imaju manje podataka od drugih sektora i manje
dionicima, a također su manje transakcijski intenzivni.
Naš indeks pokazuje da od sektora koje smo detaljno proučavali, dva, zdravstvo i proizvodnja,
imaju samo skroman potencijal od korištenja velikih podataka. To je zato što indeks mjeri nekoliko
kriterija na razini pojedinog poduzeća (npr. količina podataka po poduzeću kao zamjena za broj
kupaca po poduzeću). U Sjedinjenim Državama, na primjer, obje ove industrije su jako fragmentirane
- imaju mnogo više tvrtki ili igrača nego drugi sektori. S obzirom na to da su podaci obično
fragmentirani duž granica poduzeća ili organizacije, to implicira da će prilike za velike podatke biti
ograničene u tim sektorima. Unatoč tome, čak iu tim industrijama, igrači velikih razmjera imaju
mogućnost prikupiti dovoljno podataka da izvuku značajnu vrijednost (vidi poglavlje 3a o zdravstvenoj
skrbi za primjere). Nadalje, moguće je, iako obično izazovnije, da mnoge pojedinačne tvrtke
udružuju, dijele ili trguju podacima, ponekad putem trećih strana, kako bi uhvatile vrijednost iz
velikih podataka (vidi, posebice, poglavlje 3d o proizvodnji, gdje globalno distribuirani opskrbni lanci
mogu se optimizirati dijeljenjem velikih podataka). Konsolidacija u industriji također može donijeti
korisne učinke razmjera u agregaciji i analizi podataka.
Dok će svi sektori morati prevladati prepreke kako bi uhvatili vrijednost od korištenja velikih
podataka, prepreke su strukturno veće za neke nego za druge (Prikaz 33). Na primjer, vlada se
može suočiti s većim preprekama zbog izazova oko dostupnosti podataka i načina razmišljanja
vođenog podacima. Obrazovanje se suočava sa sličnim izazovima, uz relativan nedostatak ulaganja
u IT. Štoviše, intenzitet konkurencije u tim je sektorima relativno nizak u usporedbi s onim
sektorima u kojima tržišne snage djeluju slobodnije.
U sektorima koji su više vođeni tržištem, imperativ korištenja podataka pojačan je izravnijim
vezama s ekonomskom vrijednošću za uključene tvrtke i korisnike. Sektori kao što su
Machine Translated by Google
102
financije i osiguranje, proizvodnja i profesionalne usluge mogu imati relativno niže razine
prepreka koje treba prevladati upravo iz suprotnih razloga.
Prikaz 33
Ukupni
indeks
Cate lakoće Način razmišljanja Podaci
gorije Sektori snimanja1 Talenat IT intenzitet vođen podacima dostupnost
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Financije i osiguranje
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
Naših pet studija slučaja obuhvatilo je i razvijena gospodarstva i gospodarstva u nastajanju, a naši
nalazi sugeriraju da upotreba velikih podataka može donijeti značajnu vrijednost diljem zemljopisnih područja.
Pronašli smo vrlo značajan potencijal za stvaranje vrijednosti na razvijenim tržištima primjenom
poluga velikih podataka u zdravstvu i maloprodaji. Međutim, ako uzmemo uštedu vremena za
vozače koja se može postići korištenjem navigacijskih alata u domeni osobnih podataka o lokaciji,
nalazimo da je 20 do 40 posto globalnog potencijala na tržištima u razvoju.
Različita gospodarstva i regije pokazuju vrlo različite karakteristike od količine podataka koje
generiraju do zrelosti svoje ICT infrastrukture. To ukazuje na to da bi neka geografska područja
mogla biti spremna ostvariti vrijednost brže od drugih.
Pristup velikim podacima ključni je preduvjet za bilježenje vrijednosti. Danas Sjeverna Amerika
i Europa čine većinu novih pohranjenih podataka (Prikaz 34). To sugerira da će, barem u kratkom
roku, veliki dio globalnog potencijala za stvaranje vrijednosti korištenjem velikih podataka biti u
najrazvijenijim gospodarstvima. Iako to može biti točno u cjelini, pojedinačne tvrtke na tržištima
u razvoju mogle bi uživati u pristupu velikim podacima koji bi im mogli omogućiti da ostvare
značajnu vrijednost. Osim toga, organizacije na tržištima u razvoju mogle bi pohranjivati i
analizirati svoje podatke u podatkovnim centrima koji se nalaze na razvijenim tržištima.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 103
Sve dok postoje pravi uvjeti, postoji značajan potencijal za iskorištavanje velikih
podataka u gospodarstvima u razvoju. Uzmite u obzir činjenicu da je Azija već vodeća
regija za generiranje osobnih podataka o lokaciji jednostavno zato što se toliko
mobilnih telefona koristi. Više mobilnih telefona—procijenjenih 800 milijuna uređaja
u 2010.—u upotrebi je u Kini nego u bilo kojoj drugoj zemlji (vidi Prilog 28). Nadalje,
iako neke organizacije na tržištima u nastajanju zaostaju za svojim kolegama na
razvijenom tržištu u pogledu IT sredstava, to bi se zapravo moglo pokazati kao prednost.
Organizacije u gospodarstvima u razvoju mogle bi preskočiti najnoviju tehnologiju,
zaobilazeći naslijeđene sustave s kojima se moraju boriti mnoge njihove kolege u
naprednim gospodarstvima.
Dokaz 34
>3500
>2000
Sjeverno >250
Amerika Europa
Kina
>400
Japan
>200
Bliski istok i >50
Afrika Indija
>50 >300
latinski Ostatak APAC-a
Amerika
1 Novi pohranjeni podaci definirani kao količina raspoložive pohrane koja se koristi u određenoj godini; vidi dodatak za više o definiciji i
pretpostavke.
IZVOR: IDC izvješća o skladištenju; Analiza McKinsey Global Institute
87 Steve Lohr, “Za današnjeg diplomanta, samo jedna riječ: statistika,” New York Times, 5. kolovoza 2009.
Machine Translated by Google
104
Američko tržište rada povijesno je imalo visoku razinu diplomanata s diplomama u takozvanim
STEM područjima: znanosti, tehnologiji, inženjerstvu i matematici.
Međutim, posljednjih je godina ponuda takvih diplomanata bila usporena u vrijeme kada je
potražnja za njima rasla. Na primjer, na vrhuncu posljednje ekonomske ekspanzije u SAD-u,
zaposlenost za zanimanja povezana s matematikom porasla je za gotovo 4 posto, a njihove realne
plaće porasle su za 1 posto; u to se vrijeme nacionalna zaposlenost povećala za samo 1,5 posto, a
realne plaće porasle su za samo 0,6 posto.90 Tijekom tog razdoblja, broj naprednih diploma dodijeljenih
u matematici, statistici i inženjerstvu smanjio se za oko 2 posto. U budućnosti će potreba za talentom
koji se može nositi s velikim podacima zapravo biti mnogo specifičnija od pukih diplomanata STEM-a.
Iz tog smo razloga proveli detaljnu analizu uspoređujući potencijalnu potražnju za prve dvije
kategorije talenata za velike podatke – duboki analitički talent i menadžere i analitičare koji
razumiju podatke – s predviđenom ponudom u skladu s trenutnim trendovima.
U slučaju dubokog analitičkog talenta, upotrijebili smo podatke Američkog ureda za statistiku
rada (BLS) o trenutnim zanimanjima kako bismo analizirali ponudu talenata u američkoj radnoj snazi.
Podaci su iz 2008. godine, posljednje godine za koju su dostupni potpuni podaci. Koristili smo
postojeće BLS modele za projiciranje ponude dubokog analitičkog talenta u 2018., pod pretpostavkom
da se trenutni trendovi održe.
Zatim smo upotrijebili dva odvojena analitička modela kako bismo triangulirali perspektivu
potencijalne potražnje za dubokim analitičkim talentom, uz pretpostavku da će tvrtke u cijelom
gospodarstvu u potpunosti usvojiti tehnike velikih podataka do 2018. Prvi od ova dva modela
temeljili smo na prilagodbi BLS modela za objašnjavaju različite stupnjeve rasta dubokog analitičkog
talenta na temelju intenziteta podataka različitih tvrtki. Drugi smo model temeljili na potrebnim
brojevima dubokih analitičkih talenata u različitim industrijama prema veličini tvrtke.
Procjenjujemo da je ponuda dubokih analitičkih talenata u Sjedinjenim Državama 2008. bila oko
150.000 radnih mjesta. Ako uzmemo u obzir trenutne trendove novih diplomanata s dubokom
analitičkom obukom (npr. ljudi koji pohađaju diplomske tečajeve statistike ili strojnog učenja,
subspecijalnost računalnih znanosti ili studenti koji pohađaju takve tečajeve osmišljene za njihovu
posljednju godinu dodiplomskog obrazovanja) i imigracije, ovaj ukupan broj raste na oko 300.000.
Međutim, u svijetu velikih podataka, očekujemo da bi potražnja za dubokim analitičkim talentom
mogla dosegnuti 440.000 do 490.000 pozicija u 2018. – to je jaz u talentima samo u ovoj kategoriji od
140.000 do 190.000 pozicija. Ukratko, Sjedinjenim Državama trebat će dodatna ponuda ove klase
talenata od 50 do 60 posto (Prikaz 35). Razvijanje dubokih analitičkih vještina zahtijeva intrinzične
sposobnosti u matematici za početak, a zatim su potrebne godine obuke. Rješavanje problema
nedostatka talenata neće se dogoditi preko noći, a potraga za dubokim analitičkim talentom koja je
već započela može se samo intenzivirati.
88 Također nismo dali prioritet analizi pratećeg IT talenta jer su drugi istraživači
su opsežno istraživali i raspravljali o ovom pitanju.
89 Općenito, pronašli smo detaljne podatke o zanimanjima o kategorijama stručnih radnika
relativno malo izvan Sjedinjenih Država. Pogledajte poglavlje “Implikacije za donositelje politika” za
preporuku prikupljanja detaljnijih podataka o ovim kategorijama.
90 Standardna klasifikacija zanimanja (SOC) 15: Računalna i matematička zanimanja prema definiciji
američkog Ureda za statistiku rada.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 105
Dokaz 35
U Sjedinjenim Državama diplomira najveći broj ljudi s dubokom
analitičkom obukom
Broj diplomanata s dubokom analitičkom obukom u 20081
Ukupno
Tisuću Diplomiranih na 100 ljudi
1 Ovi podaci broje nove diplomante, tj. tijek dubokog analitičkog talenta, koje definiramo kao osobe s naprednom obukom u
statistiku i/ili strojno učenje i koji provode analizu podataka.
2 Ostalo uključuje Finsku, Estoniju, Hrvatsku, Sloveniju, Island, Cipar, Makedoniju i Maltu.
IZVOR: Eurostat; Statistika Rusije; Ministarstvo obrazovanja Japana; Indija sub; NASSCOM Strategic Review 2005; Kina
Statistički godišnjak; Kineske vijesti o obrazovanju; MMF-ova baza podataka o svjetskoj ekonomskoj perspektivi
U slučaju menadžera i analitičara koji razumiju podatke u svijetu velikih podataka, razina obuke
i matematičkih sposobnosti mnogo je niža od one potrebne za duboki analitički talent.
Ljudi u tim ulogama jednostavno trebaju dovoljno konceptualnog znanja i kvantitativnih vještina
kako bi mogli uokviriti i interpretirati analize na učinkovit način. Moguće je razviti takve vještine
kroz jedan tečaj statistike i eksperimentalnog dizajna. Međutim, menadžeri i analitičari bit će
potrebni u svakom sektoru. Primijenili smo metodologiju sličnu onoj koja se koristi za analizu
dubokog analitičkog talenta kako bismo razumjeli potencijalni jaz između projicirane potražnje
i ponude. Procjenjujemo da će do 2018. u Sjedinjenim Državama 4 milijuna radnih mjesta
zahtijevati ove vrste vještina u svijetu velikih podataka. Međutim, ako zbrojimo broj ljudi s ovim
vještinama i novih diplomanata koji će ući na tržište (prema trenutačnim trendovima),
dosegnut ćemo ukupno samo 2,5 milijuna ljudi u Sjedinjenim Državama u 2018. Dakle, postoji
potencijalni manjak od 1,5 milijuna menadžera i analitičara koji poznaju podatke. Ovo nije
praznina koja bi se vjerojatno mogla popuniti samo promjenom uvjeta za diplomski studij
Machine Translated by Google
106
Dokaz 36
20
Kina 10.4
15 Indija1
1.5
Rusija
Brazil 6.2
10 Poljska 12.8
Italija 18.9
Japan -5.3
0
2004 05 06 07 08
1 Indija je bila treća u 2008. s 13 270 ljudi s dubokim analitičkim vještinama, ali Indija nema vremensku seriju za te podatke.
2 Za Francusku, složena godišnja stopa rasta odnosi se na 2005. i 2008. zbog dostupnosti podataka.
IZVOR: Eurostat; nacionalne statističke agencije; Ministarstvo obrazovanja Japana; Indija sub; NASSCOM; Kineska statistika
Godišnjak; Kineske obrazovne vijesti, travanj 2005.; Svjetski ekonomski izgledi MMF -a; Analiza McKinsey Global Institute
Dokaz 37
Izborne jedinice velikih podataka Pojedinci/organizacije koji koriste podatke1 Pružatelji tehnologije
Državni regulatori
Konzumirajte podatke i
Generirajte podatke Zbirni podaci Analizirajte podatke
izvucite vrijednost
Individualni proizvođači podataka/ Pojedinci koji prikupljaju podatke Pojedinci koji analiziraju Individualni korisnici podataka
izvori podatke
Proizvođači podataka SME2 / MSP2 koji prikupljaju podatke MSP2 koji analiziraju podatke SME2 korisnici podataka
izvori
Proizvođači/izvori podataka Velika poduzeća koja Velika poduzeća koja Veliki korisnici podataka u poduzećima
velikih poduzeća prikupljaju podatke analiziraju podatke
Politike podataka
Kako se sve veća količina podataka digitalizira i putuje preko organizacijskih
granica, postoji niz pitanja politike koja će postati sve važnija, uključujući, ali ne
ograničavajući se na privatnost, sigurnost, intelektualno vlasništvo, pa čak i odgovornost.91
O pojedincima se zna više nego ikad, uključujući osjetljive podatke kao što su
zdravstveni i financijski podaci, a mnogi će građani zahtijevati da tvrtke i njihove vlade
zaštite njihovu privatnost. Osobni podaci kao što su zdravstveni i financijski podaci
često su oni koji mogu ponuditi najznačajnije ljudske dobrobiti, poput pomoći u
određivanju pravog medicinskog tretmana ili najprikladnijeg financijskog proizvoda.
Međutim, potrošači te kategorije podataka također smatraju najosjetljivijima. Pojedinci,
tvrtke i vlade morat će razmisliti o kompromisima između privatnosti i korisnosti.
Već vidimo da sigurnost podataka postaje sve gorući problem sada kada su podaci
ključni faktor proizvodnje i konkurentna imovina. Jedno je istraživanje pokazalo da se
broj ugroženih zapisa povećao za 30 posto svake godine između 2005. i 2009. u
Sjedinjenim Državama.92 Drugo istraživanje pokazalo je da sigurnosni kompromisi
koštaju više od 200 dolara po zapisu u naporima za otkrivanje, obavještavanje i
popravke, kao i klijente izgubljeno.93 Takve sigurnosne povrede utječu na niz sektora
uključujući financijske institucije, maloprodaju, hotele, pa čak i nacionalnu obranu.
Sve veća ekonomska važnost velikih podataka također pokreće brojna pravna
pitanja, posebno u kombinaciji s činjenicom da su podaci bitno drugačiji od mnogih
drugih sredstava. Podaci se mogu savršeno kopirati i jednostavno kombinirati s
drugim podacima, a isti podatak može koristiti više osoba istovremeno. Dakle,
intelektualno vlasništvo će postati još važnije razmatranje za kreatore politike, koji
će postaviti pravila koja određuju zakonska prava povezana s vlasništvom i
korištenjem podataka, te što predstavlja "poštenu upotrebu" podataka. Odgovornost
– kao što je tko je odgovoran kada netočni podaci dovedu do negativnih posljedica –
još je jedno pitanje koje će vjerojatno doći u prvi plan.
92 Trezor koji curi: Pet godina povrede podataka, Digital Forensics Association, srpanj 2010.
93 Četvrta godišnja američka studija troškova povrede podataka, Ponemon Institute, siječanj 2009.
Machine Translated by Google
108
Organizacijski čelnici moraju shvatiti da veliki podaci mogu otključati vrijednost—i kako ih iskoristiti
u tu svrhu. Od vitalne je važnosti da organizacije nauče kako iskoristiti velike podatke ako već ne
znaju kako to učiniti—jer će mnogi njihovi konkurenti sigurno koristiti velike podatke kako bi ostvarili
konkurentsku prednost. Kao što smo primijetili, mnoge organizacije nemaju niti kvalificirano osoblje
koje im je potrebno za rudarenje velikih podataka radi uvida, niti strukture i poticaje potrebne za
korištenje velikih podataka za donošenje utemeljenijih odluka i djelovanje u skladu s njima.
Pristup podacima
Pristup podacima morat će se proširiti kako bi se iskoristio puni potencijal za stvaranje vrijednosti.
Tvrtke će sve više morati dobiti pristup izvorima podataka trećih strana i integrirati vanjske
informacije sa svojima kako bi uhvatile puni potencijal velikih podataka. U mnogim slučajevima tek
treba uspostaviti učinkovita tržišta za trgovanje ili dijeljenje podataka.
Na primjer, ne postoje učinkovita tržišta za dijeljenje agregatnih obrazaca kretanja izvedenih iz
mobilnih telefona—potencijalno vrijednih trgovcima na malo koji pokušavaju razumjeti ponašanje
potrošača. U drugim slučajevima, poticaji su neusklađeni tako da zainteresirane strane žele
zadržati informacije za sebe. U zdravstvenoj zaštiti, na primjer, pružatelji će morati uložiti velika
sredstva za velike podatke kako bi stvorili, agregirali i analizirali digitalne kliničke podatke iz medicinske
dokumentacije, koji mogu otkriti informacije koje će platitelji koristiti u svoju korist u ugovornim
pregovorima (npr. platitelji usmjeravaju pacijente daleko od pružatelja usluga s visokom cijenom, ali
prosječnom izvedbom). Kako bi se u potpunosti uhvatila vrijednost koju mogu omogućiti veliki podaci,
morat će se prevladati prepreke u pristupu podacima.
Struktura industrije
Relativna lakoća – ili težina – hvatanja vrijednosti iz velikih podataka ponekad će ovisiti o
strukturi određenog sektora ili industrije. Sektori s relativnim nedostatkom konkurentskog intenziteta
i transparentnosti izvedbe te industrije s visoko koncentriranim fondom dobiti vjerojatno će sporo u
potpunosti iskoristiti prednosti velikih podataka.
Javni sektor, na primjer, ima tendenciju ograničenog konkurentskog pritiska, što ograničava
učinkovitost i produktivnost i postavlja veću prepreku za dobivanje vrijednosti od korištenja velikih
podataka. Zdravstvu u SAD-u nedostaje ne samo transparentnost u pogledu troškova i kvalitete
liječenja, već i struktura industrije u kojoj platitelji imaju koristi od upotrebe kliničkih podataka (npr. od
manje isplata za nepotrebno liječenje), ali nauštrb pružatelji usluga (npr. manje medicinskih aktivnosti
za naplatu) od kojih bi morali dobiti te kliničke podatke. Kao što ovi primjeri sugeriraju, čelnici
organizacija i kreatori politika moraju razmotriti kako bi se industrijske strukture mogle razvijati u svijetu
velikih podataka ako žele odrediti kako optimizirati stvaranje vrijednosti u tvrtkama, sektorima i
gospodarstvima u cjelini.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 109
Naše istraživanje sugerira da postoji niz načina na koje veliki podaci mogu stvoriti
vrijednost koju tvrtke i organizacije, uključujući vlade, mogu primijeniti u različitim sektorima.
Ali da bi se to postiglo uz maksimalnu učinkovitost, svi ti igrači će zahtijevati da prevladaju
niz prepreka i da se pozabave ključnim pitanjima koja su od dubokog interesa javnosti,
posebice privatnosti i sigurnosti. U sljedeća dva poglavlja raspravljat ćemo o tome što tvrtke,
organizacije i kreatori politika mogu učiniti kako bi olakšali put prema potpunom hvatanju
vrijednosti koju veliki podaci mogu stvoriti.
Machine Translated by Google
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 111
Kako veliki podaci i njihove poluge postaju sve vrednija imovina, njihovo inteligentno
iskorištavanje bit će ključno za poduzeća da se učinkovito natječu. Već vidimo organizacije
koje razumiju i prihvaćaju korištenje velikih podataka kako se povlače ispred svojih kolega u
opipljivim mjerama korporativnog učinka. Korištenje velikih podataka postat će ključna osnova
konkurencije među sektorima, stoga je neophodno da organizacijski čelnici počnu uključivati velike
podatke u svoje poslovne planove.
Budući da podaci postaju ključna konkurentska imovina, čelnici moraju razumjeti imovinu koju
posjeduju ili kojoj mogu imati pristup. Organizacije bi trebale provesti inventar vlastitih vlasničkih
podataka, te također sustavno katalogizirati druge podatke kojima bi potencijalno mogle dobiti
pristup, uključujući javno dostupne podatke (npr. državne podatke, druge podatke koji se
objavljuju u javnoj domeni) i podatke koji mogu kupiti (npr. od agregatora podataka ili drugih
igrača u lancu vrijednosti podataka).
Doista, kako bi se omogućile transformativne prilike, tvrtke će sve više morati dobiti pristup
izvorima podataka trećih strana, integrirajući takve informacije sa svojima. U nekim će slučajevima
organizacije moći kupiti pristup podacima. U drugim slučajevima, izvori podataka trećih strana
možda nisu razmišljali o njihovom dijeljenju.
Organizacije će morati promišljeno razmotriti i predstaviti uvjerljivu vrijednosnu ponudu za
te treće strane da im dijele ili prodaju podatke ili odrediti drugi skup poticaja (npr. regulatorne
mjere) kako bi se osigurao pristup podacima. Često će se morati riješiti skup tehnoloških izazova
(npr. standardiziranje podataka, implementacija izvora podataka) kako bi se osigurao dosljedan,
pouzdan i pravovremen pristup vanjskim podacima.
112
Opisali smo pet međusektorskih kategorija stvaranja vrijednosti korištenjem velikih podataka koji
se mogu primijeniti na svaku funkciju. Organizacije bi trebale započeti proces identifikacije i
prioritizacije ovih prilika; voditelji poslovnih linija i funkcija trebali bi pokrenuti procese u svojim
područjima odgovornosti. Vrijedno je napomenuti da će prepoznavanje prilika i potencijalnih izvora
vrijednih podataka (vidi prethodni odjeljak), posebno vanjskih izvora podataka, često biti iterativni, a
ne sekvencijalni proces.
Kako bi potvrdile ove prilike za velike podatke, vodeće organizacije često su otkrile da
usvajanje procesa svrhovitog eksperimentiranja (metaprimjena poluge eksperimentiranja s
velikim podacima) može biti najmoćniji put prema tome da se postane organizacija koja u
potpunosti koristi velike podatke, a ne određivanje cjelovitog plana za poduzeće prije bilo kakve
implementacije. Odabir nekoliko područja visokog potencijala u kojima će se eksperimentirati s
velikim podacima, npr. s digitalnim marketingom, a zatim brzo povećanje uspjeha može biti
učinkovit način za početak transformacije.
U našem istraživanju otkrili smo da stvaranje značajne nove vrijednosti ne zahtijeva nužno
izravno preskakanje na složene analitičke poluge velikih podataka. U mnogim slučajevima,
poluge usmjerene prvenstveno na dostupnost podataka ili primjenu osnovne analitike mogu
stvoriti značajnu vrijednost čak i prije nego što organizacija usvoji naprednije poluge.
Vidimo to u zdravstvu, gdje stvaranje transparentnosti i primjena osnovnih poluga može generirati
samo oko 40 posto potencijala stvaranja vrijednosti. Doista, nalazimo da većina organizacija slijedi
put kojim se s vremenom izgrađuju sposobnosti.
Naše je istraživanje identificiralo četiri razine zrelosti ili sofisticiranosti za kategorizaciju radnji koje
se mogu poduzeti. Najosnovnije je digitalizacija i strukturiranje podataka, što je zapravo korak prije
korištenja velikih podataka. Sastoji se od koraka koji osiguravaju da su podaci generirani, strukturirani
i organizirani na takav način da ih krajnji korisnici mogu koristiti izravno ili za daljnju analizu. Ove
tehnike uključuju "pročišćavanje" podataka kako bi se uklonile pogreške i osigurala kvaliteta
podataka, stavljanje podataka u standardne obrasce i dodavanje metapodataka koji opisuju podatke
koji se prikupljaju. Druga razina sofisticiranosti zahtijeva dostupnost podataka, npr. putem mreža,
što je usklađeno s prvom od pet kategorija poluga velikih podataka o kojima smo ranije raspravljali.
To može biti snažan pokretač vrijednosti sam po sebi, a također može biti važan prvi korak u
integraciji skupova podataka za stvaranje smislenijeg poslovnog uvida. Treća razina sofisticiranosti
je primjena osnovne analitike, koja u biti pokriva niz metodologija, kao što su usporedbe osnovnih
podataka i relativno standardizirane kvantitativne analize, npr. one koje ne zahtijevaju prilagođene
analize koje trebaju dizajnirati ljudi s dubokim analitičkim vještinama. Četvrta i najviša razina je
primjena napredne analitike, kao što su automatizirani algoritmi i analiza podataka u stvarnom
vremenu koji često mogu stvoriti radikalne nove poslovne uvide i modele. Omogućuju nove razine
eksperimentiranja kako bi se razvili optimalni pristupi ciljanju kupaca i operacija te otvaraju nove
prilike za velike podatke s trećim stranama. Iskorištavanje velikih podataka na ovoj razini često
zahtijeva stručnost dubokog analitičkog talenta.
na primjer, pružatelj zdravstvenih usluga mogao bi otkriti da može analizirati skup podataka o
kliničkim ishodima kako bi bolje identificirao izvore medicinskih pogrešaka. Druga kategorija
mogućnosti dolazi od dodavanja novih skupova podataka koji se mogu uhvatiti ili nabaviti (javni i
kupljeni) ovim analizama. Ovi skupovi podataka često će uključivati nestandardne tipove podataka,
jer su to podaci koji se obično ne koriste unutar organizacije. Na primjer, osiguravajuće društvo
moglo bi otkriti da mu dodavanje podataka daljinskog istraživanja (slike sa satelita) može pomoći
da bolje procijeni rizike nekretnina. Treći niz prilika dolazi iz razmatranja novog poslovanja i poslovnih
modela koji su temeljno izgrađeni na velikim podacima, a ne temeljeni nužno na istim vrstama
analiza koje podržavaju postojeće poslovanje.
Na primjer, pružatelj usluga plaćanja mogao bi otkriti da je stvorio novi posao prodajom uvida
potrošačima na temelju tokova podataka koje generira (tzv. "iskorišteni podaci") tijekom obrade
plaćanja.
Organizacije bi također trebale paziti na potencijalne poremećaje koje veliki podaci mogu potaknuti.
U kontekstu lanca vrijednosti velikih podataka (prikaz 39), agregacija i analiza postaju sve vrijedniji
pa generatori podataka dodaju te mogućnosti kako bi potpunije ostvarili potencijalnu vrijednost, kao
i za obranu od novih sudionika koji se usredotočuju isključivo na agregaciju i analizu. Na primjer,
trgovac velikim podacima kao što je Tesco igra duž cijelog lanca vrijednosti kako bi ostvario najveći
potencijal. Svoj program vjernosti koristi za prikupljanje podataka o kupnji kupaca, koje zatim analizira
kako bi donio razne odluke, uključujući mikrosegmentaciju svojih kupaca radi optimizacije miksa
proizvoda, cijena i promocija. Još jedan primjer napredne integracije u lancu vrijednosti podataka su
veliki obveznici zdravstvenih usluga, od kojih neki ulaze u posao prikupljanja i analize kliničkih
podataka s podacima o zahtjevima, kako bi pružili podatkovne usluge klijentima kao što su
farmaceutske tvrtke. Opet, prelazak na agregaciju i analizu može biti obrambeni potez za sprječavanje
novih sudionika. U nekim sektorima, agregatori podataka trećih strana, koji sami ne generiraju
podatke, pružaju uslugu s dodanom vrijednošću povrh agregiranih podataka u korist kupaca. U
financijskim uslugama, na primjer, internetska tvrtka Mint (koju je kupio Intuit) skuplja financijske
podatke o pojedincima i pruža usluge s dodanom vrijednošću (npr. alate za financijsko planiranje),
iako sama ne generira financijske podatke. Mint i drugi koji koriste ovaj poslovni model mogu
predstavljati prijetnju tradicionalnim financijskim institucijama posjedovanjem odnosa s klijentima
kroz njihov sveobuhvatniji pogled na cjelokupni financijski položaj potrošača.
Organizacije bi također trebale paziti na pojavu međusektorskih domena, kao što su osobni
podaci o lokaciji, gdje se inovacije događaju vrlo brzo. Često imaju vrlo fragmentirane lance
vrijednosti podataka, s mnogim dionicima koji igraju različite uloge, a svi pokušavaju osmisliti
poslovne modele koji će maksimizirati njihov udio u fondu dobiti.
Doista, potreba za razmjerom podataka i IT infrastrukturom može postati ključni pokretač prema
konsolidaciji, što može biti i prilika i prijetnja, u sektorima u kojima su igrači ispod razmjera brojni.
Prostor za pružatelje zdravstvenih usluga dobar je primjer gdje je ostalo mnogo relativno malih
liječničkih ordinacija. Kako prelaze u digitalno doba elektroničkih medicinskih zapisa i pokušavaju
izvući korist iz podataka, moglo bi im se isplatiti spojiti s drugima kako bi povećali opseg.
114
Dokaz 38
Indeks Intenzitet
ukupnog Količina Varijabilnost kupaca i
Sektori potencijala podataka u izvedbi dobavljača Intenzitet
kategorija vrijednosti1 po poduzeću transakcije Turbulencija
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Financije i osiguranje
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
Organizacije će trebati imati prave ljude i procese za dobivanje vrijednosti od korištenja velikih
podataka. Što se tiče ljudi, istraživanje MGI-ja pokazuje da su ključni skupovi talenata koji će biti u
sve manjoj ponudi duboki analitički talent za provođenje analiza velikih podataka; menadžeri i
analitičari koji znaju kako zatražiti i konzumirati velike analize podataka; i pomoćno tehnološko
osoblje za implementaciju velikih podataka. Fokusiramo se na prve dvije kategorije u ovom odjeljku
i bavimo se trećom u sljedećem odjeljku o implementaciji podatkovne strategije poduzeća.
Tvrtke s velikim podacima iz najbolje prakse izgradile su dovoljan opseg u središnjoj skupini
dubokih analitičkih talenata, na koje se ostatak njihove organizacije može osloniti. S obzirom na
potencijalnu konkurenciju za ovaj talent, organizacije moraju agresivno regrutirati duboke analitičke
talente. To može uključivati pronalaženje talenata iz drugih područja ili nabavu nekih analitičkih
usluga od dobavljača. Jedna važna stvar koju treba napomenuti je da su rana zapošljavanja kritična
jer su oni ti koji grade timove. Teško je pronaći ljude koji su voljni zaposliti svoje zamjene, stoga je
rano zapošljavanje najsposobnijih ljudi najbolji način za izgradnju vrlo učinkovitog tima. Jedna
tvrtka za financijske usluge cijenjena zbog svoje upotrebe podataka i eksperimentiranja, na primjer,
identificirala je mrežu ciljanih institucija koje su poznate po tome što pokazuju vrhunski analitički
talent i koje su u neposrednoj blizini sjedišta. Tvrtka je razvila odnos s tim institucijama tako da ne
samo da ima istaknutu prisutnost tijekom sezone zapošljavanja, već ih koristi i kao puteve za
kontinuiranu obuku, gdje tvrtka šalje zaposlenike s dubokom analitikom da se napune i nauče nove
tehnike.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 115
Voditelji će također morati smisliti kako organizirati ovaj kadar dubokog analitičkog
talenta tako da, kada formiraju internu zajednicu ili centar izvrsnosti, budu učinkovito
povezani s ostatkom organizacije i mogu dobro surađivati s poslovnim vođama.
Nadalje, zadržavanje i motiviranje ovog vrijednog talentiranog kadra zahtijevat će, na
način sličan slučaju drugih stručnjaka visoke razine znanja, novčane i, što je još važnije,
intrinzične poticaje kao što su zanimljivi problemi koje treba riješiti.94
94 Peter F. Drucker, Izazovi menadžmenta za 21. stoljeće (New York, NY: Harper
Posao, 1999).
Machine Translated by Google
116
Vrijednosni potencijal koji podupire korištenje velikih podataka neće se ostvariti ako vlada i
kreatori politika, uz voditelje pojedinačnih organizacija, ne shvate i odgovore na niz prepreka
i čimbenika koje smo identificirali. Naše je istraživanje pokazalo da veliki podaci nisu samo
snažan pokretač konkurencije i rasta za pojedinačne tvrtke, već da, u cjelini, također mogu
pomaknuti iglu produktivnosti, inovativnosti i konkurentnosti za čitave sektore i gospodarstva u
razvijenim i svjetovi u razvoju.
Kreatori politike koji razmišljaju unaprijed držat će korak s razvojem velikih podataka i
pronaći pravovremena rješenja za prepreke koje danas stoje na putu da se uhvati njihova
puna vrijednost. Možda će biti potrebna akcija i na nacionalnoj i na međunarodnoj razini
ako kreatori politika žele pomoći organizacijama da maksimalno iskoriste priliku velikih podataka.
Baš kao što vidimo rane dokaze da tvrtke vješte u korištenju velikih podataka vode ispred
svoje konkurencije, korištenje velikih podataka moglo bi igrati značajnu ulogu u konkurentnosti
zemlje.
Kreatori politika moraju razmotriti izbore koje bi trebali donijeti kako bi pomogli
pojedinim tvrtkama u svojim gospodarstvima da izvuku vrijednost iz korištenja velikih
podataka. Glavna područja u kojima politika može igrati ulogu su izgradnja ljudskog
kapitala (npr. poboljšanje ponude diplomanata koji poznaju velike podatke i ublažavanje
imigracijskih ograničenja); usklađivanje poticaja za osiguranje pristupa podacima; rješavanje
pitanja privatnosti i sigurnosti; uspostavljanje okvira intelektualnog vlasništva; prevladavanje
tehnoloških prepreka podacima; te promicanje infrastrukture informacijske i komunikacijske
tehnologije. Tvorci vladinih politika u mnogim gospodarstvima već se bave ili barem raspravljaju o
ovim područjima. Ovo je zadatak kojim se moraju početi baviti vrlo hitno. Bez odgovarajućih
pravila, zakona, smjernica i poticaja, gospodarstva koja su manje napredna u tim područjima
riskirat će da se nađu u nepovoljnijem položaju u odnosu na one koji cijene dinamiku i potencijal
velikih podataka.
Vlade mogu djelovati na razne načine kako bi pomogle povećati ponudu talenata
potrebnih za iskorištavanje velikih podataka. Prvo, vlade mogu pokrenuti obrazovne
inicijative kako bi povećale broj diplomanata s pravim vještinama. U Sjedinjenim
Državama, na primjer, postoji pritisak na saveznoj, državnoj i lokalnoj razini da se podupre
više obrazovanja iz znanosti, tehnologije, inženjerstva i matematike (STEM). Većina drugih
vlada OECD-a također prepoznaje potrebu za većim brojem diplomanata STEM koji su povijesno
nedovoljno zastupljeni u tim područjima, uključujući žene. Međutim, potrebe za dubokim
analitičkim talentom specifičnije su čak i od ovoga — bit će potrebno više diplomanata s
naprednom obukom u statistici i strojnom učenju (poddisciplina računalne znanosti). Drugi način
na koji vlade mogu povećati ponudu talenata je smanjenje prepreka za pristup tim bazenima u
drugim regijama, tj. radom na daljinu ili imigracijom kvalificiranih radnika.
Machine Translated by Google
118
Izazov razvoja velikog broja organizacijskih vođa i analitičara u poslovnom, državnom i društvenom
sektoru koji imaju osnovno razumijevanje analitičkih tehnika daleko je većeg opsega. U najmanju ruku,
novi stručni radnici koji su već u procesu obrazovanja na putu ka radnoj snazi trebali bi se obrazovati o
ovim temama; obvezni kolegij iz statistike/znanosti odlučivanja, s modulom o eksperimentalnom dizajnu,
trebao bi postati dio nastavnog plana i programa u područjima kao što su poslovna administracija i druge
upravljačke discipline. Ali čekanje cijele nove generacije diplomanata bit će nedovoljno. Vlada bi mogla
stvoriti poticaje za obuku postojećih menadžera i analitičara u ovim tehnikama.
Također smo otkrili u našem istraživanju da detaljni nacionalni podaci o radnoj snazi o
Stručne radnike, prema kategoriji zanimanja i industriji, bilo je teško pronaći izvan Sjedinjenih
Država (uključujući uloge koje zahtijevaju duboke analitičke vještine, kao i uloge menadžmenta i
analitičara, između ostalog). Nekoliko zemalja moglo je pružiti vrlo detaljne podatke o zanimanjima
povezanim s proizvodnjom (npr. „kovanje plemenitih metala”), ali su imale vrlo široke kategorije za radnike
znanja (npr. „bankari”).
Na temelju načela da "ne možete upravljati onim što ne možete mjeriti", kreatori politika u tim
zemljama mogli bi uputiti svoje agencije za statistiku rada da počnu prikupljati detaljnije podatke o
zapošljavanju u kategorijama stručnih radnika (idealno, u standardnim kategorijama koje bi omogućuju
usporedbe među zemljama). Ti bi podaci bolje informirali njihove odluke o tome kako razviti ljudski
kapital, tj. radnike znanja općenito, a posebno za pozicije povezane s velikim podacima.
se osiguralo da se pročišćeni klinički podaci mogu dijeliti među pružateljima usluga kako bi sustav mogao
u potpunosti iskoristiti podatke o komparativnoj učinkovitosti liječenja.
Tamo gdje postoje tržišni neuspjesi, kao što je nedostatak poticaja iz osobnog interesa za određenu
skupinu dionika da svoje podatke učini dostupnima, kreatori politike možda će morati primijeniti
polugu regulacije kako bi osigurali dijeljenje podataka. Na primjer, postoji ogromna nevoljkost
objavljivanju podataka koji otkrivaju pogreške (npr. pogreške liječnika ili pilota) zbog reputacijskog
rizika koji to predstavlja za pružatelje usluga.95 Ali vlada ima jasan interes osigurati da se ti podaci dijele
jer to čini jedan od ključnih čimbenika za smanjenje rizika u cijelom sustavu od takvih grešaka.
Obavezno prikupljanje i objavljivanje takvih podataka moglo bi postati potrebno. Na primjer, vlade
mogu zahtijevati od javnih poduzeća da dostave financijske podatke u standardiziranom elektroničkom
obliku. Nakon nedavne globalne financijske krize, mnoge vlade već zauzimaju stajalište da je potrebno
značajno poboljšanje transparentnosti financijskog izvještavanja kako bi se ublažili sistemski rizici za
financijski sustav.
95 Na primjer, pilotima zrakoplova možda se nužno ne sviđa činjenica da glas i podaci u kokpitu
snimači mogu otkriti greške koje naprave tijekom leta, no objavljivanje podataka s tih uređaja
agencijama za sigurnost nakon nesreće je obavezno kako bi se poboljšala sigurnost cjelokupnog
sustava.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 119
Većina razvijenih zemalja već ima agencije koje su odgovorne za izradu i provedbu
smjernica i zakona koji se tiču komercijalne i privatnosti osobnih podataka općenito.
U Sjedinjenim Američkim Državama, Savezna komisija za trgovinu, na primjer, koristi
svoja načela poštene prakse informiranja kao smjernicu za rješavanje pitanja
sigurnosti i privatnosti. Na istom tragu, OECD je izdao smjernice o zaštiti privatnosti i
prekograničnom protoku osobnih podataka, dok Europska unija ima svoju Direktivu o
zaštiti podataka. Sve te smjernice i zakoni sadrže slične elemente prijave i zaštite.
Njemačka ima saveznog povjerenika koji aktivno nadzire industriju radi usklađenosti
sa zaštitom podataka. Južnokorejski Zakon o zaštiti podataka provode dvije zasebne
vladine agencije.
Usporedno s time, tvrtke i vlade će gotovo sigurno željeti snažne zakone koji
zabranjuju hakiranje i druge sigurnosne invazije kako bi zaštitili vlastite operacije
koliko god je to moguće, te će željeti učinkovitu provedbu tih zakona. Zaštita kritične
IT infrastrukture važna je i kako bi se osiguralo da organizacije mogu sigurno pristupiti
podacima i koristiti ih, te kako bi se zaštitila nacionalna sigurnost, jer kibernetički
napadi postaju sve sofisticiraniji i hrabriji. Na primjer, kibernetički napadi na dijelove
financijske infrastrukture zemlje (npr. postrojenja za obradu kreditnih kartica) mogu
rezultirati objavljivanjem osjetljivih osobnih podataka o milijunima pojedinaca i gubitkom
povjerenja u elektronička tržišta.
Machine Translated by Google
120
Nedvojbeno ćemo nastaviti vidjeti mnoge inovacije koje se pojavljuju duž lanca vrijednosti podataka u
doba velikih podataka. Pojavit će se inovativna tehnologija za bolje generiranje i bilježenje podataka.
Napredak u pohrani i analitici nastavit će se jer organizacije sve više trebaju pohranjivati sve veću
količinu podataka, pristupati im i analizirati ih, ponekad u gotovo stvarnom vremenu. Ove inovacije
zahtijevaju učinkovit sustav intelektualnog vlasništva, koji će osigurati poticaje za stvaranje vrijednih
podataka i omogućiti učinkovito dijeljenje i integraciju različitih skupova podataka. Postojat će sve veća
potražnja za djelotvornijim i učinkovitijim načinima utvrđivanja prava intelektualnog vlasništva (npr.
autorskih prava i patenata) i rješavanja sporova.
Standardi koji pokrivaju IT alate ili određene vrste podataka ključni su kako bi se podaci mogli dijeliti
kako bi se stvorila potrebna ljestvica kako bi se omogućila vrsta analitike koja stvara vrijednost.
Ovi standardi mogu proizaći iz industrijskih tijela za postavljanje standarda, ali vlada može igrati ulogu
koja im omogućuje. Na primjer, u areni zdravstvene skrbi u SAD-u, Standardi i kriteriji certifikacije za
elektroničku zdravstvenu evidenciju (EHR) koje će izdati Ured nacionalnog koordinatora za informacijsku
tehnologiju u zdravstvu identificirat će standarde potrebne za certifikaciju tehnologija EHR-a tako da
medicinski stručnjaci a bolnice su uvjerene da sustav koji usvoje može raditi prema potrebi.
Kreatori politika također mogu ubrzati istraživanje velikih podataka. Vlada može izravno
sponzorirati osnovna istraživanja. Na primjer, američka Nacionalna zaklada za znanost financira
programe u računalnoj znanosti i matematici, dok je EU uspostavila Okvirni program za istraživanje,
osmišljen kao glavni instrument za koordinaciju i raspodjelu sredstava za istraživanje u područjima
znanosti i tehnologije u Europi.
Vlade također mogu razmotriti kako primijeniti poticaje, npr. porezne izdatke ili drugu financijsku
potporu, kako bi pomogle u prevladavanju tehnoloških prepreka za korištenje velikih podataka.
Ponekad postoji neusklađenost između toga tko mora uložiti u tehnologiju i tko će dobiti koristi
od tog ulaganja. Na primjer, u zdravstvenoj skrbi u SAD-u pružatelji su primarni ulagači u
tehnologiju elektroničkih medicinskih zapisa, ali koristi koje se osjećaju u obliku optimizirane
zdravstvene skrbi nesrazmjerno idu platiteljima i pacijentima. Američki Zakon o oporavku i
ponovnom ulaganju iz 2009. osigurao je oko 20 milijardi dolara pružateljima usluga zdravstvene zaštite
i njihovim sektorima podrške za ulaganje u sustave elektroničkih zapisa i razmjenu zdravstvenih
informacija kako bi se stvorio opseg kliničkih podataka potrebnih za rad mnogih poluga velikih podataka
u zdravstvu.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 121
U godinama koje dolaze kreatori politike trebali bi infrastrukturu učiniti eksplicitnim dijelom svog
pristupa velikim podacima.
dodatak
Iz naše analize velikih podataka u pet domena došli smo do osjećaja koje karakteristike
ukazuju na veći ili niži potencijal vrijednosti od upotrebe velikih podataka za hvatanje vrijednosti
od njihove upotrebe, kao i veće ili niže prepreke u ostvarivanju te vrijednosti u različitim sektorima .
Koristeći te uvide, izradili smo dva indeksa: (1) indeks vrijednosnog potencijala i (2) indeks lakoće
hvatanja. Svaki od ovih indeksa sadrži više kriterija koji nam daju relativan osjećaj koji bi sektori
mogli biti spremni za veće dobitke i koji bi se sektori suočili s najtežim preprekama. Ne tvrdimo da
ovi indeksi daju potpunu sliku, ali vjerujemo da daju dobar uvid u potencijalnu dostupnu vrijednost i
lakoću ili nemogućnost njezina bilježenja u svim sektorima.
Pet kriterija koje koristimo u ovom indeksu služe kao zamjena za to koliko dobro sektor može
imati koristi od jedne od pet transformativnih prilika o kojima smo govorili u ovom izvješću
(Dokaz A1):
2. Varijabilnost u izvedbi. Što je veća varijabilnost, to više ukazuje da poduzeće može imati koristi
od upotrebe podataka i eksperimentiranja za otkrivanje varijabilnosti i poboljšanje učinka.
Koristili smo varijabilnost EBITDA-e (dobit prije deprecijacije i amortizacije poreza na kamate) kao
proxy. Unutar svakog sektora, uzeli smo EBITDA velikih kompanija (s više od 500 milijuna dolara
prodaje) od 2002. do 2007. i identificirali 10. i 90. percentil EBITDA. Razlika između najboljih i
najlošijih izvođača postala je varijabilnost koju smo mjerili.
3. Intenzitet kupaca i dobavljača. Što više kupaca i dobavljača tvrtka ima, veći je njezin
potencijal za primjenu segmentacije za prilagođavanje smjerova djelovanja.
Koristili smo broj zaposlenih na prvoj liniji (definiranih kao onih koji komuniciraju s kupcima ili
dobavljačima) po tvrtki kao proxy. Koristili smo se podacima američkog Zavoda za statistiku rada
kako bismo identificirali broj zaposlenih na prvoj liniji (glavna zanimanja uključuju šifre
standardne klasifikacije zanimanja 41 kao što su prodajni službenici i agenti i 43 kao što su
administrativni radnici) u posljednjoj dostupnoj godini. Zatim smo podijelili s brojem tvrtki s više
od 1000 zaposlenih
4. Intenzitet transakcije. Što je veći intenzitet transakcija, veća je vjerojatnost da će sektor imati
koristi od upotrebe automatiziranih algoritama za povećanje ili zamjenu
Machine Translated by Google
124
ljudsko odlučivanje. Koristili smo količinu procesorske snage prosječne tvrtke u sektoru kao
proxy. Kako bismo došli do relativnog osjećaja procesorske snage, koristili smo podatke o
kapitalnom kapitalu za osobna računala i glavna računala prema sektoru iz Ureda za ekonomsku
analizu SAD-a i podijelili ih s brojem tvrtki s više od 1000 zaposlenika u svakom sektoru.
5. Turbulencija. Turbulencije, ili koliko često lideri i zaostali u sektoru mijenjaju mjesto, zamjena
je za količinu inovativnih poremećaja na koje je sektor osjetljiv. Pretpostavljamo da što je
turbulencija veća, to je veća vjerojatnost da će sektor imati koristi od upotrebe velikih podataka
za inovacije poslovnih modela, proizvoda i usluga. Unutar svakog sektora izračunali smo postotak
prometa—broj novih tvrtki koje su se smjestile među 20 najboljih u 2011. u usporedbi s 2006.,
podijeljen s 20.
Nakon što smo kvantificirali svaki kriterij (proxy), svakom smo sektoru dali ocjenu od jedan do pet
na temelju kvintila u koji spada za svaki kriterij. Ukupni indeks potencijalne vrijednosti prosjek je
rezultata po pet kriterija.
Dokaz A1
Indeks Intenzitet
ukupnog Količina Variabili kupaca i
Sektori potencijala podataka ty u izvedbi dobavljača Intenzitet
kategorija vrijednosti1 po poduzeću transakcije Turbulencija
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Usluge
Financije i osiguranje
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
Ovaj se indeks sastoji od četiri kriterija, od kojih je svaki usklađen s ključnom preprekom za korištenje
velikih podataka koju smo identificirali (Prilog A2):
1. Talent. Što tvrtka ima veći analitički talent, to je u boljoj poziciji da ostvari vrijednost velikih
podataka. Podijelili smo broj dubokih analitičkih talenata u 2008. s brojem tvrtki s više od 1000
zaposlenika u svakom sektoru.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 125
2. IT intenzitet. Što sektor u prosjeku ima više IT imovine, manje su tehnološke prepreke koje treba
prevladati. Izračunali smo IT zalihe koristeći podatke iz američkog Ureda za ekonomsku analizu i
podijelili taj ukupan broj s brojem tvrtki s više od 1000 zaposlenika u svakom sektoru.
3. Način razmišljanja vođen podacima. To pokazuje koliko je organizacija spremna koristiti velike
podatke za stvaranje vrijednosti. Iskoristili smo rezultate najnovije ankete koju je o IT strategiji
proveo McKinseyjev Ured za poslovnu tehnologiju, koja je voditelje pitala u kojoj mjeri njihove
organizacije donose odluke na temelju iskustva i mišljenja ili na temelju podataka.
4. Dostupnost podataka. Koristimo relativni broj baza podataka povezanih sa svakim sektorom u
vlasničkom korpusu podataka kao proxy za to koliko su podaci dostupni u sektoru.
Opet, nakon što smo kvantificirali svaki kriterij (proxy), svakom smo sektoru dali ocjenu od jedan
do pet na temelju kvintila u koji spada za svaki kriterij. Ukupni indeks lakoće hvatanja prosjek je
rezultata po četiri kriterija.
Dokaz A2
Ukupni
indeks
Sektori lakoće Način razmišljanja
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Financije i osiguranje
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
126
Nekoliko istraživačkih skupina proučavalo je količinu podataka koje poduzeća i pojedinci generiraju,
pohranjuju i koriste u studijama koje su koristile različite definicije i opsege (Prikaz A3). Međutim, do sada
nema dostupnih uvida o varijacijama među sektorima. Iz tog razloga poduzeli smo kratku vježbu
modeliranja kako bismo procijenili količinu podataka generiranih i pohranjenih u različitim sektorima, i na
agregiranoj osnovi i na osnovi po tvrtki.
Za procjenu količine generiranih i pohranjenih podataka u agregatu, naš se model oslanja na četiri ključna
ulaza i pretpostavke:
1. Otpremljeni godišnji skladišni kapaciteti po sektorima. Koristili smo industrijska izvješća IDC-a i
Gartnera koja daju ukupan broj bajtova otpremljenih svake godine na vanjskim diskovima, uključujući
mreže područja pohrane (SAN), mrežno pripojenu pohranu (NAS) i izravno pripojenu pohranu (DAS).
Ovi su podaci dostupni po sektorima i odabranim zemljopisnim područjima.
pohranjeni više puta (npr. za sigurnosnu kopiju, snimljeni u različitim sustavima za razne upotrebe).
Stručnjaci McKinseyja dali su nam prosječnu procjenu koja nam je omogućila da procijenimo količinu
"jedinstvenih" podataka generiranih i pohranjenih u određenoj godini.
Primijenili smo sličan pristup za procjenu količine podataka koje generiraju i pohranjuju potrošači. U ovom
smo slučaju uključili ključne uređaje koji pohranjuju sadržaj koji su izvorno generirali korisnici, naime solid-
state disk i pogone tvrdog diska u osobnim računalima, prijenosnim računalima i određenoj elektronici. Nismo
uključili potrošačke uređaje i komponente za pohranu kao što su DVD-ovi, CD-ovi i digitalni videorekorderi
koji uglavnom sadrže sadržaj koji korisnici nisu generirali (npr. generirale medijske tvrtke).
Naše su procjene u skladu s rezultatima prethodnih istraživanja. Naša procjena od 7,4 egzabajta
novih pohranjenih podataka najviše se može usporediti s 25 egzabajta kapaciteta pohrane podataka
Proširili smo našu analizu na razinu po tvrtki u Sjedinjenim Državama, gdje su podaci o broju tvrtki
najlakše dostupni. Uzeli smo procijenjene raspoložive kapacitete za pohranu, kao i nove pohranjene
podatke, za različite sektore u Sjedinjenim Državama i podijelili s brojem tvrtki (s više od 1000 zaposlenih)
u odgovarajućim sektorima. Podaci o broju tvrtki došli su iz američkog Ureda za statistiku rada i
Dun & Bradstreet. Odlučili smo uključiti samo tvrtke barem srednje veličine—tj. one s više od 1000
zaposlenika.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 127
Dokaz A3
Snimljeni godišnji digitalni podaci (uključuje sve ~800 x 1018 bajtova Za 2009. godinu
IDC/EMC1 digitalni
Svemir generirane, pohranjene ili ne) Uključuje više od
60 vrsta uređaja Nije uključena potrošnja informacija
od strane korisnika putem TV-a, videoigara1
Uključuje digitalne i analogne podatke za TV, radio, 3,6 x 1021 bajta (ukupna Za 2008. godinu
UCSD
telefon, ispis, računalo, komp. igre, filmovi, snimljena potrošnja samo u SAD-u)
glazba itd.
Izmjereni podaci iz perspektive potrošnje2
1 Uključuje kartice s čipom, diskete, fotoaparate, video igre, mobitele, memorijske kartice, media playere, CD-ove, DVD-ove, Blue Ray diskove,
Tvrdi diskovi računala i poslužitelja.
U našoj analizi velikih podataka u američkom zdravstvu usredotočili smo se na poluge ili
inicijative u kojima su veliki skupovi podataka nužan preduvjet za stvaranje vrijednosti — ali
često sami po sebi nisu dovoljni za stvaranje bilo kakve vrijednosti. Priznajemo da, u većini
slučajeva, ostvarenje vrijednosti zahtijeva značajne strukturne promjene uključujući
zakonodavne prilagodbe, nove poticaje i sheme naknade, kao i prevladavanje prepreka kao
što je briga o privatnosti.
Kako bismo procijenili potencijal vrijednosti svake od poluga s omogućenim velikim podacima
koje smo identificirali, upotrijebili smo prilagođeni pristup temeljen na ključnim pokretačima.
Ti pokretači obično uključuju (1) osnovne brojeve, kao što je broj bolnica, pacijenata, kliničkih
ispitivanja ili trošak po osnovnom broju za koje smo koristili podatke iz zadnje dostupne
godine; i (2) raščlamba utjecaja između, na primjer, smanjenja troškova i produljenja
vremena izlaska na tržište. U procjeni potencijalnog utjecaja velikih podataka koristili smo
američke i međunarodne studije slučaja s prijavljenim brojevima utjecaja gdje god je to bilo
moguće. U preostalih nekoliko slučajeva oslanjali smo se na razgovore stručnjaka. Znamo da
se nekoliko čimbenika treba spojiti kako bi se stvorila vrijednost; unatoč tome, dodijelili smo
punu vrijednost identificiranih poluga velikim podacima jer ih nije moguće raščlaniti
Machine Translated by Google
128
utjecaj među faktorima koji doprinose. Odabrali smo, međutim, studije slučaja ili stručne
procjene, na kojima temeljimo brojke utjecaja, na način koji minimizira svako dvostruko
računanje utjecaja na velikim podacima.
Odgovarajuće smo skalirali brojke utjecaja iz pojedinačnih studija slučaja kako bismo utvrdili
učinak na razini sektora ili cijelog sustava, a potom i na nacionalne izdatke za zdravstvenu
skrb. Pretpostavili smo neke temeljne komplementarne transformacije kao što su stope
usvajanja tehnologija koje omogućuju u cijeloj zemlji (npr. oko 90 posto usvajanja bolničkih
elektroničkih medicinskih zapisa) i strukturne promjene (npr. potencijalna konsolidacija
pružatelja usluga ili formiranje odgovornih organizacija za skrb).
Iako naše procjene potencijalne vrijednosti objavljene velikim podacima pretpostavljaju
neke temeljne komplementarne promjene, naše procjene ostaju unutar raspona procjena
koje su napravili istraživači u akademskoj zajednici, think tankovima i vladi (Prilog A4).
Dokaz A4
1 37 46 77
20 79
NICE smanjenje varijabilnosti primijenjeno na izdatke za izvanbolničke, bolničke i lijekove u SAD-u, srednje
4 13 do dugoročne
NICE smanjenje
varijabilnosti primijenjeno na
troškove lijekova, srednje do dugoročno
Sustav podrške kliničkom odlučivanju (CDS) koji se temelji na elektroničkim medicinskim zapisima uključujući
računalni unos naloga liječnika (CPOE) za poboljšanje učinkovitosti i kvalitete i smanjenje dupliciranja
Johnston et al., J. Healthcare Information
CBO: smanjenje administrativnih troškova i negativnih Management, 2004: Smanjenje ADE-a, bolja
događaja na savezni proračun, kratkoročno 0 usklađenost sa smjernicama 80
3.4 7.5 44
17 31
Referentne vrijednosti za smanjenje slučajeva nesavjesnog liječenja, ADE-
a, nikad događaja, smanjeno umnožavanje testova i postupaka
IZVOR: Kongresni ured za proračun; PwC Health Industries; Walker et al., “Vrijednost razmjene informacija o zdravstvenoj skrbi i interoperabilnosti”, Health
Affairs, 2005.; Johnston, Pan i Walker, “Vrijednost CPOE u ambulantnim uvjetima,”
Journal of Healthcare Information Management, 2004
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 129
Prvo smo identificirali poluge velikih podataka i kvantificirali njihov potencijal za stvaranje
vrijednosti fokusirajući se na dvije specifične agencije – poreznu i radnu – koje su prototipski
primjeri administrativnih funkcija. Procijenili smo potencijalni učinak oslanjajući se na
najbolju praksu iz cijelog svijeta. Zatim smo ekstrapolirali utjecaj identificiranih poluga na
cijelu vladu zemlje identificirajući druge adresabilne pododjele i primjenom potencijalnog
poboljšanja pronađenog u našoj analizi na razini agencije na adresabilni dio, prilagođen
prema relevantnosti. Konačno, povećali smo naše procjene na razini zemlje na sva
gospodarstva OECD-a u Europi.
Pronašli smo tri kategorije koristi od korištenja velikih podataka u upravi javnog
sektora:
3. Povećanje ubiranja poreznih prihoda. Primijenili smo postotak mogućeg smanjenja poreznog
jaza na procijenjeni porezni jaz europske države OECD-a.
Za potrebe naše analize upotrijebili smo posljednju godinu dosljednih podataka o državnoj
potrošnji i prihodima od poreza iz OECD-a.
Produktivnost javnog sektora teško je mjeriti iz dva glavna razloga. Prvo, mnogi sektori nemaju
mjerljive rezultate (npr. nacionalna sigurnost). Drugo, čak i u sektorima u kojima su učinci očiti,
mjerenje je od ograničene korisnosti bez procjene dodaju li ti učinci vrijednost građanima i
kako se ta vrijednost mijenja tijekom vremena.
130
Državna aktivnost koja je počela proizvoditi indeks produktivnosti za neke dijelove vlade.
Dokaz A5
Analize
Porezna agencija 0.7
"mikro u
makro" iz dubokog
ronjenja
Agencija za rad 0.3
Kako bismo došli do procjena vrijednosti koju stvaraju veliki podaci za maloprodajne
tvrtke, koju smo zatim proširili na procjenu ukupne vrijednosti za cijeli sektor, koristili smo
se kombinacijom studija slučaja klijenata, akademskog i industrijskog istraživanja te intervjua
sa stručnjacima.
Počevši od naše procjene potencijalne vrijednosti stvorene na razini pojedinačnih tvrtki, koristili
smo model koji ovisi o četiri ključna pokretača (Prilog A6).
1. Arhetipovi strukture troškova podsektora, koji nam daju različite skupove troškova kao
postotak prodaje. Koristili smo podatke Ureda za popis stanovništva SAD-a i analizu McKinseyja.
Dokaz A6
x Poluga
x % uštede troškova
Rezultati relevantnosti
Podsektor
poluge podsektora
Podsektor Poluga
Poluga
Dokaz A7
Transparentnost izvedbe Uzmite smanjenje radnog vremena zaposlenika Sati zaposlenika: Neke će poluge smanjiti
Operacije
sate zaposlenja
Optimizacija radnih resursa Uzmite smanjenje radnog vremena zaposlenika
1 Utjecaj tržišta temeljenih na webu teško je kvantificirati i mi smo to isključili iz naših izračuna.
3. Toplinska mapa relevantnosti poluge na razini podsektora koja nam govori o relativnoj relevantnosti
132
Naša analiza na razini tvrtke govori nam o potencijalnom utjecaju pojedinog trgovca na malo koji
prihvaća poluge velikih podataka, u odnosu na konkurente koji to ne čine.
Kako bismo proširili našu analizu na razini poduzeća na razinu cijelog sektora, konzervativno smo
izračunali potencijalne dobitke produktivnosti koristeći one poluge specifične za operacije i
opskrbne lance, na primjer, koje smanjuju troškove. To je zato što vjerujemo da bilo kakvo povećanje
nominalne prodaje koje ostvare pojedinačna poduzeća vjerojatno neće pribrojiti dobitku ukupne
nominalne prodaje u cijelom maloprodajnom sektoru, s obzirom na to da je ukupna maloprodajna
potrošnja potrošača prvenstveno pod utjecajem ukupnog gospodarskog rasta. Slažemo se da to znači
da će naša procjena vjerojatno biti konzervativna. Unatoč tome, naše procjene povećanja produktivnosti
od 1 do 2 posto pod pretpostavkom da su povučene sve poluge učinkovitosti i 0,5 do 1 posto isključujući
utjecaj poluge izvora (što pretpostavlja da nema neto učinka kada dobavljači također povlače istu
polugu) usporedive su s niz utjecaja IT-a na produktivnost nepoljoprivrednih sektora općenito (Prikaz A8).
Dokaz A8
IZVOR: Jorgensen, Dale, Ho i Stiroh, “Retrospektivni pogled na ponovno oživljavanje rasta produktivnosti u SAD-u,” Journal of
Gospodarske perspektive, 2008.; Analiza McKinsey Global Institute
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 133
Procijenili smo količinu osobnih podataka o lokaciji generiranih u svakoj kategoriji aplikacije
ili izvornog uređaja iu različitim geografskim regijama koristeći instaliranu bazu uređaja,
ponašanje pri korištenju i učestalost generiranja podataka.
Kako bismo procijenili potencijalnu vrijednost koju podaci mogu generirati, pomno
smo ispitali glavne primjene osobnih podataka o lokaciji i procijenili ekonomsku vrijednost
svake aplikacije za krajnje korisnike - pojedinačne potrošače, poduzeća i vladine
organizacije. Iako smo odredili veličinu svake identificirane primjene ili poluge, znamo da
će naša ukupna potencijalna procjena vrijednosti biti konzervativna, s obzirom na to da
će se u budućnosti pojaviti nove primjene ili poluge koje danas ne možemo predvidjeti.
Dokaz A9
Afrika
Oceanija
Kanada
Istočna Europa
NAS Zapadni istočni Japan Kina Indija latinski Ostali
Europa Europa Amerika Azija
Indija
45
San Francisco
Razina zagušenja u odnosu 40 Los Angeles Japan
na gustoću naseljenosti 35
Chicago
New York
30
Latinska Amerika
25 Cincinnati
20 Milwaukee
15 Ostatak Azije
10
5 Wichita
Ujedinjene države
0
0 100 200 300 400 500 600 700 800 900 1000
IZVOR: Eurostat; Popis stanovništva SAD-a; www.world-gazetteer.com; Svjetska banka; Analiza McKinsey Global Institute
Machine Translated by Google
134
analiza SAD-a
Prvo smo analizirali jaz u ponudi i potražnji za tri vrste talenata za velike podatke u 2018.:
2. Menadžeri koji razumiju podatke i analitičari koji imaju vještine da budu učinkoviti potrošači
uvida u velike podatke—tj. da postave prava pitanja za analizu, tumače i izazovu rezultate i
donesu odgovarajuće odluke.
Dokaz A10
Definicije Osobe koje su napredno Ljudi koji imaju osnovno Ljudi koji rade kao
trenirale statistiku i/ili strojno znanje o statistici i/ili administratori baza podataka i
učenje i provode analizu strojnom učenju i definiraju programeri
podataka ključna pitanja na koja
podaci mogu odgovoriti
Aktuari Poslovno i funkcionalno Računalni i informatički
Zanimanja1
Matematičari menadžeri znanstvenici Računalni
Analitičari operacijskih Proračunski, kreditni programeri Inženjeri
istraživanja i financijski analitičari računalnog softvera za aplikacije
Statističari Matematički Inženjeri Biološki Računalni softver
tehničari Matematički znanstvenici
znanstvenici Industrijski Analitičari istraživanja tržišta inženjeri za sistemski
inženjeri Epidemiolozi Istraživači anketa softver Analitičari
Ekonomisti Industrijsko-organizacijski računalnih sustava
psiholozi Sociolozi Administratori baza
podataka
1 Zanimanja su definirana Standardnim kodeksom zanimanja (SOC) Ureda za statistiku rada SAD-a i koriste se kao zamjena za
vrste talenata u radnoj snazi.
IZVOR: Američki ured za statistiku rada; Analiza McKinsey Global Institute
Osobe s dubokim analitičkim talentom definiramo kao one s naprednom obukom u statistici
i/ili strojnom učenju. Kako bismo procijenili bazu ove kategorije nadarenosti za 2008.,
upotrijebili smo podatke Zavoda za statistiku rada SAD-a o radnom zapošljavanju za 2008.,
uz pretpostavku da je zanimanje odgovarajući prikaz nadarenosti. Koristeći sustav standardne
klasifikacije zanimanja (SOC kod) (SOC kod je u zagradama), zanimanja koja smo odabrali za
predstavljanje dubokog analitičkog talenta su aktuari (15-2011), matematičari (15-2021),
analitičari operativnih istraživanja (15-2031) , statističari (15-2041), matematički tehničari
(15-2091), matematičari svi ostali (15-2099), industrijski inženjeri (17-2112), epidemiolozi
(19-1041) i ekonomisti (19-3011). Za svaku od ovih kategorija zanimanja procijenili smo
postotak ljudi koji bi imali potrebne duboke analitičke vještine.
Procijenili smo ponudu dubokog analitičkog talenta u 2018. koristeći bazu iz 2008. plus
sveučilišne diplomante s relevantnim vještinama, plus imigracija, minus odljev. Vještine
koje su relevantne za duboki analitički talent među diplomantima definiramo kao smjerove i
stupnjeve koji su u skladu sa SOC zanimanjima. Koristeći detaljnu statistiku o diplomantima
sveučilišta u SAD-u, odabrali smo procijenjene omjere diplomanata s diplomama prvostupnika
i magisterija te doktorata u sljedećim smjerovima koji imaju relevantne duboke analitičke
vještine: računalne i informacijske znanosti, matematika i statistika, inženjerstvo, fizičke
znanosti i znanstvena tehnologija, biološke i biomedicinske znanosti, društvene znanosti i
poslovanje.
U svijetu u kojem organizacije diljem gospodarstva aktivno koriste sve poluge velikih
podataka, naš prvi model pretpostavlja da će svi sektori povećati svoju potražnju za
dubokim analitičkim talentom najbržom stopom koju projicira BLS do 2018. u svojoj grupi
industrija prema intenzitet podataka. Na primjer, u skupini s visokim intenzitetom podataka,
predviđa se da će internetske usluge imati najveći rast dubokog analitičkog talenta do
2018.; stoga modeliramo druge sektore u skupini s velikim podatkovnim intenzitetom da
dožive istu stopu rasta kao i internetske usluge.
Drugi model koji smo upotrijebili je model potražnje temeljen na poduzećima, koji
pretpostavlja da se potražnja za dubokim analitičkim talentom razlikuje prema trima
glavnim industrijskim skupinama: financijskim i osiguravateljskim industrijama (FIG);
online (pružatelji internetskih usluga, portali za web pretraživanje, obrada podataka i
usluge stanovanja); i sve ostale industrije. Ova pretpostavka odražava naše intervjue s
vodećima u industriji koji su sugerirali da će FIG i online industrije zahtijevati znatno
više dubokog analitičkog talenta po tvrtki od onih u drugim industrijama. Procjenjujemo
broj ljudi s ovim vještinama potrebnim u svakoj industrijskoj grupi na temelju broja tvrtki
Machine Translated by Google
136
u svakoj klasi veličine zaposlenja i očekivani broj dubokih analitičkih talenata potrebnih po tvrtki (razlikuje
se prema klasi veličine zaposlenja). Brojevi tvrtki po djelatnostima procjenjuju se pomoću Statistike poslovanja
Globalna analiza
međunarodnoj obuci u drugim zemljama koristeći podatke Euromonitora o diplomantima po smjeru po stupnju,
kao i podatke iz lokalnih statističkih ureda gdje podaci Euromonitora nisu dostupni. Primjenjujemo omjere
Broj javnih i privatnih poduzeća prema veličini Statistika američkih poduzeća (SUSB)
zaposlenosti
po djelatnostima
Neto temeljni kapital prema vrsti Američki ured za ekonomsku analizu (BEA)
Bibliografija
Abele, Eberhard, Tobias Meyer, Ulrich Näher, Gernot Strube i Richard Sykes, ur., Globalna
proizvodnja: priručnik za strategiju i provedbu (Berlin: Springer, 2008.).
Agrawal, R., T. Imielinski i A. Swami, “Rudarska pravila povezivanja između skupova stavki
u velikim bazama podataka,” SIGMOD konferencija 1993: 207–216.
Akella, Janaki, Timo Kubach, Markus Löffler i Uwe Schmid, Data-driven management:
Bringing more science into management, McKinsey Technology Initiative Perspective,
2008.
Ayes, Ian, Super crunchers: Zašto je razmišljanje brojevima novi način da budete
pametni (New York: Bantam Books, 2007.).
Baily, Martin N., Karen Croxson, Thomas Dohrmann i Lenny Mendonca, Imperativ
produktivnosti javnog sektora, McKinsey & Company, ožujak 2011.
Barber, Michael, Alastair Levy i Lenny Mendoca, Globalni trendovi koji utječu na javni
sektor, McKinsey white paper, veljača 2008.
Baumgarten, Jason i Michael Chui, "E-uprava 2.0", McKinsey Quarterly, srpanj 2009.
Benham, Lee, "Učinak oglašavanja na cijenu naočala", Journal of Law and Economics 15(2),
listopad 1972.: 337–352.
Besley, Timothy i Maitreesh Ghatak, “Statusni poticaji,” American Economic Review 98(2),
2008: 206–211.
Bohn, Roger i James Short, Koliko informacija? 2009: Izvješće o američkim potrošačima,
Sveučilište Kalifornije, San Diego, Globalni informacijski industrijski centar, siječanj 2010.
Bohn, Roger, James Short i Chaitanya Baru, Koliko informacija? 2010.: Izvješće o
informacijama poslužitelja poduzeća, Sveučilište Kalifornije, San Diego, Globalni
informacijski industrijski centar, siječanj 2011.
138
Briscoe, Bob, Andrew Odlyzko i Benjamin Tilly, Metcalfeov zakon je pogrešan, IEEE Spectrum,
srpanj 2006.
Brown, Robert G. i John M. Caddick, Tvornica je virtualna... ušteda je stvarna, rad predstavljen na
simpoziju RTO AVT, 2003.
Brynjolfsson, Erik, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako odlučivanje
temeljeno na podacima utječe na izvedbu poduzeća?, 22. travnja 2011., dostupno na SSRN
(ssrn.com/abstract=1819486).
Bughin, Jacques i Michael Chui. "Uspon umreženog poduzeća: Web 2.0 nalazi svoj dan isplate",
McKinsey Quarterly, prosinac 2010.
Bughin, Jacques, Michael Chui i James Manyika. “Oblaci, veliki podaci i pametna imovina: Deset
trendova omogućenih tehnologijom koje treba promatrati,” McKinsey Quarterly, kolovoz 2010.
Chui, Michael, Markus Löffler i Roger Roberts, "Internet stvari", McKinsey Quarterly, ožujak 2010.
Chui, Michael, Andy Miller i Roger Roberts, “Šest načina da Web 2.0 funkcionira”,
McKinsey Quarterly, veljača 2009.
Kongresni ured za proračun, proračunske opcije, svezak I: Zdravstvena skrb, prosinac 2008.
Cortes, Corinna i Vladimir Vapnik, “Support-vector networks,” Machine Learning 20(3), rujan 1995.
Danker, Tony, Thomas Dohrmann, Nancy Killefer i Lenny Mendonca, "Kako američka vlada može
odgovoriti na svoj izazov produktivnosti?" McKinsey Quarterly, srpanj 2006.
Davenport, Thomas H. i Jeanne G. Harris, Analitika na djelu: pametnije odluke, bolji rezultati
(Cambridge, MA: Harvard Business Press, 2010.).
Davis, Jerel C., Laura Furstenthal, Amar A. Desai, Troy Norris, Saumya Sutaria, Edd Fleming i Philip
Ma, “Mikroekonomija personalizirane medicine: Današnji izazov i sutrašnje obećanje”, Nature
Reviews Drug Discovery 8, 279–286 , travanj 2009.
(UK) Department of Health, Upotreba lijekova protiv raka odobrena od strane NICE-revizija
Nacionalnog direktora za rak, rujan 2006.
(SAD) Ministarstvo zdravstva i socijalnih usluga, Zdravstvo, Sjedinjene Američke Države, 2010.:
Poseban prilog o smrti i umiranju, 2010.
Digital Forensics Association, The leaking vault: Five years of data breaches, srpanj 2010.
Dohrmann, Thomas i Gary Pinshaw, Put do poboljšane usklađenosti, McKinsey bijela knjiga, rujan
2009.
Drucker, Peter F., Izazovi menadžmenta 21. stoljeća (New York: Harper Business, 1999.).
Dunleavy, P., Innovating out of a recession, seminar, London School of Economics, London, 22.
lipnja 2009.
Europska komisija, Digitalizacija javnih usluga u Europi: Provođenje ambicije u djelo, prosinac
2010.
Europska komisija, “The 2009 aging report: Underlying assumptions and projection
methodologies,” European Economy 7, 2008.
Farrell, Diana, Martha Laboissiere i Jaeson Rosenfeld, “Procjena globalnog tržišta rada u
nastajanju”, McKinsey Quarterly, lipanj 2005.
Gantz, John F., Christopher Chute, Alex Manfrediz, Stephen Minton, David Reinsel, Wolfgang
Schlichting i Anna Toncheva, “The diverse and expanding digital universe,” IDC white paper,
sponzoriran od strane EMC-a, ožujak 2008.
Gantz, John F. i David Reinsel, "Kako se ekonomija smanjuje, digitalni svemir se širi", bijela knjiga
IDC-a, sponzoriran od strane EMC-a, svibanj 2009.
Gantz, John F., David Reinsel, Christopher Chute, Wolfgang Schlichting, John McArthur,
Stephen Minton, Irida Xheneti, Anna Toncheva i Alex Manfrediz, “The expanding digital universe,”
IDC white paper, sponzoriran od strane EMC-a, ožujak 2007.
Machine Translated by Google
140
Ghemawat, Sanjay, Howard Gobioff i Shun-Tak Leung, Googleov sustav datoteka, 19. ACM
simpozij o načelima operativnih sustava, Lake George, NY, listopad 2003.
Gleick, James, Informacije: povijest. Teorija. Poplava (New York: Pantheon Books, 2011.).
Harding, JA, M. Shahbaz, S. Srinivas i A. Kusiak, "Rudarenje podataka u proizvodnji: Pregled", Journal
of Manufacturing Science and Engineering, 2006.
Hubbard, Douglas W., Kako izmjeriti bilo što: Pronalaženje vrijednosti nematerijalne imovine
u poslovanju (New York: Wiley, 2010.).
Jha Ashish, K., et al., “Korištenje elektroničkih zdravstvenih zapisa u američkim bolnicama,” New
England Journal of Medicine 360(16), 16. travnja 2009.:1628–1638.
Johnston, Douglas, Eric Pan i Jan Walker, "Vrijednost CPOE u ambulantnim uvjetima", Journal
of Healthcare Information Management, 2004.
Kaushal, Rainu, et al., “Troškovi nacionalne zdravstvene informacijske mreže,” Annals of Internal
Medicine, 2005.
Kaushik, Avinash, Sedam koraka do stvaranja kulture odlučivanja vođene podacima, listopad
2006.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 141
Lohr, Steve, “Za današnjeg diplomanta, samo jedna riječ: statistika,” New York Times, 5. kolovoza
2009.
Lonti, Z., i M. Woods, Prema vladi na prvi pogled: Identifikacija ključnih podataka i pitanja
povezanih s učinkovitošću javnog sektora, Radni dokumenti OECD-a o javnom upravljanju, br. 7,
OECD Publishing, doi:10.1787/245570167540.
Lyman, Peter i Hal Varian, koliko informacija? 2003., Škola informacijskog menadžmenta i
sustava, Kalifornijsko sveučilište u Berkeleyu, 2003.
Magoulas, Roger i Ben Lorica, “Big data: Tehnologije i tehnike za velike podatke,” Izdanje 2.0, broj
11, veljača 2009.
Mango, Paul D. i Vivian E. Riefberg, “Tri imperativa za poboljšanje zdravstvene skrbi u SAD-u,”
McKinsey Quarterly, prosinac 2008.
McKinsey & Company za IAB Europe, Potrošači koji pokreću digitalnu upotrebu: Ekonomska
vrijednost usluga koje se temelje na online oglašavanju za potrošače, rujan 2010.
McKinsey Global Institute, Računovodstvo troškova američke zdravstvene skrbi: Novi pogled na
to zašto Amerikanci troše više, prosinac 2008.
McKinsey Global Institute, Izvan štednje: Put do gospodarskog rasta i obnove u Europi, listopad
2010.
McKinsey Global Institute, Mijenjanje sudbine američke radne snage: Izazov ljudskog kapitala,
lipanj 2009.
McKinsey Global Institute, Dug i razduživanje: Globalni kreditni balon i njegove ekonomske
posljedice, siječanj 2010.
McKinsey Global Institute, From austerity to prosperity: Seven priorities for the long term, studeni
2010.
Mekhjian, Hagop S., et. al., "Neposredne koristi ostvarene nakon provedbe unosa naloga liječnika
u akademskom medicinskom centru", Journal of the American Medical Informatics Association,
9:529-539, 2002.
Miller, George A., “Čarobni broj sedam, plus ili minus dva: Neka ograničenja naše sposobnosti
obrade informacija,” Psychological Review, svezak 63(2), ožujak 1956.: 81–97.
Machine Translated by Google
142
OECD, Praćenje pridržavanja poreznih obveznika: praktični vodič temeljen na iskustvu poreznih tijela,
lipanj 2008.
Oliner, Stephen i Daniel Sichel, “Informacijska tehnologija i produktivnost: Gdje smo sada i kamo idemo?”,
Federal Reserve Bank of Atlanta Economic Review, 2002.
Pearson, Mark, Odjel za zdravstvo OECD-a, pisana izjava Posebnom odboru Senata za starenje,
rujan 2009.
Peterson, Chris L. i Rachel Burton, Potrošnja na zdravstvenu skrb u SAD-u: Usporedba s drugim
zemljama OECD-a, Istraživačka služba Kongresa, rujan 2007.
Ponemon Institute, Četvrta godišnja američka studija troškova povrede podataka, siječanj 2009.
Potts, Amy L., Frederick E. Barr, David F. Gregory, Lorianne Wright i Neal R. Patel, “Računalni unos
narudžbi liječnika i pogreške u liječenju lijekova u pedijatrijskoj jedinici kritične njege,” Pediatrics 113(1),
2004:59 –63.
PwC Health Industries, Cijena viška: Identificiranje rasipanja potrošnje u zdravstvu, 2009.
Shapiro, Carl i Hal R. Varian, Informacijska pravila: Strateški vodič za mrežnu ekonomiju (Cambridge,
MA: Harvard Business Press, 1998.).
Simon, Herbert A., “Dizajniranje organizacija za svijet bogat informacijama,” u Martin Greenberger,
Računala, komunikacije i javni interes (Baltimore, MD: The Johns Hopkins Press, 1971.).
“Posebno izvješće o upravljanju informacijama: Podaci, podaci posvuda”, The Economist, 25. veljače
2010.
Technium (www.kk.org/thetechnium/)
Varian, Hal. Računalno posredovane transakcije, 2010. Ely predavanje na sastanku Američkog
ekonomskog udruženja, Atlanta, Georgia.
Machine Translated by Google
McKinsey Global Institute
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 143
Viegas, Fernanda B., Martin Wattenberg i Kushal Dave, Proučavanje suradnje i sukoba
između autora s vizualizacijama toka povijesti, CHI2004 zbornik radova SIGCHI
konferencije o ljudskim faktorima u računalnim sustavima, 2004.
Wikipedia (http://en.wikipedia.org/).
kolovoza 2010
Oblaci, veliki podaci i pametna imovina:
Angus
Greig
modeli. Viši rukovoditelji trebaju strateški razmišljati o tome kako pripremiti svoje organizacije za izazovno novo
okruženje.
Napredne tehnologije i njihovo brzo usvajanje mijenjaju tradicionalne poslovne modele.
Viši rukovoditelji trebaju strateški razmišljati o tome kako pripremiti svoje organizacije za
Jacques Bughin, Prije dvije i pol godine opisali smo osam poslovnih informacijske tehnologije koje se primjenjuju također se
Michael Chui, i trendova omogućenih tehnologijom koji su temeljito mijenjaju, budući da novi razvoji poput virtualizacije i računalstva
James Manyika
preoblikovali strategiju u širokom nizu u oblaku preraspoređuju tehnološke troškove
industrije.1 Pokazali smo kako kombinirani učinci i obrascima korištenja dok se stvaraju novi načini za
nadolazećih internetskih tehnologija, povećane računalne pojedince da konzumiraju dobra i usluge i za poduzetnike i
Kacije su iznjedrile nove načine upravljanja talentom i poslovni modeli. Vrtoglava brzina promjena utjecala je na
1 James M. Manyika, Roger P.
Roberts, i Kara L. Sprague, “Osam imovinom, kao i nova razmišljanja o organizacijskim naših izvornih osam trendova, koji su se nastavili širiti (iako
poslovnih tehnoloških trendova
strukturama. često bržim tempom
ožujka 2010
Internet stvari
Sve više objekata postaje ugrađeno sa senzorima i dobiva sposobnost komunikacije. Nastale
nove informacijske mreže obećavaju stvaranje novih poslovnih modela, poboljšanje poslovnih
procesa i smanjenje troškova i rizika.
pokretače ovih viših troškova. MGI smatra da je izvanbolnička skrb, koja uključuje jednodnevne
posjete bolnici i liječničkoj ordinaciji, daleko najveći i najbrže rastući dio američkog zdravstvenog
sustava. Sljedeći najveći doprinos su troškovi lijekova, administracije i osiguranja.
listopada 2002
listopada 2001
Rast produktivnosti u SAD-u
1995.-2000
Rast produktivnosti u SAD-u 1995.-2000.: Razumijevanje doprinosa informacijske tehnologije u
Razumijevanje doprinosa
Informacijska tehnologija u odnosu na
druge čimbenike odnosu na druge čimbenike
McKinsey
Globalno
Institut Studija MGI-a o rastu produktivnosti u SAD-u imala je za cilj utvrditi uzroke naglog povećanja
Uz pomoć našeg savjetodavnog odbora B. Solowa,
stope rasta produktivnosti rada u Sjedinjenim Državama između 1995. i 2000. Taj su porast
predsjednika, B. Boswortha, T. Halla, J. Tripletta
Washington DC
listopada 2001
Ovo izvješće zaštićeno je autorskim pravima McKinsey & Company, Inc.; niti
jedan njegov dio ne smije se distribuirati, citirati ili reproducirati za distribuciju bez
ključni ekonomisti i kreatori politike protumačili kao dokaz "nove ekonomije", gdje bi IT aplikacije
prethodnog pismenog odobrenja tvrtke McKinsey & Company, Inc.
dovele do bržeg gospodarskog rasta SAD-a. Izvješće izlaže prirodu i važnost uloge šest ključnih
sektora u ubrzanju rasta produktivnosti i njegove uzroke, s fokusom na ulogu IT-a.
www.mckinsey.com/mgi
E-knjige odabranih MGI izvješća dostupne su na MGI web stranici, u Amazonovoj Kindle
knjižari i Appleovoj iBookstore.