Big Data McKinsey

Machine Translated by Google
McKinsey Global Institute
lipnja 2011
Big data: Sljedeća granica

za inovacije, konkurenciju
i produktivnost

McKinsey Global Institute (MGI), osnovan 1990., ogranak je tvrtke McKinsey &
Company za istraživanje poslovanja i ekonomije.
Misija MGI-a je pomoći čelnicima u komercijalnom, javnom i društvenom sektoru da

razviju dublje razumijevanje evolucije globalnog gospodarstva i pružiti bazu činjenica
koja pridonosi donošenju odluka o kritičnim pitanjima upravljanja i politike.
MGI istraživanje kombinira dvije discipline: ekonomiju i menadžment.

Ekonomisti često imaju ograničen pristup praktičnim problemima s kojima se
suočavaju viši menadžeri, dok višim menadžerima često nedostaje vremena i
poticaja da pogledaju izvan svoje vlastite industrije na veća pitanja globalne ekonomije.
Integriranjem ovih perspektiva, MGI je u mogućnosti steći uvid u
mikroekonomske temelje dugoročnih makroekonomskih trendova koji utječu na
poslovnu strategiju i donošenje politika. Gotovo dva desetljeća, MGI je koristio ovaj
"mikro-makro" pristup u istraživanju koje pokriva više od 20 zemalja i 30 industrijskih
sektora.
MGI-jev trenutni istraživački program fokusiran je na tri široka područja:

produktivnost, konkurentnost i rast; razvoj globalnih financijskih tržišta; i ekonomski
učinak tehnologije. Nedavna istraživanja ispitala su program reformi za poticanje rasta
i obnove u Europi i Sjedinjenim Državama kroz ubrzani rast produktivnosti; ekonomski
potencijal Afrike; dug i razduživanje i kraj jeftinog kapitala; utjecaj multinacionalnih
kompanija na američko gospodarstvo; poslovni trendovi omogućeni tehnologijom;
urbanizacija u Indiji i Kini; te konkurentnost sektora i industrijska politika.
MGI vode tri direktora McKinsey & Company: Richard Dobbs, James Manyika i Charles
Roxburgh. Susan Lund radi kao MGI-jeva direktorica istraživanja. MGI projektne
timove vodi skupina starijih suradnika i uključuju konzultante iz McKinseyevih ureda
diljem svijeta. Ovi se timovi oslanjaju na McKinseyjevu globalnu mrežu stručnjaka i
partnera iz industrije i upravljanja.
Osim toga, MGI surađuje s vodećim ekonomistima, uključujući nobelovce, koji djeluju
kao savjetnici za MGI projekte.
Partneri McKinsey & Company financiraju MGI-jevo istraživanje koje nije naručila
nijedna tvrtka, vlada ili druga institucija.
Dodatne informacije o MGI-u i kopije objavljenih izvješća MGI-a mogu se pronaći na

www.mckinsey.com/mgi.
Autorska prava © McKinsey & Company 2011

svibnja 2011
Big data: Sljedeća granica

za inovacije, konkurenciju
i produktivnost
James Manyika
Michael Chui
Brad Brown
Jacques Bughin
Richard Dobbs
Charles Roxburgh
Angela Hung Byers
Predgovor
Količina podataka u našem svijetu eksplodira. Tvrtke hvataju trilijune bajtova informacija o svojim
klijentima, dobavljačima i operacijama, a milijuni umreženih senzora ugrađeni su u fizički svijet
u uređaje kao što su mobilni telefoni i automobili, detektirajući, stvarajući i prenoseći podatke.
Multimedija i pojedinci s pametnim telefonima i na društvenim mrežama nastavit će

poticati eksponencijalni rast. Veliki podaci – veliki skupovi podataka koji se mogu uhvatiti,
prenijeti, agregirati, pohraniti i analizirati – sada su dio svakog sektora i funkcije globalnog
gospodarstva. Poput drugih bitnih čimbenika proizvodnje kao što su čvrsta imovina i ljudski
kapital, sve je više slučaj da se većina modernih gospodarskih aktivnosti, inovacija i rasta
jednostavno ne bi mogla odvijati bez podataka.
Pitanje je što ta pojava znači. Je li proliferacija podataka samo dokaz sve nametljivijeg svijeta?
Ili veliki podaci mogu imati korisnu ekonomsku ulogu? Dok je većina dosadašnjih istraživanja
velikih podataka bila usredotočena na pitanje njihovog obujma, naša studija tvrdi da su poslovne
i ekonomske mogućnosti velikih podataka i njihove šire implikacije važna pitanja s kojima se moraju
pozabaviti poslovni čelnici i kreatori politike. Kako bi informirala raspravu, ova studija ispituje
potencijalnu vrijednost koju veliki podaci mogu stvoriti za organizacije i sektore gospodarstva te
nastoji ilustrirati i kvantificirati tu vrijednost. Također istražujemo što čelnici organizacija i kreatori
politika trebaju učiniti kako bi to uhvatili.
James Manyika i Michael Chui vodili su ovaj projekt, blisko surađujući s Bradom Brownom,
Jacquesom Bughinom i Richardom Dobbsom. Charles Roxburgh također je dao vrijedan doprinos.
Angela Hung Byers vodila je projektni tim koji su činili Markus Allesch, Alex Ince-Cushman, Hans
Henrik Knudsen, Soyoko Umeno i JiaJing Wang. Martin N. Baily, viši savjetnik McKinseyja i viši
suradnik na Institutu Brookings, i Hal R. Varian, profesor emeritus na Školi informacija, Poslovnoj
školi Haas i Odjelu za ekonomiju na Kalifornijskom sveučilištu u Berkeleyju. , i glavni ekonomist
u Googleu, bili su akademski savjetnici u ovom radu. Također smo zahvalni na doprinosu Eriku
Brynjolfssonu, profesoru obitelji Schussel na MIT Sloan School of Management i direktoru MIT
Centra za digitalno poslovanje, i Andrewu McAfeeju, glavnom istraživaču u MIT Centru za digitalno
poslovanje.
Tim također cijeni doprinos koji je dala naša akademska istraživačka suradnja s Global
Information Industry Center (GIIC) na Kalifornijskom sveučilištu u San Diegu, čiji je cilj bio
postići bolje razumijevanje generiranja podataka u zdravstvu i javnom sektoru, kao i kao u
području osobnih podataka o lokaciji. Zahvalni smo Rogeru E. Bohnu, profesoru menadžmenta
i direktoru na GIIC-u, i Jamesu E. Shortu, direktoru istraživanja Centra, glavnim istraživačima,
kao i studentima diplomskog studija Coralie Bordes, Kylie Canaday i Johnu Petrequinu.
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost
Zahvalni smo na vitalnom doprinosu i podršci brojnih kolega iz MGI-a i McKinseyja,

uključujući višeg stručnjaka Thomasa Herbiga; Simon London, McKinsey direktor digitalnih
komunikacija; viša suradnica MGI-a Jaana Remes; i stručni voditelji William Forrest i Roger
Roberts. Iz McKinseyjeve zdravstvene prakse želimo zahvaliti Stefanu Biesdorfu, Baselu Kayyaliju,
Bobu Kocheru, Paulu Mangu, Samu Marwahi, Brianu Milchu, Davidu Nuzumu, Vivian Riefberg,
Saumu Sutariji, Steveu Savasu i Steveu Van Kuikenu. Iz prakse javnog sektora, željeli bismo zahvaliti
na doprinosu Kalleu Bengtssonu, Davidu Chinnu, suradnici MGI-a Karen Croxson, Thomasu
Dohrmannu, Timu Kelseyju, Alastairu Levyju, Lennyju Mendonci, Sebastianu Muschteru i Garyju
Pinshawu. Iz maloprodajne prakse, zahvalni smo stručnjacima za znanje MGI Economics Research
Imranu Ahmedu, Davidu Courtu, Karelu Dörneru i Johnu Livingstonu. Iz proizvodne prakse želimo
se zahvaliti Andréu Andonianu, Markusu Löffleru, Danielu Pacthodu, Asutoshu Padhiju, Mattu Rogersu
i Gernotu Strubeu. Što se tiče osobnih podataka o lokaciji, željeli bismo zahvaliti na pomoći koju
smo primili od Kallea Grevena, Marca de Jonga, Rebecce Millman, Juliana Millsa i Stephana
Zimmermanna. Željeli bismo zahvaliti Marthi Laboissiere na njezinoj pomoći u našoj analizi talenta
te Anoop Sinha i Siddhartha S na njihovoj pomoći u mapiranju velikih podataka. Tim se također
oslanjao na prethodna istraživanja MGI-a, kao i na druga McKinseyjeva istraživanja uključujući
globalna istraživanja iConsumer, McKinsey Quarterly Web 2.0 istraživanja, sustav zdravstvene skrbi
i usporedbu učinkovitosti bolnica, usporedbu poreza u više zemalja, produktivnost javnog sektora i
istraživanje za Internet Advertising Board of Europa. Tim cijeni doprinose Janet Bush, starije urednice
MGI-a, koja je pružila uredničku podršku; Rebeca Robboy, voditeljica vanjskih komunikacija MGI-a;
Charles Barthold, voditelj vanjskih komunikacija u McKinseyevom Uredu za poslovnu tehnologiju;
Julie Philpot, voditeljica uredničke produkcije MGI-a; i stručnjaci za grafički dizajn Therese Khoury,
Marisa Carder i Bill Carlson.
Ovo izvješće pridonosi misiji MGI-a da pomogne globalnim čelnicima da razumiju sile koje
transformiraju globalno gospodarstvo, poboljšaju učinak tvrtke i rade na boljim nacionalnim i
međunarodnim politikama. Kao i sa svim MGI istraživanjima, želimo naglasiti da je ovaj rad
neovisan i da ga nije naručila niti na bilo koji način sponzorirala bilo koja tvrtka, vlada ili druga
institucija.
Richard Dobbs
Direktor, McKinsey Global Institute

Seul
James Manyika
San Francisco
Charles Roxburgh
London
Susan Lund
Direktor istraživanja, McKinsey Global Institute

Washington DC
lipnja 2011
vi
Big data—bujica koja raste

kupiti disk jedinicu koja može
$600 pohranjuju svu svjetsku glazbu
5 milijardi mobilnih telefona u 2010
dijeljenih dijelova sadržaja

30 milijardi na Facebooku svaki mjesec
40%
predviđeni rast
generiranih globalnih podataka
5%
godišnje vs.
rast u globalu
IT potrošnja
235 terabajta podataka koje je

Kongresna knjižnica SAD-a
prikupila do travnja 2011
15 od 17
sektori u Sjedinjenim Državama imaju
više pohranjenih podataka po tvrtki
nego Kongresna knjižnica SAD-a
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost vii
Big data—hvatanje njihove vrijednosti
300 milijardi dolara

potencijalnu godišnju vrijednost za zdravstvenu skrb u SAD-u više nego
dvostruko od ukupne godišnje potrošnje za zdravstvo u Španjolskoj
250 milijardi eura

potencijalna godišnja vrijednost za europsku upravu javnog
sektora—više od BDP-a Grčke
600 milijardi dolara

potencijalni godišnji potrošački višak od korištenja
osobnih podataka o lokaciji na globalnoj razini
60% potencijalno povećanje

operativnih marži trgovaca moguće
s velikim podacima
140.000–190.000
dublje pozicije analitičkog talenta i
1.5 milijun
potrebno je više menadžera koji
razumiju podatke kako bi u potpunosti
iskoristili velike podatke u Sjedinjenim Državama
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost
Sadržaj
Izvršni sažetak 1
1. Mapiranje globalnih podataka: rast i stvaranje vrijednosti 15
2. Tehnike i tehnologije velikih podataka 27
3. Transformativni potencijal velikih podataka u pet domena 37
3a. Zdravstvena zaštita (Sjedinjene Američke Države) 39
3b. Uprava javnog sektora (Europska unija) 54
3c. Maloprodaja (Sjedinjene Američke Države) 64
3d. Proizvodnja (globalno) 76
3e. Podaci o osobnoj lokaciji (globalno) 85
4. Ključni nalazi koji se primjenjuju na sve sektore 97
5. Implikacije za voditelje organizacije 111
6. Implikacije za kreatore politike 117
dodatak 123
Izrada indeksa na temelju potencijala vrijednosti i

lakoće hvatanja 123
Metodologija karte podataka 126
Procjena potencijala vrijednosti u zdravstvu (Sjedinjene Američke Države) 127
Procjena vrijednosnog potencijala u javnoj upravi (Europska unija) 129
Procjena potencijalne vrijednosti u maloprodaji (Sjedinjene Američke Države) 130
Procjena potencijalne vrijednosti u podacima o osobnoj lokaciji (globalno) 133
Metodologija analize ponude i potražnje analitičkog talenta 134
Bibliografija 137
Big data: Sljedeća granica za inovacije, konkurenciju i produktivnost 1
Izvršni sažetak
Podaci su postali bujica koja teče u svako područje globalnog gospodarstva.1

Kompanije izbacuju rastuću količinu podataka o transakcijama, hvatajući trilijune bajtova
informacija o svojim klijentima, dobavljačima i operacijama. milijuni umreženih senzora
ugrađeni su u fizički svijet u uređaje kao što su mobilni telefoni, pametni mjerači energije,
automobili i industrijski strojevi koji osjećaju, stvaraju i prenose podatke u doba Interneta stvari.2
Doista, kao tvrtke i organizacije obavljaju svoj posao i komuniciraju s pojedincima, one generiraju
ogromnu količinu digitalnih "ispušnih podataka", tj. podataka koji nastaju kao nusproizvod drugih
aktivnosti. Društvene mreže, pametni telefoni i drugi potrošački uređaji, uključujući računala i
prijenosna računala, omogućili su milijardama pojedinaca diljem svijeta da doprinesu količini
dostupnih velikih podataka. A rastuća količina multimedijskog sadržaja odigrala je glavnu ulogu
u eksponencijalnom rastu količine velikih podataka (vidi Okvir 1, “Što podrazumijevamo pod
'velikim podacima'?”). Svaka sekunda videa visoke razlučivosti, na primjer, generira više od 2000
puta više bajtova nego što je potrebno za pohranu jedne stranice teksta. U digitaliziranom svijetu
potrošači radeći svoj dan – komunicirajući, pregledavajući, kupujući, dijeleći, pretražujući –
stvaraju vlastite goleme tragove podataka.
Okvir 1. Što podrazumijevamo pod "velikim podacima"?
"Veliki podaci" odnose se na skupove podataka čija veličina nadilazi sposobnost tipičnih
softverskih alata za baze podataka za snimanje, pohranu, upravljanje i analizu. Ova je
definicija namjerno subjektivna i uključuje pokretnu definiciju o tome koliko skup podataka
treba biti velik da bi se smatrao velikim podacima—tj. ne definiramo velike podatke u smislu
da su veći od određenog broja terabajta (tisuća gigabajta ). Pretpostavljamo da će se, kako
tehnologija s vremenom bude napredovala, povećavati i veličina skupova podataka koji se
kvalificiraju kao veliki podaci. Također imajte na umu da se definicija može razlikovati
ovisno o sektoru, ovisno o tome koje su vrste softverskih alata uobičajeno dostupne i koje su
veličine skupova podataka uobičajene u određenoj industriji.
Uz ta upozorenja, veliki podaci u mnogim će se sektorima danas kretati od nekoliko
desetaka terabajta do više petabajta (tisuće terabajta).
Sama po sebi, velika količina podataka je globalni fenomen - ali što to znači?
Mnogi građani diljem svijeta s dubokom sumnjom gledaju na ovo prikupljanje informacija,
doživljavajući poplavu podataka ništa više od zadiranja u njihovu privatnost.
Ali postoje snažni dokazi da veliki podaci mogu igrati značajnu gospodarsku ulogu u korist
ne samo privatne trgovine nego i nacionalnih gospodarstava i njihovih građana. Naše
istraživanje otkriva da podaci mogu stvoriti značajnu vrijednost za svjetsko gospodarstvo,
povećavajući produktivnost i konkurentnost tvrtki i
1 Vidi “Posebno izvješće o upravljanju informacijama: Podaci, podaci posvuda,” The Economist,
25. veljače 2010.; i posebno izdanje o “Radu s podacima,” Science, 11. veljače 2011.
2 "Internet stvari" odnosi se na senzore i aktuatore ugrađene u fizičke objekte, povezane
mrežama do računala. Vidi Michael Chui, Markus Löffler i Roger Roberts, “The Internet of
Things”, McKinsey Quarterly, ožujak 2010.
javnog sektora i stvaranje značajnog gospodarskog viška za potrošače. Na primjer, kad bi

zdravstvo u SAD-u moglo kreativno i učinkovito koristiti velike podatke za poticanje učinkovitosti
i kvalitete, procjenjujemo da bi potencijalna vrijednost podataka u sektoru mogla iznositi više
od 300 milijardi dolara svake godine, od čega bi dvije trećine bilo u oblik smanjenja nacionalnih
rashoda za zdravstvo za oko 8 posto. U privatnom sektoru procjenjujemo, na primjer, da trgovac
na malo koji u potpunosti koristi velike podatke ima potencijal povećati svoju operativnu maržu
za više od 60 posto. Procjenjujemo da bi državna administracija u razvijenim europskim
gospodarstvima mogla uštedjeti više od 100 milijardi eura (149 milijardi dolara) samo na
poboljšanjima operativne učinkovitosti korištenjem velikih podataka. Ova procjena ne
uključuje velike podatkovne poluge koje bi mogle smanjiti prijevare, pogreške i porezne jazove
(tj. jaz između potencijalnih i stvarnih poreznih prihoda).
Digitalni podaci sada su posvuda - u svakom sektoru, u svakom gospodarstvu, u

svakoj organizaciji i korisniku digitalne tehnologije. Iako je ova tema možda nekada
zanimala samo nekoliko podatkovnih štrebera, veliki podaci sada su relevantni za lidere u
svim sektorima, a potrošači proizvoda i usluga mogu imati koristi od njihove primjene.
Sposobnost pohranjivanja, prikupljanja i kombiniranja podataka i zatim korištenja rezultata za
izvođenje dubokih analiza postala je sve dostupnija jer trendovi kao što je Mooreov zakon u
računalstvu, njegov ekvivalent u digitalnoj pohrani i računalstvo u oblaku nastavljaju snižavati
troškove i druge tehnološke prepreke .3 Za manje od 600 USD, pojedinac može kupiti
diskovni pogon s kapacitetom za pohranjivanje cjelokupne svjetske glazbe.4 Sredstva za
izvlačenje uvida iz podataka također se znatno poboljšavaju kako se softver koji je dostupan
za primjenu sve sofisticiranijih tehnika kombinira s rastućim računalnim snagama . Nadalje,
mogućnost generiranja, komuniciranja, dijeljenja i pristupa podacima revolucionirala je sve
veći broj ljudi, uređaja i senzora koji su sada povezani digitalnim mrežama. U 2010. godini
više od 4 milijarde ljudi, odnosno 60 posto svjetske populacije, koristilo je mobilne telefone, a
oko 12 posto tih ljudi imalo je pametne telefone, čija penetracija raste više od 20 posto
godišnje. Više od 30 milijuna umreženih senzorskih čvorova sada je prisutno u transportnom,
automobilskom, industrijskom, komunalnom i maloprodajnom sektoru. Broj ovih senzora raste
po stopi većoj od 30 posto godišnje.
Mnogo je načina na koje se veliki podaci mogu koristiti za stvaranje vrijednosti u različitim
sektorima globalnog gospodarstva. Doista, naše istraživanje sugerira da smo na pragu
ogromnog vala inovacija, produktivnosti i rasta, kao i novih načina natjecanja i osvajanja
vrijednosti—sve potaknuto velikim podacima dok potrošači, tvrtke i gospodarski sektori
iskorištavaju njihov potencijal . Ali zašto bi to sada bio slučaj? Nisu li podaci uvijek bili dio
utjecaja informacijske i komunikacijske tehnologije?
Da, ali naše istraživanje sugerira da su opseg i opseg promjena koje donose veliki podaci
na prekretnici, da će se znatno proširiti, kako se niz tehnoloških trendova ubrzava i
približava. Već vidimo vidljive promjene u gospodarskom krajoliku kao rezultat ove
konvergencije.
Mnoge pionirske tvrtke već koriste velike podatke za stvaranje vrijednosti, a druge moraju
istražiti kako mogu učiniti isto ako se žele natjecati. I vlade imaju značajnu priliku povećati
svoju učinkovitost i vrijednost za novac
3 Mooreov zakon, koji je prvi opisao Intelov suosnivač Gordon Moore, navodi da broj
tranzistora koji se mogu smjestiti na integrirani krug udvostručuje otprilike svake dvije godine.
Drugim riječima, količina računalne snage koja se može kupiti za isti iznos novca udvostručuje
se svake dvije godine. Računalstvo u oblaku odnosi se na mogućnost pristupa visoko skalabilnim
računalnim resursima putem Interneta, često po nižim cijenama od onih potrebnih za instalaciju
na vlastitim računalima jer se resursi dijele među mnogim korisnicima.
4 Kevin Kelly, Web 2.0 Expo i konferencija, 29. ožujka 2011. Videozapis dostupan na:
www.web2expo.com/webexsf2011/public/schedule/proceedings.
nude građanima u vrijeme kada su javne financije ograničene—i vjerojatno će tako i

ostati zbog starenja stanovništva u mnogim zemljama diljem svijeta. Naše istraživanje
pokazuje da javni sektor može značajno povećati svoju produktivnost učinkovitom
upotrebom velikih podataka.
Međutim, tvrtke i druge organizacije i kreatori politika moraju se suočiti sa značajnim

izazovima ako žele uhvatiti puni potencijal velikih podataka. Nedostatak analitičkog i
menadžerskog talenta potrebnog za maksimalno iskorištavanje velikih podataka
značajan je i hitan izazov s kojim se tvrtke i kreatori politika mogu početi baviti u bliskoj
budućnosti. Samo Sjedinjene Države suočavaju se s nedostatkom od 140 000 do 190
000 ljudi s dubokim analitičkim vještinama, kao i 1,5 milijuna menadžera i analitičara
za analizu velikih podataka i donošenje odluka na temelju njihovih nalaza. Manjak
talenata samo je početak. Ostali izazovi koje istražujemo u ovom izvješću uključuju
potrebu da se osigura odgovarajuća infrastruktura te da postoje poticaji i konkurencija
za poticanje kontinuirane inovacije; da su ekonomske koristi za korisnike, organizacije i
gospodarstvo ispravno shvaćene; te da postoje zaštitne mjere za rješavanje zabrinutosti
javnosti o velikim podacima.
Ovo izvješće nastoji razumjeti stanje digitalnih podataka, kako različite domene
mogu koristiti velike skupove podataka za stvaranje vrijednosti, potencijalnu
vrijednost među dionicima i implikacije za čelnike kompanija u privatnom sektoru i
organizacija javnog sektora, kao i za kreatore politike. Nadopunili smo našu analizu velikih
podataka u cjelini detaljnim ispitivanjem pet domena (zdravstvo u Sjedinjenim Državama,
javni sektor u Europi, maloprodaja u Sjedinjenim Državama te podaci o proizvodnji i
osobnoj lokaciji na globalnoj razini). Ovo istraživanje nipošto ne predstavlja posljednju
riječ o velikim podacima; umjesto toga, vidimo ga kao početak. U potpunosti predviđamo
da je ovo priča koja će se nastaviti razvijati kako se razvijaju tehnologije i tehnike koje
koriste velike podatke, a podaci, njihova upotreba i njihova ekonomska korist rastu (uz
povezane izazove i rizike). Za sada, međutim, naše istraživanje daje sedam ključnih uvida:
1. PODACI SU UŠLI U SVAKU INDUSTRIJU I POSLOVANJE
FUNKCIONIRANJE I SAD SU VAŽAN ČIMBENIK
PROIZVODNJA
Nekoliko istraživačkih timova proučavalo je ukupnu količinu podataka koji se

generiraju, pohranjuju i konzumiraju u svijetu. Iako opseg njihovih procjena, a time i
rezultati variraju, svi upućuju na eksponencijalni rast u godinama koje dolaze.5 MGI
procjenjuje da su poduzeća globalno pohranila više od 7 egzabajta novih podataka na
diskovne pogone u 2010., dok su potrošači pohranili više od 6 egzabajta nove podatke o
uređajima kao što su osobna i prijenosna računala. Jedan egzabajt podataka ekvivalent
je više od 4000 puta informaciji pohranjenoj u američkoj Kongresnoj knjižnici.6 Doista, mi stvaramo toliko
5 Vidi Peter Lyman i Hal Varian, Koliko informacija? 2003., Škola informatike
Upravljanje i sustavi, Kalifornijsko sveučilište u Berkeleyu, 2003.; radovi iz istraživačkog projekta IDC Digital
Universe, sponzoriranog od strane EMC-a, uključujući The expanding digital universe, ožujak 2007.; Raznolik i
rastući digitalni svemir, ožujak 2008.; Kako se ekonomija smanjuje, digitalni svemir se širi, svibanj 2009., i
Desetljeće digitalnog svemira—Jeste li spremni?, svibanj 2010. (www.emc.com/leadership/programs/digital-
universe.htm); dvije bijele knjige sa Sveučilišta Kalifornija, San Diego, Global Information Industry Center: Roger
Bohn i James Short, Koliko informacija? 2009.: Izvješće o američkim potrošačima, siječanj 2010., i Roger Bohn,
James Short i Chaitanya Baru, Koliko informacija? 2010.: Izvješće o informacijama o poslužitelju poduzeća, siječanj
2011.; i Martin Hilbert i Priscila López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje
informacija,” Science, 10. veljače 2011.
6 Prema web stranici Kongresne knjižnice, Kongresna knjižnica SAD-a imala je 235 terabajta
skladištenja u travnju 2011.
današnjih podataka da ih je fizički nemoguće sve pohraniti.7 Pružatelji zdravstvenih

usluga, na primjer, odbacuju 90 posto podataka koje generiraju (npr. gotovo sve video izvore u
stvarnom vremenu stvorene tijekom operacije).
Veliki podaci sada su dosegli svaki sektor u globalnom gospodarstvu. Kao i drugi bitni
čimbenici proizvodnje kao što su čvrsta imovina i ljudski kapital, veliki dio moderne
ekonomske aktivnosti jednostavno se ne bi mogao odvijati bez njega. Procjenjujemo da su do
2009. godine gotovo svi sektori u američkom gospodarstvu imali barem prosječno 200
terabajta pohranjenih podataka (dvostruko više od skladišta podataka američkog trgovca
Wal-Marta 1999.) po tvrtki s više od 1000 zaposlenika. Mnogi su sektori imali više od 1 petabajta
prosječno pohranjenih podataka po tvrtki. Ukupno, europske organizacije imaju oko 70 posto
kapaciteta za pohranu u čitavim Sjedinjenim Državama s gotovo 11 egzabajta u usporedbi s
više od 16 egzabajta u 2010. S obzirom na to da su europska gospodarstva slična jedna drugoj
u smislu stupnja razvoja, a time i distribucije tvrtki, vjerujemo da prosječna tvrtka u većini
industrija u Europi ima dovoljno kapaciteta za pohranu i manipuliranje velikim podacima.
Nasuprot tome, intenzitet podataka po glavi stanovnika u drugim je regijama puno niži. To
sugerira da će, barem u kratkom roku, najveći potencijal za stvaranje vrijednosti korištenjem
velikih podataka biti u najrazvijenijim gospodarstvima. Međutim, gledajući unaprijed, postoji
ogroman potencijal za iskorištavanje velikih podataka u gospodarstvima u razvoju sve dok
postoje pravi uvjeti. Uzmite u obzir, na primjer, činjenicu da je Azija već vodeća regija za
generiranje osobnih podataka o lokaciji jednostavno zato što se tamo koristi toliko mnogo
mobilnih telefona. Više mobilnih telefona—procjenjuje se da je 2010. bilo 800 milijuna uređaja
—u upotrebi je u Kini nego u bilo kojoj drugoj zemlji. Nadalje, neke pojedinačne tvrtke u regijama
u razvoju mogle bi biti daleko naprednije u korištenju velikih podataka nego što to prosjeci
sugeriraju. A neke će organizacije iskoristiti mogućnost pohranjivanja i obrade podataka na
daljinu.
Mogućnosti velikih podataka nastavljaju se ubrzano razvijati, potaknute inovacijama u

temeljnim tehnologijama, platformama i analitičkim mogućnostima za rukovanje podacima,
kao i evolucijom ponašanja među korisnicima jer sve više pojedinaca živi digitalnim
životom.
2. BIG DATA STVARA VRIJEDNOST NA NEKOLIKO NAČINA
Identificirali smo pet široko primjenjivih načina za iskorištavanje velikih podataka koji
nude transformacijski potencijal za stvaranje vrijednosti i imaju implikacije na način na koji će
organizacije morati biti dizajnirane, organizirane i upravljane. Na primjer, u svijetu u kojem je
moguće eksperimentiranje velikih razmjera, kako će se korporativne marketinške funkcije i
aktivnosti morati razvijati? Kako će se promijeniti poslovni procesi i kako će tvrtke vrednovati i
iskoristiti svoju imovinu (osobito podatkovnu imovinu)? Može li pristup tvrtki i sposobnost analize
podataka potencijalno dati veću vrijednost od robne marke? Koji će postojeći poslovni modeli
vjerojatno biti poremećeni? Na primjer, što se događa s industrijama koje se temelje na asimetriji
informacija – npr. raznim vrstama brokera – u svijetu radikalne transparentnosti podataka? Kako
će se postojeće tvrtke povezane s naslijeđenim poslovnim modelima i infrastrukturom natjecati s
agilnim novim napadačima koji su u stanju brzo obraditi i iskoristiti detaljne podatke o
potrošačima koji brzo postaju dostupni, npr. što govore na društvenim medijima ili što senzori
izvještavaju da rade u svijet? I što se događa kada se višak počne pomicati iz
7 Za drugu usporedbu generiranja podataka u odnosu na pohranu, vidi John F. Gantz, David Reinsel,
Christopher Chute, Wolfgang Schlichting, John McArthur, Stephen Minton, Irida Xheneti, Anna
Toncheva i Alex Manfrediz, "The expanding digital universe", IDC white paper, sponzoriran od
strane EMC-a, ožujak 2007.
dobavljača kupcima, budući da postaju osnaženi vlastitim pristupom podacima, npr.

usporedbama cijena i kvalitete između konkurenata?
Stvaranje transparentnosti
Jednostavna pravovremena dostupnost velikih podataka relevantnim dionicima može stvoriti

ogromnu vrijednost. U javnom sektoru, na primjer, olakšavanje pristupa relevantnim
podacima u inače odvojenim odjelima može znatno smanjiti vrijeme pretraživanja i obrade.
U proizvodnji, integracija podataka iz istraživanja i razvoja, inženjeringa i proizvodnih jedinica
kako bi se omogućio istovremeni inženjering može značajno skratiti vrijeme izlaska na
tržište i poboljšati kvalitetu.
Omogućivanje eksperimentiranja za otkrivanje potreba, otkrivanje varijabilnosti i poboljšanje

performansi Kako stvaraju i pohranjuju više transakcijskih podataka u digitalnom obliku,
organizacije mogu prikupljati preciznije i detaljnije podatke o izvedbi (u stvarnom ili gotovo
stvarnom vremenu) o svemu, od zaliha proizvoda do bolovanja osoblja . IT organizacijama
omogućuje instrumentiranje procesa i zatim postavljanje kontroliranih eksperimenata.
Korištenje podataka za analizu varijabilnosti u izvedbi – one koja se javlja prirodno ili je
generirana kontroliranim eksperimentima – i razumijevanje njezinih temeljnih uzroka može
omogućiti vođama da upravljaju izvedbom na višim razinama.
Segmentiranje populacije za prilagodbu radnji Big data
omogućuje organizacijama stvaranje vrlo specifičnih segmentacija i prilagođavanje

proizvoda i usluga kako bi točno zadovoljili te potrebe. Ovaj je pristup dobro poznat u
marketingu i upravljanju rizikom, ali može biti revolucionaran drugdje - na primjer, u javnom
sektoru gdje je etos postupanja prema svim građanima na isti način uobičajen. Čak i tvrtke za
robu široke potrošnje i usluge koje su godinama koristile segmentaciju počinju primjenjivati
sve sofisticiranije tehnike velikih podataka kao što je mikrosegmentacija kupaca u stvarnom
vremenu za ciljane promocije i oglašavanje.
Zamjena/podržavanje ljudskog donošenja odluka automatiziranim algoritmima

Sofisticirana analitika može znatno poboljšati donošenje odluka, minimizirati rizike
i otkriti vrijedne uvide koji bi inače ostali skriveni. Takva analitika ima aplikacije za organizacije
iz poreznih agencija koje mogu koristiti automatizirane mehanizme rizika za označavanje
kandidata za daljnje ispitivanje trgovcima na malo koji mogu koristiti algoritme za optimizaciju
procesa odlučivanja kao što je automatsko fino podešavanje zaliha i cijena kao odgovor na
informacije u stvarnom vremenu. trgovina i online prodaja. U nekim slučajevima odluke neće
nužno biti automatizirane, već će biti proširene analizom ogromnih, cijelih skupova podataka
korištenjem tehnika i tehnologija velikih podataka, a ne samo manjih uzoraka s kojima pojedinci
s proračunskim tablicama mogu rukovati i razumjeti ih. Donošenje odluka možda nikada neće
biti isto; neke organizacije već donose bolje odluke analizirajući čitave skupove podataka kupaca,
zaposlenika ili čak senzora ugrađenih u proizvode.
Inoviranje novih poslovnih modela, proizvoda i usluga
Big data omogućuje tvrtkama stvaranje novih proizvoda i usluga, poboljšanje postojećih i
osmišljavanje potpuno novih poslovnih modela. Proizvođači koriste podatke dobivene
korištenjem stvarnih proizvoda kako bi poboljšali razvoj sljedeće generacije proizvoda i stvorili
inovativne ponude usluga nakon prodaje. Pojava podataka o lokaciji u stvarnom vremenu
stvorila je potpuno novi skup lokacija-
bazirane usluge od navigacije do određivanja cijene imovine i osiguranja od nezgode na temelju

toga gdje i kako ljudi voze svoje automobile.
3. KORIŠTENJE VELIKIH PODATAKA POSTAT ĆE KLJUČNA OSNOVA KONKURENCIJE I RASTA ZA

POJEDINAČNE TVRTKE
Korištenje velikih podataka postaje ključni način za vodeće tvrtke da nadmaše svoje
konkurente. Na primjer, procjenjujemo da trgovac na malo koji prihvaća velike podatke ima
potencijal povećati svoju operativnu maržu za više od 60 posto. Vidjeli smo kako vodeći trgovci
na malo kao što je Tesco iz Ujedinjenog Kraljevstva koriste velike podatke kako bi osvojili
tržišni udio od svojih lokalnih konkurenata, a mnogi drugi primjeri obiluju industrijama kao
što su financijske usluge i osiguranje. U svim sektorima, očekujemo da ćemo vidjeti povećanje
vrijednosti za vodeće korisnike velikih podataka nauštrb onih koji zaostaju, trend za koji su
dokazi u nastajanju sve jači.8 Lideri koji razmišljaju naprijed mogu početi agresivno graditi
kapacitete svojih organizacija za velike podatke. Ovaj napor će potrajati, ali učinak razvoja
nadmoćnog kapaciteta za iskorištavanje velikih podataka donijet će poboljšanu konkurentsku
prednost na duge staze i stoga je vrijedan ulaganja u stvaranje ove sposobnosti. Ali vrijedi i
obrnuto. U svijetu velikih podataka, konkurent koji ne uspije dovoljno razviti svoje sposobnosti bit
će zaostao.
Veliki podaci također će pomoći u stvaranju novih prilika za rast i potpuno novih kategorija
tvrtki, poput onih koje prikupljaju i analiziraju podatke o industriji. Mnoge od njih bit će tvrtke
koje se nalaze usred velikih tokova informacija gdje se podaci o proizvodima i uslugama,
kupcima i dobavljačima te preferencijama i namjerama potrošača mogu uhvatiti i analizirati.
Primjeri će vjerojatno uključivati tvrtke koje se povezuju s velikim brojem potrošača koji
kupuju širok raspon proizvoda i usluga, tvrtke koje omogućuju globalne opskrbne lance,
tvrtke koje obrađuju milijune transakcija i one koje pružaju platforme za potrošačka digitalna
iskustva. To će biti poduzeća s prednostima velikih podataka. Više tvrtki naći će se u nekoj vrsti
velike podatkovne prednosti nego što bi se moglo na prvi pogled pomisliti. Mnoge tvrtke imaju
pristup vrijednim skupovima podataka koje generiraju njihovi proizvodi i usluge. Mreže će čak
povezivati fizičke proizvode, omogućujući tim proizvodima da prijave svoje vlastite serijske
brojeve, datume isporuke, broj korištenja i tako dalje.
Neke od ovih prilika stvorit će nove izvore vrijednosti; drugi će uzrokovati velike promjene
vrijednosti unutar industrija. Na primjer, pružatelji medicinskih kliničkih informacija, koji
prikupljaju podatke i provode analize potrebne za poboljšanje učinkovitosti zdravstvene
skrbi, mogli bi se natjecati na tržištu vrijednom više od 10 milijardi USD do 2020. Rani
pokretači koji osiguravaju pristup podacima potrebnim za stvaranje vrijednosti vjerojatno će
izvući najveću korist (vidi okvir 2, "Kako mjerimo vrijednost velikih podataka?"). Sa stajališta
konkurentnosti i potencijalnog stvaranja vrijednosti, sve tvrtke trebaju ozbiljno shvatiti velike
podatke. U većini industrija, etablirani konkurenti i novi sudionici podjednako će iskoristiti
strategije temeljene na podacima za inovacije, natjecanje i osvajanje vrijednosti. Doista,
pronašli smo prve primjere takve upotrebe podataka u svakom sektoru koji smo ispitali.
8 Erik Brynjolfsson, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako
donošenje odluka vođeno podacima utječe na izvedbu poduzeća?, 22. travnja 2011., dostupno na SSRN
(ssrn. com/abstract=1819486).
Okvir 2. Kako mjerimo vrijednost velikih podataka?
Kad smo krenuli u procjenu potencijala velikih podataka za stvaranje vrijednosti, uzeli
smo u obzir samo one radnje koje u biti ovise o upotrebi velikih podataka – tj. radnje u
kojima je upotreba velikih podataka nužna (ali obično nije dovoljna) za izvršenje
posebna poluga. Nismo uključili vrijednost poluga koje se sastoje samo od
automatizacije, ali ne uključuju velike podatke (npr. povećanje produktivnosti zamjenom
bankomata bankomatima). Također imajte na umu da uključujemo bruto vrijednost
poluga koje zahtijevaju korištenje velikih podataka. Nismo pokušali procijeniti relativni
doprinos velikih podataka vrijednosti koju generira određena poluga, već smo procijenili
ukupnu stvorenu vrijednost.
4. KORIŠTENJE VELIKIH PODATAKA POTPRT ĆE NOVE VALOVE RASTA

PRODUKTIVNOSTI I POTROŠAČKOG VIŠKA
U pet domena koje smo proučavali identificirali smo mnoge poluge velikih podataka koje će,
po našem mišljenju, poduprijeti značajan rast produktivnosti (Prikaz 1). Ove prilike imaju
potencijal poboljšati učinkovitost i djelotvornost, omogućujući organizacijama da učine više
s manje i proizvedu kvalitetnije rezultate, tj. povećaju sadržaj dodane vrijednosti proizvoda i
usluga.9 Na primjer, otkrili smo da tvrtke mogu iskoristiti podatke dizajnirati proizvode koji
bolje odgovaraju potrebama kupaca. Podaci se čak mogu iskoristiti za poboljšanje proizvoda
dok se koriste. Primjer je mobilni telefon koji je naučio navike i preferencije svog vlasnika, koji
sadrži aplikacije i podatke prilagođene potrebama tog određenog korisnika, te će stoga biti
vrjedniji od novog uređaja koji nije prilagođen potrebama korisnika.10 Snimanje ovog
potencijal zahtijeva inovacije u operacijama i procesima. Primjeri uključuju povećanje
donošenja odluka—od kliničke prakse do poreznih revizija—s algoritmima kao i stvaranjem
inovacija u proizvodima i uslugama, kao što je ubrzavanje razvoja novih lijekova korištenjem
napredne analitike i stvaranje nove, proaktivne usluge održavanja automobila nakon prodaje
putem korištenje umreženih senzora. Tvorci politika koji razumiju da je ubrzanje produktivnosti
unutar sektora ključna poluga za povećanje životnog standarda u njihovim gospodarstvima u
cjelini trebaju olakšati način organizacijama da iskoriste prednosti velikih podatkovnih poluga
koje povećavaju produktivnost.
Također nalazimo opći obrazac u kojem korisnici, potrošači i građani hvataju veliku količinu
ekonomskog viška koji omogućavaju veliki podaci – oni su i izravni i neizravni korisnici
inovacija povezanih s velikim podacima.11 Na primjer, korištenje velikih podataka podaci
mogu omogućiti poboljšane zdravstvene ishode, kvalitetniji građanski angažman s vladom,
niže cijene zbog transparentnosti cijena i bolju usklađenost između proizvoda i potreba
potrošača. Očekujemo da će se ovaj trend prema povećanom potrošačkom višku nastaviti
i ubrzati u svim sektorima kako budu koristili velike podatke. Uzmimo područje osobnih
podataka o lokaciji kao ilustraciju. U ovom području, korištenje prometnih informacija u
stvarnom vremenu za informiranje navigacije stvorit će mjerljivi potrošački višak kroz
9 Imajte na umu da poboljšanje učinkovitosti nije obuhvaćeno nekim dijelom produktivnosti

izračune zbog nedostatka preciznosti u nekim metrikama kao što su poboljšani zdravstveni ishodi ili
bolje usklađivanje potreba potrošača s robom u maloprodajnim uslugama. Stoga će u mnogim
slučajevima naše procjene produktivnosti vjerojatno biti konzervativne.
10 Hal Varian opisao je sposobnost proizvoda da iskoriste podatke za poboljšanje s korištenjem kao
“kaizen proizvoda.” Vidi Hal Varian, Računalno posredovane transakcije, Ely predavanje 2010. na
sastanku Američkog ekonomskog udruženja, Atlanta, Georgia.
11 Profesor Erik Brynjolfsson s Massachusetts Institute of Technology primijetio je da je stvaranje velikih

količina potrošačkog viška, koji nije obuhvaćen tradicionalnim ekonomskim mjerama kao što je
BDP, karakteristika primjene IT-a.
ušteda na vremenu provedenom na putu i na potrošnji goriva. Mobilne aplikacije s

omogućenom lokacijom stvarat će višak i kod potrošača. U oba slučaja, višak koji ove
inovacije stvaraju vjerojatno će daleko premašiti prihode koje generiraju pružatelji usluga.
Kako bi potrošači imali koristi, kreatori politika često će morati poticati implementaciju
inovacija velikih podataka.
Prikaz 1
Veliki podaci mogu stvoriti značajnu financijsku vrijednost u svim sektorima
Zdravstvo u SAD-u Europska administracija javnog Globalni osobni podaci

Vrijednost 300 milijardi dolara sektora Vrijednost od 250 o lokaciji Više od 100
godišnje milijardi eura godišnje ~0,5 posto milijardi dolara prihoda za
~0,7 posto godišnji godišnjeg rasta produktivnosti pružatelje usluga Vrijednost
rast produktivnosti do 700 milijardi dolara za krajnje
korisnike
Maloprodaja Proizvodnja Do 50
u SAD- u Moguće povećanje neto posto smanjenje u razvoju proizvoda,
marže od 60+% 0,5–1,0 posto troškovi montaže Do 7 posto
godišnjeg rasta produktivnosti smanjenje obrtnog kapitala
IZVOR: Analiza McKinsey Global Institute
5. IAKO ĆE KORIŠTENJE VELIKIH PODATAKA VAŽNO U SVEM SEKTORIMA, NEKI SU SEKTORI

SPREMNI ZA VEĆE DOBITKE
Ilustrirajući razlike među različitim sektorima, ako usporedimo povijesnu

produktivnost sektora u Sjedinjenim Državama s potencijalom tih sektora da zahvate
vrijednost velikih podataka (koristeći indeks koji kombinira nekoliko kvantitativnih
metrika), primijetit ćemo da obrasci variraju od sektora do sektora (Prikaz 2).12
12 Indeks se sastoji od pet metrika koje su osmišljene kao zamjene za označavanje (1) količine
podaci dostupni za korištenje i analizu; (2) varijabilnost u izvedbi; (3) broj dionika (kupaca i
dobavljača) s kojima organizacija u prosjeku posluje; (4) intenzitet transakcije; i (5) turbulencija
svojstvena sektoru. Vjerujemo da su to karakteristike zbog kojih je više ili manje vjerojatno da
će sektor iskoristiti pet transformativnih prilika za velike podatke. Za više detalja pogledajte
dodatak.
Prikaz 2
Grozd A Grozd D
Neki su sektori pozicionirani za veće dobitke od upotrebe
Grozd B Grozd E
velikih podataka. Povijesni rast produktivnosti u Sjedinjenim
Grozd C
Državama, 2000. – 2008. % 24,0
Veličine mjehurića
označavaju relativne veličine BDP-a
23.5
23.0
22.5
Računalni i elektronički proizvodi
Informacija
9.0
3.5 Administracija, podrška i Trgovina na veliko

3.0 gospodarenje otpadom Proizvodnja
2.5 Prijevoz i skladištenje
2.0 Financije i osiguranje
Profesionalne usluge Nekretnine i iznajmljivanje
1.5
1.0 Komunalije Pružatelji zdravstvenih usluga
0,5 Trgovina na malo

Vlada
0
Smještaj i hrana
Prirodni resursi
-0,5
Umjetnost i zabava
-1,0
-1.5 Upravljanje poduzećima
-2,0
Druge usluge Obrazovne usluge
-2.5
-3,0 Izgradnja
-3.5
Niska visoko
Indeks potencijalnih vrijednosti velikih podataka1
1 Pogledajte dodatak za detaljne definicije i metriku koja se koristi za indeks potencijala vrijednosti.
IZVOR: Američki ured za statistiku rada; Analiza McKinsey Global Institute
Sektori računalnih i elektroničkih proizvoda i informacija (Klaster A), kojima se trguje na

globalnoj razini, ističu se kao sektori koji su već doživjeli vrlo snažan rast produktivnosti
i koji su spremni značajno dobiti od upotrebe velikih podataka.
Dva uslužna sektora (klaster B) – financije i osiguranje te državna uprava – u poziciji su
da imaju velike koristi od velikih podataka sve dok se mogu prevladati prepreke za njihovu
upotrebu. Nekoliko sektora (klaster C) doživjelo je negativan rast produktivnosti, što
vjerojatno ukazuje na to da se ti sektori suočavaju sa jakim sistemskim preprekama povećanju
produktivnosti. Među preostalim sektorima, vidimo da su sektori kojima se trguje na globalnoj
razini (uglavnom klaster D) obično imali veći povijesni rast produktivnosti, dok su lokalne
usluge (uglavnom klaster E) imale niži rast.
Dok će svi sektori morati prevladati prepreke kako bi uhvatili vrijednost od korištenja
velikih podataka, prepreke su strukturno veće za neke nego za druge (Prikaz 3). Na primjer,
javni sektor, uključujući obrazovanje, suočava se s većim preprekama zbog nedostatka
mentalnog sklopa koji se temelji na podacima i dostupnih podataka. Hvatanje vrijednosti u
zdravstvu suočava se s izazovima s obzirom na relativno niska ulaganja u informatičku
tehnologiju do sada. Sektori kao što su maloprodaja, proizvodnja i profesionalne usluge mogu
imati relativno niže razine prepreka koje moraju prevladati upravo iz suprotnih razloga.
10
Prikaz 3
Toplinska karta pokazuje relativnu Gornji kvintil 4. kvintil
lakoću hvatanja potencijala vrijednosti

(najlakši za uhvatiti) 2.
Donji kvintil
kvintil
u svim sektorima (najteži) za uhvatiti)
Nema dostupnih podataka
3. kvintil
Ukupni
indeks
Sektori lakoće Način razmišljanja
kategorija snimanja1 Talenat IT intenzitet vođen podacima Dostupnost podataka
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Nekretnine, iznajmljivanje i leasing
Trgovina na veliko
Informacija
Prijevoz i skladištenje
Trgovina na malo
Administrativne, pomoćne usluge, usluge gospodarenja

otpadom i sanacije
Usluge smještaja i prehrane
Ostale usluge (osim javne uprave)

Usluge
Umjetnost, zabava i rekreacija
Financije i osiguranje
Stručne, znanstvene i tehničke usluge
Upravljanje tvrtkama i poduzećima
Vlada
Obrazovne usluge
Uređeno
ijavno
Zdravstvena zaštita i socijalna pomoć
Komunalije
1 Pogledajte dodatak za detaljne definicije i metriku koja se koristi za svaki od kriterija.
6. ORGANIZACIJAMA ĆE BITI NEDOSTATAK TALENTA POTREBNIH DA ISKORISTE PREDNOSTI VELIKIH
PODATAKA
Značajno ograničenje u ostvarivanju vrijednosti velikih podataka bit će manjak talenata,

posebno ljudi s dubokom stručnošću u statistici i strojnom učenju, te menadžera i
analitičara koji znaju kako upravljati tvrtkama korištenjem uvida iz velikih podataka.
U Sjedinjenim Državama očekujemo da će veliki podaci brzo postati ključna odrednica

konkurencije u svim sektorima. No predviđamo da bi potražnja za dubokim analitičkim
pozicijama u svijetu velikih podataka mogla premašiti ponudu koja se proizvodi prema
trenutnim trendovima za 140 000 do 190 000 pozicija (Prikaz 4). Nadalje, ovu vrstu talenta je
teško proizvesti, zahtijevajući godine obuke u slučaju nekoga s intrinzičnim matematičkim
sposobnostima. Iako naša kvantitativna analiza koristi Sjedinjene Države kao ilustraciju,
vjerujemo da će ograničenje ove vrste talenta biti globalno, uz upozorenje da bi neke regije
mogle proizvesti ponudu koja može popuniti praznine u talentima u drugim regijama.
Osim toga, predviđamo potrebu za 1,5 milijuna dodatnih menadžera i analitičara u

Sjedinjenim Državama koji mogu postavljati prava pitanja i učinkovito koristiti rezultate
analize velikih podataka. Sjedinjene Države — i druga gospodarstva koja se suočavaju
sa sličnim nedostatkom — ne mogu popuniti ovu prazninu jednostavnom promjenom
uvjeta diplomiranja i čekanjem da ljudi diplomiraju s više vještina ili uvozom talenata
(iako bi to mogle biti važne radnje koje treba poduzeti). Bit će potrebno prekvalificirati
značajnu količinu talenta na mjestu; srećom, ova razina obuke ne zahtijeva godine predanog
učenja.
Prikaz 4
Potražnja za dubokim analitičkim talentom u Sjedinjenim Državama

mogla bi biti 50 do 60 posto veća od predviđene ponude do 2018.
Ponuda i potražnja dubokog analitičkog talenta do 2018
Tisuću ljudi
140–190 (prikaz, stručni). 440–490 (prikaz, stručni).
180 30
300
50–60% razlike
u odnosu na
ponudu iz 2018
150
2008 Diplomanti Ostali1 2018 ponuda Talent gap 2018 projicirana potražnja
zaposlenje s dubokim
analitičkim
talentom
1 Ostali pokretači ponude uključuju odljev (-), useljavanje (+) i ponovno zapošljavanje prethodno nezaposlenih duboko analitičkih talenata (+).
IZVOR: Američki ured za statistiku rada; Popis stanovništva SAD-a; Dun & Bradstreet; razgovori s tvrtkama; Analiza McKinsey Global Institute
7. NEKOLIKO PROBLEMA MORAT ĆE SE RIJEŠITI KAKO BI SE ISKORISTIO PUN POTENCIJAL

VELIKIH PODATAKA
Politike podataka. Kako se sve veća količina podataka digitalizira i putuje preko
organizacijskih granica, postoji niz pitanja politike koja će postati sve važnija, uključujući, ali ne
ograničavajući se na privatnost, sigurnost, intelektualno vlasništvo i odgovornost. Jasno je da je
privatnost pitanje čija važnost, osobito za potrošače, raste kako vrijednost velikih podataka postaje
očiglednija. Osobni podaci kao što su zdravstveni i financijski podaci često su oni koji mogu ponuditi
najznačajnije ljudske koristi, poput pomoći u određivanju pravog medicinskog tretmana ili
najprikladnijeg financijskog proizvoda. Međutim, potrošači te kategorije podataka također
smatraju najosjetljivijima. Jasno je da će se pojedinci i društva u kojima žive morati uhvatiti u
koštac s kompromisima između privatnosti i korisnosti.
Drugo usko povezano pitanje je sigurnost podataka, npr. kako zaštititi konkurentske osjetljive
podatke ili druge podatke koji bi trebali biti privatni. Nedavni primjeri pokazali su da povrede
podataka mogu razotkriti ne samo osobne podatke potrošača i povjerljive korporativne
informacije, već čak i tajne nacionalne sigurnosti.
S porastom ozbiljnih povreda, rješavanje sigurnosti podataka pomoću tehnoloških i političkih
alata postat će ključno.13
Sve veća ekonomska važnost velikih podataka također pokreće brojna pravna pitanja,
posebno u kombinaciji s činjenicom da su podaci bitno drugačiji od mnogih drugih sredstava. Podaci
se mogu savršeno kopirati i jednostavno kombinirati s drugim podacima. Isti podatak može
istovremeno koristiti više od jedne osobe. Sve su to jedinstvene karakteristike podataka u usporedbi
s fizičkom imovinom. Morat će se odgovoriti na pitanja o pravima intelektualnog vlasništva vezanim
uz podatke: Tko "posjeduje" dio podataka i koja su prava povezana sa skupom podataka? Što definira
"poštenu upotrebu" podataka? Tu su i pitanja koja se odnose na odgovornost: Tko je odgovoran
kada an
13 Privatnost i sigurnost podataka se naveliko proučavaju i raspravljaju drugdje, pa mi

nisu te teme učinile fokusom ovdje objavljenog istraživanja.
12
netočan podatak dovodi do negativnih posljedica? Takve će vrste pravnih pitanja trebati razjasniti,
vjerojatno s vremenom, kako bi se iskoristio puni potencijal velikih podataka.
Tehnologija i tehnika. Kako bi uhvatile vrijednost velikih podataka, organizacije će morati primijeniti
nove tehnologije (npr. softver za pohranu, računalstvo i analitički softver) i tehnike (tj. nove vrste analiza).
Raspon tehnoloških izazova i prioriteti postavljeni za njihovo rješavanje razlikovat će se ovisno o
zrelosti podataka institucije. Naslijeđeni sustavi i nekompatibilni standardi i formati prečesto sprječavaju
integraciju podataka i sofisticiraniju analitiku koja stvara vrijednost iz velikih podataka. Novi problemi i
rastuća računalna snaga potaknut će razvoj novih analitičkih tehnika. Također postoji potreba za
stalnim inovacijama u tehnologijama i tehnikama koje će pomoći pojedincima i organizacijama da
integriraju, analiziraju, vizualiziraju i konzumiraju rastuću bujicu velikih podataka.
Organizacijske promjene i talent. Organizacijskim čelnicima često nedostaje razumijevanje

vrijednosti velikih podataka, kao i kako tu vrijednost iskoristiti. U konkurentskim sektorima to
bi se moglo pokazati kao Ahilova peta za neke tvrtke budući da će njihovi etablirani konkurenti kao i novi
sudionici vjerojatno iskoristiti velike podatke da bi se natjecali protiv njih. I, kao što smo spomenuli,
mnoge organizacije nemaju dovoljno talenta za dobivanje uvida iz velikih podataka. Osim toga, mnoge
današnje organizacije ne strukturiraju tijekove rada i poticaje na načine koji optimiziraju korištenje
velikih podataka za donošenje boljih odluka i poduzimanje informiranijih radnji.
Pristup podacima. Kako bi omogućile transformativne prilike, tvrtke će sve više morati integrirati
informacije iz više izvora podataka. U nekim će slučajevima organizacije moći kupiti pristup podacima. U
drugim slučajevima, međutim, dobivanje pristupa podacima trećih strana često nije jednostavno. Izvori
podataka trećih strana možda nisu razmišljali o njihovom dijeljenju. Ponekad ekonomski poticaji nisu
usklađeni kako bi potaknuli dionike na razmjenu podataka. Dionik koji posjeduje određeni skup podataka
mogao bi ga smatrati izvorom ključne konkurentske prednosti i stoga bi ga oklijevao podijeliti s drugim
dionicima. Ostali dionici moraju
pronađite načine da ponudite uvjerljive vrijednosne prijedloge vlasnicima vrijednih podataka.
Struktura industrije. Sektori s relativnim nedostatkom konkurentskog intenziteta i

transparentnosti izvedbe, zajedno s industrijama u kojima su profitni fondovi visoko koncentrirani,
vjerojatno će sporo u potpunosti iskoristiti prednosti velikih podataka. Na primjer, u javnom
sektoru postoji tendencija nedostatka konkurentskog pritiska koji ograničava učinkovitost i
produktivnost; kao rezultat toga, sektor se suočava s težim preprekama od drugih sektora na putu
hvatanja potencijalne vrijednosti korištenja velikih podataka. Zdravstvo u SAD-u još je jedan primjer
kako struktura industrije utječe na to koliko će lako biti izvući vrijednost iz velikih podataka. Ovo je sektor
koji ne samo da ima nedostatak transparentnosti učinka u pogledu troškova i kvalitete, već i industrijsku
strukturu u kojoj će platitelji dobiti (od manje isplata za nepotrebno liječenje) od upotrebe kliničkih
podataka. Međutim, dobit koja pripada obveznicima bit će na teret pružatelja usluga (manje medicinskih
aktivnosti za naplatu) od kojih bi obveznici morali dobiti kliničke podatke. Kao što ovi primjeri sugeriraju,
čelnici organizacija i kreatori politika morat će razmotriti kako bi se industrijske strukture mogle razvijati u
svijetu velikih podataka ako žele odrediti kako optimizirati stvaranje vrijednosti na razini pojedinačnih
tvrtki, sektora i gospodarstava u cjelini.
Učinkovito korištenje velikih podataka ima potencijal transformirati gospodarstva,

donoseći novi val rasta produktivnosti i potrošačkog viška. Korištenje velikih podataka
postat će ključna osnova natjecanja za postojeće tvrtke i stvorit će nove konkurente koji
mogu privući zaposlenike koji imaju kritične vještine za svijet velikih podataka. Voditelji
organizacija trebaju prepoznati potencijalnu priliku kao i strateške prijetnje koje veliki
podaci predstavljaju te bi trebali procijeniti i zatim zatvoriti svaki jaz između svojih trenutnih
IT sposobnosti i njihove podatkovne strategije te onoga što je potrebno za hvatanje velikih
podatkovnih prilika relevantnih za njihovo poduzeće. Morat će biti kreativni i proaktivni u
određivanju koje skupove podataka mogu kombinirati da bi stvorili vrijednost i kako dobiti
pristup tim skupovima, kao i rješavanju pitanja sigurnosti i privatnosti.
Što se tiče privatnosti i sigurnosti, dio zadatka mogao bi uključivati pomaganje potrošačima da
razumiju koje prednosti nudi uporaba velikih podataka, zajedno s rizicima. Usporedno s tim, tvrtke
moraju zaposliti i zadržati duboke analitičke talente i prekvalificirati svoje analitičare i menadžere
kako bi postale pametnije u podacima, uspostavljajući kulturu koja cijeni i nagrađuje korištenje
velikih podataka u donošenju odluka.
Kreatori politika moraju prepoznati potencijal korištenja velikih podataka za

oslobađanje sljedećeg vala rasta u svojim gospodarstvima. Moraju osigurati
institucionalni okvir koji će tvrtkama omogućiti jednostavno stvaranje vrijednosti iz
podataka, istovremeno štiteći privatnost građana i osiguravajući sigurnost podataka.
Oni također imaju značajnu ulogu u pomaganju u ublažavanju nedostatka talenata
putem obrazovne i imigracijske politike te uvođenjem tehnoloških pokretača uključujući
infrastrukturu kao što su komunikacijske mreže; ubrzanje istraživanja u odabranim
područjima uključujući naprednu analitiku; i stvaranje okvira intelektualnog vlasništva koji
potiče inovacije. Također mogu biti potrebna kreativna rješenja za usklađivanje poticaja,
uključujući, na primjer, zahtjeve za dijeljenjem određenih podataka radi promicanja javne dobrobiti.
1. Mapiranje globalnih podataka: rast i

stvaranje vrijednosti
Mnogi od najmoćnijih izuma kroz ljudsku povijest, od jezika do modernog računala, bili su oni
koji su omogućili ljudima da bolje generiraju, hvataju i koriste podatke i informacije.14 Svjedoci
smo eksplozivnog rasta količine podataka u našem svijetu. Veliki podaci dosegli su kritičnu masu
u svakom sektoru i funkciji tipičnog gospodarstva, a brzi razvoj i širenje digitalnih informacijskih
tehnologija intenzivirali su njihov rast.
Procjenjujemo da su novi podaci koje su poduzeća pohranila premašili 7 egzabajta

podataka na globalnoj razini u 2010. i da su novi podaci koje su te godine pohranili potrošači
diljem svijeta premašili dodatnih 6 egzabajta.15 Da stavimo ove vrlo velike brojeve u kontekst,
podaci koje tvrtke i pojedinci koje proizvode i pohranjuju jednako je popunjavanju više od 60 000
američkih Kongresnih knjižnica. Kad bi se sve riječi koje ljudi izgovore digitalizirale kao tekst,
ukupno bi imale oko 5 egzabajta — manje od novih podataka koje potrošači pohrane u jednoj
godini.16 Sve veći volumen i detalji informacija koje bilježe poduzeća, zajedno s porastom
multimedijskih, društvenih mediji, a internet stvari potaknut će eksponencijalni rast podataka u
doglednoj budućnosti.
Nema sumnje da su sama veličina i svemir velikih podataka koji se brzo širi fenomen sami po
sebi i da su do sada bili primarni fokus istraživanja.
Ali ključno je pitanje kakav bi širi utjecaj mogla imati ova bujica podataka. Mnogi su potrošači
sumnjičavi u pogledu količine podataka koji se prikupljaju o svakom aspektu njihovih života,
od načina na koji kupuju do toga koliko su zdravi. Jesu li veliki podaci jednostavno znak koliko je
društvo postalo nametljivo ili veliki podaci zapravo mogu igrati korisnu ulogu u gospodarskom
smislu od koje mogu imati koristi svi društveni dionici?
Odlučan odgovor je da podaci doista mogu stvoriti značajnu vrijednost za svjetsko gospodarstvo,
potencijalno povećavajući produktivnost i konkurentnost tvrtki i stvarajući značajan ekonomski
višak za potrošače i njihove vlade.
Nadovezujući se na MGI-jevu duboku pozadinu u analizi produktivnosti i konkurentnosti diljem
svijeta, ovo istraživanje istražuje novu vezu između podataka i produktivnosti. Iako je odnos
između produktivnosti i ulaganja u IT dobro uspostavljen, istraživanje veze između
produktivnosti i podataka otvara novi put. Na temelju naših otkrića, vjerujemo da je globalno
gospodarstvo na pragu novog vala rasta produktivnosti koji omogućuju veliki podaci.
U ovom poglavlju razmatramo prošla i trenutna istraživanja o dimenzioniranju velikih podataka i

njihovom kapacitetu za pohranu. Zatim istražujemo vjerojatni odnos između velikih podataka i
produktivnosti, oslanjajući se na prethodne analize utjecaja IT ulaganja i inovacija na poticanje
14 Za zanimljivu perspektivu ove teme, vidi James Gleick, The information: A history. A
teorija. Poplava (New York, NY: Pantheon Books, 2011.).
15 Naša definicija novih pohranjenih podataka opisuje količinu digitalne pohrane koju novozauzmu podaci u jednoj
godini. Imajte na umu da se ovo razlikuje od definicije novih pohranjenih podataka Hala Variana i Petera Lymana
jer naša metodologija ne uzima u obzir podatke koji su stvoreni i pohranjeni, ali zatim prepisani tijekom godine
dana. Za više detalja pogledajte dodatak
16 Peter Lyman i Hal R. Varian, Koliko informacija? 2003., Škola informacijskog menadžmenta i sustava,
Kalifornijsko sveučilište u Berkeleyu, 2003.
16
produktivnost za koju vjerujemo da je izravno primjenjiva na trenutnu i vjerojatnu buduću

evoluciju velikih podataka.
OBIM PODATAKA RASTE EKSPONENCIJALNOM BRZOM
MGI je posljednja od nekoliko istraživačkih grupa koje proučavaju količinu podataka koje
poduzeća i pojedinci generiraju, pohranjuju i troše u cijelom globalnom gospodarstvu.
Sve analize, svaka s različitim metodologijama i definicijama, slažu se u jednoj temeljnoj točki -
količina podataka u svijetu brzo se širi i nastavit će eksponencijalno rasti u doglednoj budućnosti
(vidi Okvir 3, "Mjerenje podataka") unatoč tome što postoji upitnik o tome koliko podataka mi, kao
ljudska bića, možemo apsorbirati (vidi Okvir 4, “Ljudska bića mogu imati ograničenja u svojoj
sposobnosti konzumiranja i razumijevanja velikih podataka” na stranici 18).
Okvir 3. Mjerni podaci
Mjerenje količine podataka izaziva brojna metodološka pitanja.

Prvo, kako možemo razlikovati podatke od informacija i od uvida? Uobičajene definicije
opisuju podatke kao sirove pokazatelje, informacije kao smislenu interpretaciju tih signala, a
uvid kao djelotvoran dio znanja.
Za potrebe dimenzioniranja velikih podataka u ovom istraživanju, prvenstveno smo se
usredotočili na podatke veličine u bajtovima. Ali onda se postavlja drugo pitanje. Kada koristimo
bajtove, koje vrste kodiranja trebamo koristiti? Drugim riječima, koja je količina pretpostavljene
kompresije u kodiranju? Odlučili smo pretpostaviti najčešće metode kodiranja koje se koriste
za svaku vrstu podataka.
Hal Varian i Peter Lyman s kalifornijskog sveučilišta Berkeley bili su pioniri u istraživanju
količine proizvedenih, pohranjenih i prenesenih podataka. Kao dio njihovog "Koliko informacija?"
projekta koji je trajao od 2000. do 2003., autori su procijenili da je 2002. globalno pohranjeno 5
egzabajta novih podataka (92 posto na magnetskim medijima) i da je više od tri puta više od te
količine — 18 egzabajta — novih ili izvornih podataka preneseno, ali nisu nužno pohranjeni putem
elektroničkih kanala kao što su telefon, radio, televizija i internet. Što je najvažnije, procijenili su
da se količina novih pohranjenih podataka udvostručila od 1999. do 2002., što predstavlja ukupnu
godišnju stopu rasta od 25 posto.
Potom je, počevši od 2007., tvrtka za upravljanje informacijama EMC sponzorirala istraživačku
tvrtku IDC za izradu godišnje serije izvješća o "Digitalnom svemiru" kako bi se procijenila
količina digitalnih informacija stvorenih i repliciranih svake godine.17 Ova je analiza pokazala da
je 2007. , količina digitalnih podataka stvorena u jednoj godini po prvi je put premašila svjetski
kapacitet pohrane podataka. Ukratko, nije bilo načina da se zapravo pohrane svi digitalni podaci koji
su stvoreni. Također su otkrili da je stopa kojom se povećava proizvodnja podataka mnogo brža
nego što se širi svjetski kapacitet za pohranu podataka, što snažno ukazuje na nastavak
produbljivanja jaza između to dvoje.
Njihova je analiza procijenila da je ukupna količina podataka stvorenih i repliciranih 2009. iznosila
800 egzabajta — dovoljno da popune hrpu DVD-ova koji dosežu do Mjeseca i natrag. Predviđali su
da će taj volumen narasti 44 puta do 2020., što je implicirana godišnja stopa rasta od 40 posto.18
17 IDC je objavio niz bijelih knjiga, koje sponzorira EMC, uključujući "The expanding
digitalni svemir", ožujak 2007.; "Raznoliki digitalni svemir koji eksplodira", ožujak 2008.; "Kako se
ekonomija smanjuje, digitalni svemir se širi", svibanj 2009.; i "Desetljeće digitalnog svemira — jeste
li spremni?", svibanj 2010. Svi su dostupni na www.emc.com/leadership/programs/ digital-universe.htm.
18 IDC-ove procjene količine podataka uključuju kopije podataka, a ne samo izvorno generirane
podaci.
Nedavno su Martin Hilbert i Priscila López objavili rad u časopisu Science koji je analizirao
ukupnu globalnu pohranu i računalni kapacitet od 1986. do 2007.19 Njihova analiza je pokazala
da dok je globalni kapacitet pohrane rastao godišnjom stopom od 23 posto u tom razdoblju
(na više od 290 egzabajta u 2007. za sve analogne i digitalne medije), računalni kapacitet opće
namjene, mjera sposobnosti generiranja i obrade podataka, rastao je po puno višoj godišnjoj
stopi od 58 posto. Njihova je studija također dokumentirala porast digitalizacije. Procijenili su
da se postotak podataka pohranjenih u digitalnom obliku povećao sa samo 25 posto u 2000.
godini (analogni oblici poput knjiga, fotografija i audio/video vrpci činili su najveći dio kapaciteta
za pohranu podataka u to vrijeme) na dominantnih 94 posto udjela 2007. kako su mediji poput
tvrdih diskova, CD-a i digitalnih vrpci postajali sve važniji (prilozi 5 i 6).
Prikaz 5
Pohranjivanje podataka značajno je naraslo, značajno se pomaknuvši s analognog na
digitalno nakon 2000. godine
Globalno instalirano, optimalno komprimirano skladištenje
Sve u svemu Detalj
Eksabajti %; egzabajti
300 100% = 3 16 54 295

1 3
Digitalni
250 25
200
150 94
Analog 99 97
100
75
50
6
0
1986 1993. godine 2000. godine 2007. godine 1986. godine 1993. godine 2000. godine 2007. godine
NAPOMENA: Brojevi se možda neće zbrojiti zbog zaokruživanja.
IZVOR: Hilbert i López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje informacija,” Znanost,
2011
Prikaz 6
Računalni kapacitet također je naglo porastao
Globalno instalirano računanje za rukovanje informacijama
Sve u svemu Detalj Džepni kalkulatori Mobilni telefoni/PDA

1012 milijuna instrukcija u sekundi %; 1012 milijuna
Superračunala Konzole za video igre
instrukcija u sekundi
6.5 Poslužitelji i Osobna računala
velika računala
6.0
5.5 <0,001 0,004 0,289 6.379 3

100%
5.0 6 6
3 6
4.5
5
23
41 25
4.0
6
3.5
3.0
17
2.5
86
2.0 9
64 66
1.5
1.0
33
0,5
0
1986 1993. godine 2000. godine 2007. godine 1986. godine 1993. godine 2000. godine 2007. godine
IZVOR: Hilbert i López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje informacija,” Znanost,
2011
19 Martin Hilbert i Priscila López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju,

i izračunati informacije,” Science, 10. veljače 2011.
18
Okvir 4. Ljudska bića mogu imati ograničenja u svojoj sposobnosti konzumiranja

i razumijevanja velikih podataka
Generiranje velikih podataka možda eksponencijalno raste i napredna tehnologija

može omogućiti globalnom gospodarstvu da pohranjuje i obrađuje sve veće količine
podataka, ali možda postoje ograničenja našoj urođenoj ljudskoj sposobnosti – našim
osjetilnim i kognitivnim sposobnostima – da obrade tu bujicu podataka. Rečeno je da um
može obraditi oko sedam informacija u svojoj kratkoročnoj memoriji.1 Roger Bohn i
James Short sa Kalifornijskog sveučilišta u San Diegu otkrili su da stopa rasta podataka
koje konzumiraju potrošači, kroz različite vrste medija, iznosio je relativno skromnih 2,8
posto u bajtovima po satu između 1980. i 2008. Trebamo primijetiti da je jedan od razloga
za ovaj spori rast bio relativno fiksan broj bajtova isporučenih putem televizije prije širokog
usvajanja digitalnog videa visoke razlučivosti. 2 Temu preopterećenosti informacijama
naširoko su proučavali akademici, od neuroznanstvenika do ekonomista. Ekonomist
Herbert Simon jednom je rekao: "Bogatstvo informacija stvara siromaštvo pažnje i potrebu
da se ta pozornost učinkovito rasporedi među preobiljem izvora informacija koji bi je mogli
konzumirati."3
Unatoč ovim prividnim ograničenjima, postoje načini da se organizacijama i

pojedincima pomogne da obrade, vizualiziraju i sintetiziraju značenje velikih podataka.
Na primjer, sofisticiranije tehnike i algoritmi vizualizacije, uključujući automatizirane algoritme,
mogu omogućiti ljudima da vide uzorke u velikim količinama podataka i pomoći im da otkriju
najrelevantnije uvide (pogledajte 2. poglavlje za primjere vizualizacije). Napredna tehnologija
suradnje također omogućuje velikom broju pojedinaca, od kojih svaki može posjedovati
razumijevanje posebnog područja informacija, da se okupe kako bi stvorili cjelovitu sliku za
rješavanje interdisciplinarnih problema. Kad bi organizacije i pojedinci šire primijenili takve
tehnike, potražnja krajnjih korisnika za velikim podacima mogla bi značajno porasti.
1 George A. Miller, “Čarobni broj sedam, plus ili minus dva: neka ograničenja na našem
sposobnost obrade informacija,” Psychological Review, svezak 63(2), ožujak 1956.:
81–97 (prikaz, stručni).
2 Roger Bohn i James Short, Koliko informacija? 2009: Izvješće o američkim potrošačima, Sveučilište
Kalifornije, San Diego, Globalni informacijski industrijski centar, siječanj 2010.
3 Herbert A. Simon, “Dizajniranje organizacija za svijet bogat informacijama,” u Martin

Greenberger, Computers, Communication, and the Public Interest, Baltimore, MD: The Johns Hopkins
Press, 1971.
INTENZITET BIG DATA RAZLIKUJE SE OD SEKTORA, ALI JE

DOSEGLI KRITIČNU MASU U SVOM SEKTORU
Postoji široko slaganje da proizvodnja podataka eksponencijalno raste. Je li taj rast koncentriran
samo u određenim segmentima globalne ekonomije? Odgovor na to pitanje je ne. Rast velikih
podataka je fenomen koji smo primijetili u svakom sektoru. Što je još važnije, intenzitet podataka
—tj. prosječna količina podataka pohranjenih po tvrtki—po sektorima u globalnom gospodarstvu
dovoljan je za tvrtke da koriste tehnike koje omogućuju veliki skupovi podataka za povećanje
vrijednosti (iako su neki sektori imali znatno veći intenzitet podataka od drugih). Poslovni čelnici u
svim sektorima sada se počinju pitati kako mogu bolje izvući vrijednost
iz svojih podatkovnih resursa, ali smatramo da bi vođe u sektorima s velikim podatkovnim

intenzitetom posebno trebali ispitivanje potencijala postaviti kao visoki prioritet.
MGI procjenjuje da su poduzeća diljem svijeta u 2010. koristila više od 7 egzabajta

inkrementalnog kapaciteta za pohranu podataka na disku; čini se da gotovo 80 posto tog
ukupnog broja duplicira podatke koji su bili pohranjeni negdje drugdje.20 Također smo
analizirali stvaranje i pohranu podataka na razini sektora i pojedinačnih tvrtki. Procjenjujemo
da su do 2009. godine gotovo svi sektori u američkom gospodarstvu imali barem prosječno
200 terabajta pohranjenih podataka po tvrtki (za tvrtke s više od 1000 zaposlenika) i da su
mnogi sektori imali više od 1 petabajta prosječno pohranjenih podataka po društvo. Neke
pojedinačne tvrtke imaju daleko više pohranjenih podataka od prosjeka svog sektora, što im
potencijalno daje veći potencijal za dobivanje vrijednosti velikih podataka.
Neki sektori pokazuju daleko veće razine intenziteta podataka od drugih, što implicira
da imaju veći kratkoročni potencijal za dobivanje vrijednosti velikih podataka. Sektori
financijskih usluga, uključujući vrijednosne papire i investicijske usluge te bankarstvo, imaju
u prosjeku najviše digitalnih podataka pohranjenih po tvrtki. To vjerojatno odražava činjenicu
da su tvrtke uključene u ove sektore obično intenzivne transakcije (Njujorška burza, na primjer,
može se pohvaliti s oko pola trilijuna trgovina mjesečno) i da, u prosjeku, ove vrste sektora
obično imaju prevlast velikih firmi. Komunikacijske i medijske tvrtke, komunalna poduzeća i
vlada također imaju značajne digitalne podatke pohranjene po poduzeću ili organizaciji, što
izgleda odražava činjenicu da takvi entiteti imaju veliki obujam operacija i multimedijskih
podataka. Diskretna i procesna proizvodnja imaju najviše agregatnih podataka pohranjenih u
bajtovima. Međutim, ti su sektori puno niže rangirani u smislu intenziteta, budući da su
fragmentirani u veliki broj poduzeća. Budući da pojedinačne tvrtke često ne dijele podatke,
vrijednost koju mogu dobiti iz velikih podataka mogla bi biti ograničena stupnjem do kojeg
mogu objediniti podatke u lancima opskrbe proizvodnje (za više detalja pogledajte poglavlje
3d o proizvodnji) (Prikaz 7).
Prikaz 7
Tvrtke u svim sektorima imaju najmanje 100 terabajta pohranjenih podataka u

Ujedinjene države; mnogi imaju više od 1 petabajta
Pohranjeni podaci u Pohranjeni podaci po
Sjedinjene Države, 20091 Broj tvrtki s >1000 tvrtki (>1000 zaposlenih), 2009
Petabajti zaposlenih2 Terabajta
Diskretna proizvodnja3 966 1000 9672

Vlada 848 647 1,312
Komunikacije i mediji 715 399 1,792
Procesna proizvodnja3 694 835 8312
Bankarstvo 619 321 1,931

Pružatelji zdravstvenih usluga3 434 1,172 370
Vrijednosni papiri i investicijske usluge 429 111 3,866
Profesionalne usluge 411 1,478 278
Maloprodaja 364 522 697
Obrazovanje 269 843 319
Osiguranje 243 280 870
Prijevoz 227 283 801
Veleprodaja 202 376 536
Komunalije 194 129 1,507
Industrije resursa 116 140 825
Potrošačke i rekreacijske usluge 106 708 150
Izgradnja 51 222 231
1 Podaci o pohrani po sektoru izvedeni iz IDC-a.
2 Podaci o poduzećima podijeljeni u sektore, kada je to potrebno,
korištenjem zaposlenosti 3 Posebno velik broj poduzeća u sektorima proizvodnje i pružatelja zdravstvenih usluga čini dostupnom pohranu po
tvrtka mnogo manja.
IZVOR: IDC; Američki ured za statistiku rada; Analiza McKinsey Global Institute
20 Ovo je procjena dodatnog kapaciteta iskorištenog tijekom godine. U nekim slučajevima, ovo
kapacitet se može sastojati od više skupova podataka koji prepisuju druge podatke, ali korištenje kapaciteta
je inkrementalno u odnosu na kapacitet pohrane korišten prethodne godine.
20
Osim varijacija u količini podataka pohranjenih u različitim sektorima, vrste podataka

koji se generiraju i pohranjuju—tj. kodiraju li podaci video, slike, audio ili tekstualne/
numeričke informacije—također se značajno razlikuju od industrije do industrije.
Na primjer, financijske usluge, administrativni dijelovi vlade te maloprodaja i
veleprodaja generiraju značajne količine tekstualnih i numeričkih podataka uključujući
podatke o korisnicima, informacije o transakcijama te matematičko modeliranje i
simulacije (Prikaz 8). Ostali sektori kao što su proizvodnja, zdravstvo te komunikacije i
mediji odgovorni su za veći postotak multimedijskih podataka. Proizvodnja generira
mnogo tekstualnih i numeričkih podataka u svojim proizvodnim procesima, ali funkcije
istraživanja i razvoja i inženjeringa u mnogim podsektorima proizvodnje često koriste
slikovne podatke koji se koriste u dizajnu.
Podaci o slikama u obliku X-zraka, CT-a i drugih skeniranja dominiraju količinom pohrane
podataka u zdravstvu. Dok jedna stranica zapisa može ukupno imati kilobajt, jedna slika
može zahtijevati 20 do 200 megabajta ili više za pohranu. U komunikacijskoj i medijskoj
industriji slike i zvuk koji su gladni bajtova dominiraju volumenom pohrane. Doista, ako
bismo ispitivali čisto stvaranje podataka (a ne pohranjivanje), neki podsektori kao što su
zdravstvena njega i igre generiraju čak i više multimedijskih podataka u obliku postupaka
u stvarnom vremenu i video nadzora, ali to se rijetko dugo pohranjuje .
Prikaz 8
Vrsta generiranih i pohranjenih podataka razlikuje se ovisno o sektoru1 Prodiranje
visoko
Tekst/
Srednji
Video Slika Audio brojevi
Niska
Bankarstvo
Osiguranje
Vrijednosni papiri i investicijske usluge
Diskretna proizvodnja
Procesna proizvodnja
Maloprodaja
Veleprodaja
Profesionalne usluge
Potrošačke i rekreacijske usluge
Zdravstvena njega
Prijevoz
Komunikacije i mediji2
Komunalije
Izgradnja
Industrije resursa
Vlada
Obrazovanje
1 Sastavili smo ovu toplinsku kartu koristeći jedinice podataka (u datotekama ili minutama videa), a ne bajtove.
2 Video i audio su visoki u nekim podsektorima.
Okrećući se geografskom profilu gdje se pohranjuju veliki podaci, Sjeverna Amerika

i Europa zajedno predvode paket s trenutačno kombiniranih 70 posto globalnog
ukupnog iznosa. Međutim, očekuje se da će i razvijena i tržišta u nastajanju
doživjeti snažan rast pohrane podataka i, prema tome, generiranja podataka po
stopama između 35 i 45 posto godišnje. Napor da se profilira distribucija podataka
diljem svijeta mora uzeti u obzir da se podaci ne pohranjuju uvijek u zemlji u kojoj su
generirani; podatkovni centri u jednoj regiji mogu pohranjivati i analizirati podatke
generirane u drugoj.
GLAVNI UTVRĐENI TRENDOVI NASTAVIT ĆE POKRETATI PODATKE

RAST
U svim sektorima i regijama, nekoliko međusektorskih trendova potaknulo je rast generiranja
podataka i nastavit će pokretati skupove podataka koji se brzo šire. Ti trendovi uključuju
rast tradicionalnih transakcijskih baza podataka, kontinuirano širenje multimedijskog
sadržaja, sve veću popularnost društvenih medija i proliferaciju primjene senzora u
Internetu stvari.
Poduzeća prikupljaju podatke s većom granularnošću i učestalošću, hvatajući svaku

kupčevu transakciju, prilažući više osobnih podataka, a također prikupljajući više
informacija o ponašanju potrošača u mnogim različitim okruženjima. Ova aktivnost
istovremeno povećava potrebu za više skladišnog i analitičkog kapaciteta.
Tesco, na primjer, svakog mjeseca generira više od 1,5 milijardi novih podataka.
Wal-Martovo skladište sada uključuje oko 2,5 petabajta informacija, što je
ekvivalent otprilike polovici svih pisama koje je američka poštanska služba isporučila 2010.
Sve veća uporaba multimedije u sektorima uključujući zdravstvenu skrb i industrije okrenute
potrošačima značajno je pridonijela rastu velikih podataka i nastavit će to činiti. Video zapisi
generiraju ogromnu količinu podataka. Svaka minuta sada najčešće korištenog videa
visoke razlučivosti u ordinacijama generira 25 puta veću količinu podataka (po minuti) čak i
od fotografija najveće rezolucije kao što su CT skeniranja, a svaka od tih fotografija već
zahtijeva tisuće puta više bajtova od jednu stranicu teksta ili brojčanih podataka. Više od
95 posto kliničkih podataka generiranih u zdravstvenoj skrbi sada je video. Multimedijski
podaci već čine više od polovice mrežnog internetskog prometa (tj. prometa koji se odvija
na najvećim vezama između velikih internetskih mreža), a očekuje se da će taj udio porasti
na 70 posto do 2013.21.
Nagli porast upotrebe društvenih medija stvara vlastiti tok novih podataka. Dok društvene
mreže dominiraju komunikacijskim portfeljem mlađih korisnika, stariji ih korisnici usvajaju
još bržim tempom. McKinsey je ispitao korisnike digitalnih usluga i otkrio porast od 7 posto
u 2009. godini u korištenju društvenih mreža kod ljudi u dobi od 25 do 34 godine, još
impresivniji porast od 21 do 22 posto među onima u dobi od 35 do 54 godine te nevjerojatan
porast od 52 posto u upotrebi među osobama u dobi od 55 do 64 godine. Brzo usvajanje
pametnih telefona također povećava korištenje društvenih mreža (Prikaz 9).
Facebookovih 600 milijuna aktivnih korisnika provede više od 9,3 milijarde sati
mjesečno na stranici—da je Facebook država, imao bi treću najveću populaciju na
svijetu. Svaki mjesec prosječni korisnik Facebooka kreira 90 sadržaja, a sama mreža
dijeli više od 30 milijardi sadržaja uključujući fotografije, bilješke, postove na blogu, web
poveznice i vijesti. YouTube kaže da ima oko 490 milijuna jedinstvenih posjetitelja diljem
svijeta koji provode više od 2,9 milijardi sati na stranici svaki mjesec. YouTube tvrdi da
prenosi 24 sata videa svake minute, što ovu stranicu čini iznimno značajnim agregatorom
podataka. McKinsey je također dokumentirao kako se korištenje društvenih medija i Weba
2.0 seli iz sfere potrošača u poduzeća.22
Povećanje primjena Interneta stvari, tj. senzora i uređaja ugrađenih u fizički svijet i povezanih
mrežama s računalnim resursima, još je jedan trend koji pokreće rast velikih podataka.23
Istraživači McKinseyja pokazuju da broj
21 Analiza internetskog prometa IDC-a, 2010.
22 Michael Chui, Andy Miller i Roger Roberts. "Šest načina da Web 2.0 funkcionira", McKinsey Quarterly, veljača
2009.; Jaques Bughin i Michael Chui, "Uspon umreženog poduzeća: Web 2.0 pronalazi svoj dan isplate",
McKinsey Quarterly, prosinac 2010.
23 Michael Chui, Markus Löffler i Roger Roberts, "Internet stvari", McKinsey Quarterly, ožujak 2010.
22
povezani čvorovi u Internetu stvari – koji se ponekad nazivaju i uređaji od stroja do

stroja (M2M) – raspoređeni u svijetu će rasti po stopi većoj od 30 posto godišnje
tijekom sljedećih pet godina (Prikaz 10). Očekuje se da će neki od sektora rasta biti
komunalne usluge budući da ti operateri instaliraju više pametnih brojila i pametnih
uređaja; zdravstvenu skrb, budući da sektor primjenjuje daljinsko praćenje zdravlja;
maloprodaja, koja će s vremenom povećati upotrebu radiofrekvencijskih identifikacijskih
(RFID) oznaka; i automobilskoj industriji koja će sve više ugrađivati senzore u vozila.
Prikaz 9
Prodor društvenih mreža raste online i na pametnim Čest korisnik 2
telefonima; česti korisnici rastu kao udio u ukupnim

korisnicima1
Penetracija društvenih mreža na računalu Prodor pametnih telefona na društvene mreže

usporava, ali česti korisnici i dalje rastu % ispitanika gotovo se udvostručio od 2008. % korisnika pametnih
telefona
+11% godišnje
67 +28% godišnje
63 57
55 12
47 13
14
13
35 14
12
55
49 44
41 33
23
2008. godine 2009. godine 2010 2008. godine 2009. godine 2010
% %
Često 76 78 82 Često 65 70 77
korisnika korisnika
1 Na temelju penetracije korisnika koji pregledavaju stranice društvenih mreža. Radi dosljednosti, isključujemo pitanja specifična za Twitter
(dodana anketi 2009.) i mobilne društvene mreže koje se temelje na lokaciji (npr. Foursquare, dodano anketi 2010.).
2 Česti korisnici definirani kao oni koji koriste društvene mreže barem jednom tjedno.
IZVOR: Anketa McKinsey iConsumer
Prikaz 10
Podaci generirani iz Interneta stvari eksponencijalno će rasti kako se

povećava broj povezanih čvorova
Složena godišnja stopa
Procijenjeni broj povezanih čvorova
rasta 2010–15, %
milijun
72–215 (prikaz, stručni). 35
5–14 Sigurnost 50+

Zdravstvena njega 50+
energija 15
1–3
2–6 5
Industrije
8–23 Maloprodaja
30
4–12 Putovanja i logistika 15
28–83 (prikaz, stručni). Komunalije 45
17–50
1–2
2–5 2–6 5–
2–6
14
15–45 (prikaz, stručni). Automobilizam 20
2010 2015
IZVOR: Intervjui analitičara; Analiza McKinsey Global Institute

TRADICIONALNA UPOTREBA NJEGA DOPRINIJELA JE
RAST PRODUKTIVNOSTI — VELIK PODATAK JE SLJEDEĆA GRANICA
Povijest IT ulaganja i inovacija te njihov utjecaj na konkurentnost i produktivnost snažno

sugeriraju da veliki podaci mogu imati sličnu moć transformacije naših života. Isti preduvjeti
koji su IT-u omogućili povećanje produktivnosti postoje i za velike podatke. Vjerujemo da postoje
uvjerljivi dokazi da će korištenje velikih podataka postati ključna osnova konkurencije, podupirući
nove valove rasta produktivnosti, inovacija i potrošačkog viška - sve dok su ispravne politike i
pokretači na snazi.
Tijekom niza godina, MGI je istraživao vezu između IT-a i produktivnosti.24 Isti uzročni odnosi
vrijede jednako za velike podatke kao i za IT općenito. Poluge velikih podataka nude značajan
potencijal za poboljšanje produktivnosti na razini pojedinačnih tvrtki. Kompanije, uključujući
Tesco, Amazon, Wal-Mart, Harrah's, Progressive Insurance i Capital One te Smart, bežični igrač
na Filipinima, već su koristile velike podatke kao konkurentsko oružje — kao i cijela gospodarstva
(vidi okvir 5). , “Velike tvrtke diljem svijeta postigle su prve uspjehe u korištenju velikih podataka”).
Okvir 5. Velike tvrtke diljem svijeta postigle su prve uspjehe u korištenju velikih podataka
Postoje zapaženi primjeri tvrtki širom svijeta koje su dobro poznate po svojoj
opsežnoj i učinkovitoj upotrebi podataka. Na primjer, Tescov program vjernosti generira
ogromnu količinu podataka o kupcima koje tvrtka iskopava kako bi informirala odluke od
promocija do strateške segmentacije kupaca. Amazon koristi podatke o klijentima za
pokretanje svog mehanizma preporuka "možda će vam se također svidjeti..." koji se temelji
na vrsti tehnike prediktivnog modeliranja koja se zove kolaborativno filtriranje. Čineći signale
ponude i potražnje vidljivima između maloprodajnih trgovina i dobavljača, Wal-Mart je prvi
usvojio zalihe kojima upravlja dobavljač kako bi optimizirao lanac opskrbe. Harrah's, američka
grupa za hotele i kasina, sastavlja detaljne holističke profile svojih kupaca i koristi ih za
prilagođavanje marketinga na način koji povećava lojalnost kupaca. I Progressive Insurance
i Capital One poznati su po provođenju eksperimenata kako bi sustavno i učinkovito
segmentirali svoje klijente te kako bi u skladu s tim prilagodili ponude proizvoda. Smart,
vodeći bežični igrač na Filipinima, analizira svoju penetraciju, pokrivenost maloprodaje i
prosječni prihod po korisniku na razini grada ili mjesta kako bi se usredotočio na mikro
tržišta s najvećim potencijalom.
Utjecaj IT-a na produktivnost možemo najprije razdvojiti na rast produktivnosti u sektorima koji
proizvode IT kao što su poluvodiči, telekomunikacije i proizvodnja računala te sektorima koji
koriste IT. Općenito, velik dio rasta produktivnosti u sektorima koji proizvode IT rezultat je
poboljšanja kvalitete IT proizvoda kako se tehnologija razvija. U ovoj analizi usredotočeni smo
uglavnom na sektore koji koriste IT (i koji će sve više koristiti velike podatke), koji čine mnogo veći
dio globalnog gospodarstva od sektora koji opskrbljuju IT.
Istraživanja pokazuju da postoje dva bitna preduvjeta da IT utječe na produktivnost rada.

Prvi je produbljivanje kapitala—drugim riječima, ulaganja u IT koja donose
24 Vidi rast produktivnosti u SAD-u, 1995. – 2000., McKinsey Global Institute, listopad 2001., i Kako IT
omogućuje rast produktivnosti, McKinsey Global Institute, listopad 2002., oba dostupna na www.
mckinsey.com/mgi.
24
radnici bolje i brže alate za obavljanje svog posla. Drugi je ulaganje u ljudski kapital i organizacijske
promjene—tj. menadžerske inovacije koje nadopunjuju ulaganja u informatičku tehnologiju kako bi se

povećala produktivnost rada. U nekim slučajevima, kašnjenje između IT ulaganja i organizacijskih
prilagodbi značilo je da je trebalo neko vrijeme da se poboljšanja produktivnosti pojave. Isti preduvjeti koji
objašnjavaju utjecaj IT-a na omogućavanje povijesnog rasta produktivnosti trenutno postoje za velike
podatke.25
Došlo je do četiri vala usvajanja IT-a s različitim stupnjevima utjecaja na rast produktivnosti u
Sjedinjenim Državama (Prikaz 11). Prva od ovih era - era "mainframea" - trajala je od 1959. do 1973.
Tijekom tog razdoblja, ukupni godišnji rast produktivnosti u SAD-u bio je vrlo visok i iznosio je 2,82 posto.
Doprinos IT-a produktivnosti bio je prilično skroman; u toj je fazi udio IT-a u ukupnim kapitalnim izdacima
bio relativno nizak. Druga era od 1973. do 1995., koju ćemo nazvati erom “minikompjutera i osobnih
računala,” doživjela je mnogo niži rast ukupne produktivnosti, ali veći udio tog rasta možemo pripisati
utjecaju IT-a. Došlo je do značajnog produbljivanja IT kapitala. Kompanije su počele povećavati svoju
potrošnju na više distribuiranih tipova računala, a ta su računala postajala sve moćnija kako se njihova
kvaliteta povećavala.
Treća era trajala je od 1995. do 2000. - era "Interneta i Weba 1.0". U ovom
U tom razdoblju rast produktivnosti u SAD-u vratio se na visoke stope, potpomognut značajnim
produbljivanjem IT kapitala, intenziviranjem poboljšanja kvalitete, kao i širenjem značajnih menadžerskih
inovacija koje su iskoristile prethodna IT kapitalna ulaganja. Kao što smo sugerirali, postoji zaostatak
između ulaganja u informatičku tehnologiju i menadžerskih inovacija potrebnih za ubrzanje rasta
produktivnosti. Doista, iako smo ovu eru nazvali zbog ulaganja u Internet i Web 1.0 napravljena u to vrijeme,
najveći dio pozitivnog utjecaja na produktivnost u sektorima koji koriste IT došao je od menadžerskih i
organizacijskih promjena kao odgovor na ulaganja u prethodnim erama u mainframe, miniračunala , i

računala—a ne od ulaganja u Internet.
MGI istraživanje pokazalo je da je u ovom trećem razdoblju povećanje produktivnosti bilo neravnomjerno
raspoređeno na makroekonomskoj razini, razini sektora i poduzeća. U nekim slučajevima, vodeća tvrtka koja
je uložila dovoljno u IT uspjela je primijeniti menadžerske inovacije kako bi potaknula produktivnost i
nadmašila svoje kolege u industriji. Wal-Martova implementacija IT intenzivnih poslovnih procesa omogućila
je tvrtki da nadmaši konkurente u maloprodajnoj industriji. Na kraju su ti konkurenti kao odgovor uložili u
IT, ubrzali vlastiti rast produktivnosti i potaknuli produktivnost cijelog sektora.
Zapravo, MGI je otkrio da je šest sektora zaslužno za gotovo sve poraste produktivnosti u američkom
gospodarstvu, dok su ostali pridonijeli vrlo malom rastu produktivnosti ili čak, u nekim slučajevima,
negativnom rastu produktivnosti. Šest sektora koji su ostvarili skok u produktivnosti dijele tri opće
karakteristike u svom pristupu IT-u. Prvo, prilagodili su svoje IT ulaganje poslovnim procesima specifičnim
za sektor i povezali ga s ključnim polugama učinka. Drugo, implementirali su IT sekvencijalno, izgrađujući
sposobnosti tijekom vremena. Treće, ulaganja u IT razvijala su se istodobno s menadžerskim i tehničkim

inovacijama.
25 Oslanjamo se na prethodna MGI istraživanja i analizu Dalea Jorgensona, Mun Hoa i Kevina
Stiroha o tome kako je IT utjecao na rast produktivnosti u SAD-u između 1959. i 2006. Vidite
Rast produktivnosti u SAD-u, 1995. – 2000., listopad 2001., i Kako IT omogućuje rast
produktivnosti, listopad 2002., oba dostupna na www.mckinsey.com/mgi; Dale Jorgenson, Mun
Ho i Kevin Stiroh, “Retrospektivni pogled na ponovno oživljavanje rasta produktivnosti u SAD-
u,” Journal of Economic Perspectives, 2008.; i Erik Brynjolfsson i Adam Saunders, Wired for
innovation: Kako informacijska tehnologija preoblikuje gospodarstvo (Cambridge, MA: MIT
Press, 2009.).
Prikaz 11
IT je dao značajan doprinos rastu produktivnosti Drugi doprinos
rada IT doprinos 1
Godišnji rast produktivnosti rada %
2.82
2.70
2.50
1.11
1.49 1.54
2.52
0,84
1.59
0,96
0,65
0,30
1959–73 1973–95 1995–2000 2000–06
Razdoblja Glavna računala

usvajanja IT-a2
Mini-računala i PC-ji
Internet i Web 1.0
Mobilni uređaji i
Web 2.0
1 Uključuje produktivnost sektora koji proizvode IT.

2 Imajte na umu da općenito postoji vremenski odmak između usvajanja vrste IT-a i ostvarivanja rezultirajućeg učinka na produktivnost.
IZVOR: Jorgenson, Mun Ho i Stiroh, “Retrospektivni pogled na ponovno oživljavanje rasta produktivnosti u SAD-u,” Journal of
Gospodarske perspektive, 2008.; Brynjolfsson i Saunders, Ožičeni za inovacije: Kako je informacijska tehnologija
Promjena gospodarstva, MIT Press, 2009
Četvrta i posljednja era, koja traje od 2000. do 2006., razdoblje je "mobilnih uređaja i Weba
2.0". U tom je razdoblju doprinos produbljivanja IT kapitala i sektora koji proizvode IT opao. Međutim,
doprinos menadžerskih inovacija se povećao - opet, ovaj val organizacijskih promjena izgleda kao
zakašnjeli odgovor na ulaganja u Internet i Web 1.0 iz prethodnih pet godina.26
Što nam ti obrasci govore o izgledima za velike podatke i produktivnost? Kao i prethodni
valovi produktivnosti omogućene IT-om, korištenje velikih podataka u osnovi zahtijeva ulaganja
u IT (u pohranu i procesorsku snagu) i menadžerske inovacije.
Čini se vjerojatnim da će intenzivnost podataka i produbljivanje kapitala potaknuti širenje
komplementarne menadžerske inovacije koja potiče rast produktivnosti. Do sada nema
empirijskih dokaza o vezi između intenziteta podataka ili produbljivanja kapitala u ulaganjima
u podatke i produktivnosti u određenim sektorima. Priča o IT-u i produktivnosti sugerira da je razlog
tome vremenski odmak i da ćemo u jednom trenutku vidjeti kako se ulaganja u produbljivanje kapitala
povezanog s velikim podacima isplate u obliku povećanja produktivnosti.
U istraživanju koje smo proveli o velikim podacima u pet domena na različitim

zemljopisnim područjima, nalazimo snažne dokaze da poluge velikih podataka mogu povećati
učinkovitost smanjenjem broja ili veličine ulaza uz zadržavanje iste izlazne razine. U isto vrijeme,
oni mogu biti važno sredstvo dodavanja vrijednosti stvaranjem većeg stvarnog učinka bez
povećanja unosa. U zdravstvu, na primjer, poluge velikih podataka mogu povećati učinkovitost
smanjenjem troškova cijelog sustava povezanih s nedovoljnim i pretjeranim liječenjem te smanjenjem
pogrešaka i dupliciranja u liječenju. Ove će poluge također poboljšati kvalitetu skrbi i rezultate
pacijenata. Slično tome, u upravi javnog sektora poluge velikih podataka dovode ne samo do povećanja
učinkovitosti, već i do povećanja učinkovitosti jer omogućuju vladama da učinkovitije prikupljaju
poreze i pomažu u podizanju kvalitete usluga od obrazovanja do ureda za nezaposlene. Za trgovce na
malo, opskrba velikim podacima
26 Koristimo multifaktorsku produktivnost u industrijama koje koriste IT kao naše mjerenje utjecaja
menadžerske inovacije.
26
lanac i operativne poluge mogu poboljšati učinkovitost cijelog sektora. Poluge marketinga i
trgovanja pomoći će potrošačima da pronađu bolje proizvode koji će zadovoljiti njihove
potrebe po razumnijim cijenama, povećavajući stvarnu dodanu vrijednost.
Kombinacija produbljivanja ulaganja u velike podatke i menadžerske inovacije za

stvaranje konkurentske prednosti i povećanje produktivnosti vrlo je slična načinu na
koji se IT razvijao od 1970-ih nadalje. Iskustvo IT-a snažno ukazuje na to da bismo mogli
biti na pragu novog vala rasta produktivnosti omogućenog korištenjem velikih podataka.
Podaci su danas postali važan čimbenik proizvodnje - u rangu s fizičkom imovinom i

ljudskim kapitalom - a sve veći intenzitet kojim poduzeća prikupljaju informacije usporedo
s porastom multimedije, društvenih medija i Interneta stvari nastavit će poticati
eksponencijalni rast u podacima za doglednu budućnost. Veliki podaci imaju značajan
potencijal za stvaranje vrijednosti za poduzeća i
potrošači.
2. Tehnike i tehnologije
velikih podataka
Širok raspon tehnika i tehnologija razvijen je i prilagođen za agregiranje, manipuliranje,

analizu i vizualizaciju velikih podataka. Ove tehnike i tehnologije dolaze iz nekoliko područja
uključujući statistiku, računalne znanosti, primijenjenu matematiku i ekonomiju. To znači da
organizacija koja namjerava izvući vrijednost iz velikih podataka mora usvojiti fleksibilan,
multidisciplinarni pristup. Neke tehnike i tehnologije razvijene su u svijetu s pristupom daleko
manjim količinama i raznolikošću podataka, ali su uspješno prilagođene tako da su primjenjive
na vrlo velike skupove raznolikijih podataka. Drugi su razvijeni u novije vrijeme, posebno za
prikupljanje vrijednosti velikih podataka. Neke su razvili akademici, a druge tvrtke, posebno one s
online poslovnim modelima koji se temelje na analizi velikih podataka.
Ovo se izvješće usredotočuje na dokumentiranje potencijalne vrijednosti koju može stvoriti

korištenje velikih podataka. To nije detaljan priručnik s uputama o tome kako uhvatiti
vrijednost, zadatak koji zahtijeva vrlo specifičnu prilagodbu kontekstu, strategiji i mogućnostima
organizacije. Međutim, željeli smo istaknuti neke od glavnih tehnika i tehnologija koje se mogu
primijeniti za iskorištavanje velikih podataka kako bismo pojasnili način na koji bi neke od poluga
za korištenje velikih podataka koje opisujemo mogle funkcionirati. Ovo nisu sveobuhvatni popisi
— priča o velikim podacima još uvijek se piše; nastavljaju se razvijati nove metode i alati za
rješavanje novih problema. Kako bismo pomogli zainteresiranim čitateljima da lakše pronađu
određenu tehniku ili tehnologiju, ove smo popise posložili abecednim redom. Gdje smo koristili
podebljana slova, ilustriramo višestruke međusobne veze između tehnika i tehnologija. Također
pružamo kratak izbor ilustrativnih primjera vizualizacije, ključnog alata za razumijevanje podataka
vrlo velikih razmjera i složenih analiza u svrhu donošenja boljih odluka.
TEHNIKE ZA ANALIZU VELIKIH PODATAKA

Postoje mnoge tehnike koje se oslanjaju na discipline kao što su statistika i računalna znanost
(osobito strojno učenje) koje se mogu koristiti za analizu skupova podataka. U ovom odjeljku
nudimo popis nekih kategorija tehnika primjenjivih u nizu industrija. Ovaj popis nipošto nije konačan.
Doista, istraživači nastavljaju razvijati nove tehnike i poboljšavati postojeće, posebice kao odgovor
na potrebu za analizom novih kombinacija podataka. Napominjemo da sve ove tehnike ne zahtijevaju
striktno korištenje velikih podataka — neke od njih mogu se učinkovito primijeniti na manje skupove
podataka (npr. A/B testiranje, regresijska analiza). Međutim, sve tehnike koje ovdje navodimo mogu
se primijeniti na velike podatke i, općenito, veći i raznolikiji skupovi podataka mogu se koristiti za
generiranje brojnijih i pronicljivijih rezultata od manjih, manje raznolikih.
A/B testiranje. Tehnika u kojoj se kontrolna skupina uspoređuje s nizom testnih skupina kako
bi se odredilo koji će tretmani (tj. promjene) poboljšati danu objektivnu varijablu, npr. stopu
marketinškog odgovora. Ova tehnika je također poznata kao split testiranje ili bucket testiranje.
Primjer primjene je određivanje koje kopije teksta, izgleda, slika ili boja će poboljšati stope pretvorbe
na web stranici e-trgovine. Veliki podaci omogućuju izvođenje i analizu velikog broja testova,
osiguravajući da su grupe dovoljno velike da otkriju značajne (tj. statistički značajne) razlike između
kontrolnih
28
i skupine za liječenje (vidi statistiku). Kada se u liječenju istovremeno manipulira s

više od jedne varijable, multivarijatna generalizacija ove tehnike, koja primjenjuje
statističko modeliranje, često se naziva "A/B/N" testiranje.
Učenje pravila asocijacije. Skup tehnika za otkrivanje zanimljivih odnosa, tj.

"pravila pridruživanja", među varijablama u velikim bazama podataka.27 Ove tehnike
sastoje se od niza algoritama za generiranje i testiranje mogućih pravila.
Jedna primjena je analiza tržišne košarice, u kojoj trgovac na malo može odrediti
koji se proizvodi često kupuju zajedno i koristiti te informacije za marketing (često
navođen primjer je otkriće da mnogi kupci u supermarketima koji kupuju pelene
također obično kupuju pivo). Koristi se za rudarenje podataka.
Klasifikacija. Skup tehnika za identifikaciju kategorija u koje pripadaju nove

podatkovne točke, na temelju skupa za obuku koji sadrži podatkovne točke koje
su već kategorizirane. Jedna primjena je predviđanje ponašanja kupaca specifičnog
za segment (npr. odluke o kupnji, stopa odljeva, stopa potrošnje) gdje postoji jasna
hipoteza ili objektivan ishod. Ove se tehnike često opisuju kao nadzirano učenje zbog
postojanja skupa za obuku; stoje u suprotnosti s klaster analizom, vrstom učenja bez
nadzora. Koristi se za rudarenje podataka.
Klaster analiza. Statistička metoda za klasificiranje objekata koja dijeli raznoliku

skupinu u manje skupine sličnih objekata, čije karakteristike sličnosti nisu unaprijed
poznate. Primjer klaster analize je segmentiranje potrošača u sebi slične skupine za
ciljani marketing. Ovo je vrsta učenja bez nadzora jer se podaci o obuci ne koriste. Ova
tehnika je u suprotnosti s klasifikacijom, vrstom nadziranog učenja. Koristi se za
rudarenje podataka.
Crowdsourcing. Tehnika za prikupljanje podataka koje šalje velika grupa ljudi

ili zajednica (tj. "mnoštvo") putem otvorenog poziva, obično putem umreženih
medija kao što je Web.28 Ovo je vrsta masovne suradnje i primjer korištenja
weba 2.0.29
Fuzija podataka i integracija podataka. Skup tehnika koje integriraju i analiziraju

podatke iz više izvora kako bi se razvili uvidi na načine koji su učinkovitiji i potencijalno
točniji nego da su razvijeni analizom jednog izvora podataka. Tehnike obrade signala
mogu se koristiti za implementaciju nekih vrsta fuzije podataka. Jedan primjer aplikacije
su podaci senzora iz Interneta stvari koji se kombiniraju kako bi se razvila integrirana
perspektiva o izvedbi složenog distribuiranog sustava kao što je rafinerija nafte.
Podaci iz društvenih medija, analizirani obradom prirodnog jezika, mogu se
kombinirati s podacima o prodaji u stvarnom vremenu, kako bi se utvrdilo kakav učinak
marketinška kampanja ima na raspoloženje kupaca i kupnju
ponašanje.
Rudarenje podataka. Skup tehnika za izdvajanje uzoraka iz velikih skupova

podataka kombiniranjem metoda iz statistike i strojnog učenja s upravljanjem
bazom podataka. Ove tehnike uključuju učenje pravila asocijacije, analizu
klastera, klasifikaciju i regresiju. Aplikacije uključuju rudarenje podataka o kupcima
kako bi se odredili segmenti koji će najvjerojatnije odgovoriti na ponudu, rudarenje ljudski
27 R. Agrawal, T. Imielinski i A. Swami, “Rudarska udružujuća pravila između skupova predmeta u

velike baze podataka,” SIGMOD Conference 1993: 207–16; P. Hajek, I. Havel i M. Chytil, “GUHA metoda
automatskog određivanja hipoteza,” Computing 1(4), 1966.; 293–308 (prikaz, stručni).
28 Jeff Howe, “The Rise of Crowdsourcing,” Wired, izdanje 14.06, lipanj 2006.
29 Michael Chui, Andy Miller i Roger Roberts, “Šest načina kako učiniti da Web 2.0 funkcionira”, McKinsey Quarterly,
veljača 2009.
podatke o resursima za prepoznavanje karakteristika najuspješnijih zaposlenika ili analizu tržišne

košarice za modeliranje kupovnog ponašanja kupaca.
Učenje u ansamblu. Korištenje višestrukih prediktivnih modela (svaki razvijen korištenjem

statistike i/ili strojnog učenja) za postizanje boljeg prediktivnog učinka nego što bi se moglo dobiti bilo
kojim od sastavnih modela. Ovo je vrsta nadziranog učenja.
Genetski algoritmi. Tehnika koja se koristi za optimizaciju inspirirana procesom prirodne evolucije
ili "opstankom najjačih". U ovoj tehnici, potencijalna rješenja su kodirana kao "kromosomi" koji se
mogu kombinirati i mutirati. ove
pojedinačni kromosomi su odabrani za preživljavanje unutar modeliranog "okoliša"
koji određuje sposobnost ili izvedbu svakog pojedinca u populaciji. Često opisani kao vrsta "evolucijskih
algoritama", ovi su algoritmi prikladni za rješavanje nelinearnih problema. Primjeri primjena uključuju
poboljšanje rasporeda poslova u proizvodnji i optimiziranje izvedbe investicijskog portfelja.
Strojno učenje. Subspecijalnost računalne znanosti (unutar polja povijesno zvanog "umjetna
inteligencija") koja se bavi dizajnom i razvojem algoritama koji omogućuju računalima da razvijaju
ponašanja na temelju empirijskih podataka. Glavni fokus istraživanja strojnog učenja je automatsko
učenje prepoznavanja složenih obrazaca i donošenje inteligentnih odluka na temelju podataka.
Obrada prirodnog jezika primjer je strojnog učenja.
Obrada prirodnog jezika (NLP). Skup tehnika iz subspecijalnosti računalnih znanosti (unutar polja koje
se povijesno naziva "umjetna inteligencija") i lingvistike koje koriste računalne algoritme za analizu
ljudskog (prirodnog) jezika.
Mnoge NLP tehnike su vrste strojnog učenja. Jedna od primjena NLP-a je korištenje analize raspoloženja
na društvenim medijima kako bi se utvrdilo kako potencijalni kupci reagiraju na kampanju brendiranja.
Neuronske mreže. Računalni modeli, nadahnuti strukturom i radom bioloških neuronskih mreža (tj.
stanica i veza unutar mozga), koji pronalaze uzorke u podacima. Neuronske mreže su prikladne za
pronalaženje nelinearnih obrazaca.
Mogu se koristiti za prepoznavanje uzoraka i optimizaciju. Neke aplikacije neuronske mreže uključuju
učenje pod nadzorom, a druge učenje bez nadzora.
Primjeri aplikacija uključuju identificiranje klijenata visoke vrijednosti koji su u opasnosti od napuštanja
određene tvrtke i identificiranje lažnih potraživanja osiguranja.
Analiza mreže. Skup tehnika koje se koriste za karakterizaciju odnosa između diskretnih čvorova u
grafu ili mreži. U analizi društvenih mreža analiziraju se veze između pojedinaca u zajednici ili
organizaciji, npr. kako informacije putuju ili tko na koga ima najveći utjecaj. Primjeri aplikacija uključuju
identificiranje ključnih lidera mišljenja za ciljanje marketinga i identificiranje uskih grla u protoku
informacija poduzeća.
Optimizacija. Portfelj numeričkih tehnika koje se koriste za redizajniranje složenih sustava i procesa
kako bi se poboljšala njihova izvedba prema jednoj ili više objektivnih mjera (npr. cijena, brzina ili
pouzdanost). Primjeri aplikacija uključuju poboljšanje operativnih procesa kao što su planiranje,
usmjeravanje i tlocrt te donošenje strateških odluka kao što je strategija asortimana proizvoda, analiza
povezanih ulaganja i strategija portfelja istraživanja i razvoja. Genetski algoritmi su primjer optimizacijske
tehnike.
30
Prepoznavanje uzorka. Skup tehnika strojnog učenja koje dodjeljuju neku vrstu izlazne vrijednosti
(ili oznake) danoj ulaznoj vrijednosti (ili instanci) prema određenom algoritmu. Primjer su
tehnike klasifikacije.
Prediktivno modeliranje. Skup tehnika u kojima se stvara ili odabire matematički model za najbolje
predviđanje vjerojatnosti ishoda. Primjer primjene u upravljanju odnosima s kupcima je upotreba
prediktivnih modela za procjenu vjerojatnosti da će se kupac "odbaciti" (tj. promijeniti dobavljača) ili
vjerojatnosti da se kupcu može prodati drugi proizvod. Regresija je jedan primjer od mnogih tehnika
prediktivnog modeliranja.
Regresija. Skup statističkih tehnika za određivanje kako se vrijednost zavisne varijable

mijenja kada se mijenja jedna ili više nezavisnih varijabli.
Često se koristi za predviđanje ili predviđanje. Primjeri primjene uključuju predviđanje obujma
prodaje na temelju različitih tržišnih i ekonomskih varijabli ili određivanje koji mjerljivi proizvodni
parametri najviše utječu na zadovoljstvo kupaca. Koristi se za rudarenje podataka.
Analiza sentimenta. Primjena obrade prirodnog jezika i drugih analitičkih tehnika za prepoznavanje
i izdvajanje subjektivnih informacija iz izvornog tekstualnog materijala.
Ključni aspekti ovih analiza uključuju identifikaciju značajke, aspekta ili proizvoda o kojem se
izražava mišljenje i određivanje tipa, "polariteta" (tj. pozitivan, negativan ili neutralan) te stupnja
i snage mišljenja. Primjeri aplikacija uključuju tvrtke koje primjenjuju analizu raspoloženja za
analizu društvenih medija (npr. blogova, mikroblogova i društvenih mreža) kako bi se utvrdilo
kako različiti segmenti kupaca i dionici reagiraju na njihove proizvode i akcije.
Procesiranje signala. Skup tehnika iz elektrotehnike i primijenjene matematike izvorno razvijen

za analizu diskretnih i kontinuiranih signala, tj. prikaza analognih fizičkih veličina (čak i ako su
predstavljene digitalno) kao što su radio signali, zvukovi i slike. Ova kategorija uključuje tehnike
iz teorije detekcije signala, koja kvantificira sposobnost razlikovanja između signala i šuma.
Primjeri aplikacija uključuju modeliranje za analizu vremenskih nizova ili implementaciju fuzije
podataka za određivanje preciznijeg očitanja kombiniranjem podataka iz skupa manje preciznih
izvora podataka (tj. izdvajanje signala iz šuma).
Analiza prostora. Skup tehnika, od kojih se neke primjenjuju iz statistike, koje analiziraju topološka,
geometrijska ili geografska svojstva kodirana u skupu podataka. Podaci za prostornu analizu često
dolaze iz geografskih informacijskih sustava (GIS) koji prikupljaju podatke uključujući informacije o
lokaciji, npr. adrese ili koordinate zemljopisne širine/dužine. Primjeri aplikacija uključuju
uključivanje prostornih podataka u prostorne regresije (npr. kako je spremnost potrošača da
kupe proizvod u korelaciji s lokacijom?) ili simulacije (npr. kako bi funkcionirala mreža proizvodnog
opskrbnog lanca s lokacijama na različitim lokacijama?).
Statistika. Znanost o prikupljanju, organizaciji i tumačenju podataka, uključujući dizajn

istraživanja i eksperimenata. Statističke tehnike se često koriste za donošenje prosudbi o
tome koji su odnosi između varijabli mogli nastati slučajno ("nulta hipoteza") i koji odnosi
između varijabli vjerojatno proizlaze iz neke vrste temeljne uzročne veze (tj. koji su "statistički
značajni") . Statističke tehnike također se koriste za smanjenje vjerojatnosti pogrešaka tipa I
(„lažno pozitivnih rezultata”) i pogrešaka tipa II („lažno negativnih rezultata”). Primjer aplikacije je
A/B testiranje kako bi se utvrdilo koje će vrste marketinškog materijala najviše povećati prihod.
Učenje pod nadzorom. Skup tehnika strojnog učenja koje izvode funkciju ili odnos iz skupa
podataka za obuku. Primjeri uključuju strojeve za klasifikaciju i vektorske vektore.30 Ovo se
razlikuje od učenja bez nadzora.
Simulacija. Modeliranje ponašanja složenih sustava, često se koristi za predviđanje,

predviđanje i planiranje scenarija. Na primjer, Monte Carlo simulacije su klasa algoritama
koji se oslanjaju na ponovljeno nasumično uzorkovanje, tj. izvođenje tisuća simulacija, od
kojih se svaka temelji na različitim pretpostavkama. Rezultat je histogram koji daje distribuciju
vjerojatnosti ishoda. Jedna primjena je procjena vjerojatnosti ispunjavanja financijskih ciljeva s
obzirom na neizvjesnosti o uspjehu različitih inicijativa.
Analiza vremenskih serija. Skup tehnika iz statistike i obrade signala za analizu sekvenci
podatkovnih točaka, koje predstavljaju vrijednosti u uzastopnim vremenima, za izdvajanje
značajnih karakteristika iz podataka. Primjeri analize vremenskih serija uključuju vrijednost
burzovnog indeksa po satu ili broj pacijenata kojima je dijagnosticirano određeno stanje svaki
dan. Predviđanje vremenskih serija korištenje je modela za predviđanje budućih vrijednosti
vremenske serije na temelju poznatih prošlih vrijednosti iste ili druge serije. Neke od ovih
tehnika, npr. strukturno modeliranje, rastavljaju niz na komponente trenda, sezonske i rezidualne
komponente, što može biti korisno za identificiranje cikličkih obrazaca u podacima. Primjeri
primjene uključuju predviđanje brojki prodaje ili predviđanje broja ljudi kojima će biti
dijagnosticirana zarazna bolest.
Učenje bez nadzora. Skup tehnika strojnog učenja koje pronalaze skrivenu strukturu u
neoznačenim podacima. Klaster analiza je primjer nenadziranog učenja (za razliku od nadziranog
učenja).
Vizualizacija. Tehnike koje se koriste za stvaranje slika, dijagrama ili animacija za

komunikaciju, razumijevanje i poboljšanje rezultata analize velikih podataka (pogledajte zadnji
odjeljak ovog poglavlja).
BIG DATA TEHNOLOGIJE
Sve je veći broj tehnologija koje se koriste za prikupljanje, manipuliranje, upravljanje i analizu
velikih podataka. Detaljno smo opisali neke od istaknutijih tehnologija, ali ovaj popis nije iscrpan,
pogotovo jer se nastavlja razvijati više tehnologija za podršku tehnikama velikih podataka, od
kojih smo neke naveli.
Veliki Stol. Vlasnički distribuirani sustav baze podataka izgrađen na Google datotečnom sustavu.
Inspiracija za HBase.
Poslovna inteligencija (BI). Vrsta aplikacijskog softvera dizajniranog za izvješćivanje,

analizu i predstavljanje podataka. BI alati često se koriste za čitanje podataka koji su
prethodno bili pohranjeni u skladištu podataka ili prodajnom mjestu. BI alati se također
mogu koristiti za izradu standardnih izvješća koja se generiraju na periodičnoj osnovi ili
za prikaz informacija na upravljačkim nadzornim pločama u stvarnom vremenu, tj. integriranim
prikazima metrika koje mjere performanse sustava.
Kasandra. Sustav za upravljanje bazom podataka otvorenog koda (besplatan) dizajniran za

rukovanje velikim količinama podataka u distribuiranom sustavu. Ovaj sustav izvorno je razvijen
u Facebooku, a sada se njime upravlja kao projekt zaklade Apache Software.
30 Corinna Cortes i Vladimir Vapnik, “Support-vector networks,” Machine Learning 20(3),

rujna 1995. (www.springerlink.com/content/k238jx04hm87j80g/).
32
Računalni oblak. Računalna paradigma u kojoj se visoko skalabilni računalni resursi, često
konfigurirani kao distribuirani sustav, pružaju kao usluga putem mreže.
Stanica podataka. Podskup skladišta podataka, koji se koristi za pružanje podataka korisnicima
obično putem alata poslovne inteligencije.
Skladište podataka. Specijalizirana baza podataka optimizirana za izvješćivanje, često se koristi za

pohranjivanje velikih količina strukturiranih podataka. Podaci se učitavaju pomoću ETL (extract,
transform, and load) alata iz operativnih pohrana podataka, a izvješća se često generiraju pomoću
alata poslovne inteligencije.
Distribuirani sustav. Više računala, koja komuniciraju putem mreže, koriste se za rješavanje zajedničkog
računskog problema. Problem je podijeljen na više zadataka, od kojih svaki rješava jedno ili više računala
koja rade paralelno. Prednosti distribuiranih sustava uključuju veće performanse po nižoj cijeni (tj. zato
što klaster nižih računala može biti jeftiniji od jednog višeg računala), veću pouzdanost (tj. zbog
nedostatka jedne točke kvara). ), i veću skalabilnost (tj. jer se povećanje snage distribuiranog sustava može
postići jednostavnim dodavanjem više čvorova umjesto potpunom zamjenom središnjeg računala).
Dinamo. Vlasnički distribuirani sustav za pohranu podataka koji je razvio Amazon.
Ekstrahiraj, transformiraj i učitaj (ETL). Softverski alati koji se koriste za izdvajanje podataka iz
vanjskih izvora, njihovu transformaciju kako bi odgovarali operativnim potrebama i njihovo učitavanje u a
baze podataka ili skladišta podataka.
Googleov sustav datoteka. Vlasnički distribuirani datotečni sustav koji je razvio Google; dio inspiracije za
Hadoop. 31
Hadoop. Okvir (besplatnog) softvera otvorenog koda za obradu velikih skupova podataka o određenim
vrstama problema u distribuiranom sustavu. Njegov razvoj inspiriran je Googleovim MapReduceom i
Googleovim datotečnim sustavom. Izvorno je razvijen u Yahoo! i sada se vodi kao projekt Apache Software
Foundationa.
HBase. Otvorena (besplatna), distribuirana, nerelacijska baza podataka po uzoru na Googleov Big
Table. Izvorno ga je razvio Powerset, a sada se njime upravlja kao projekt zaklade Apache Software kao dio
Hadoopa.
MapReduce. Softverski okvir koji je predstavio Google za obradu ogromnih skupova podataka o
određenim vrstama problema u distribuiranom sustavu.32 Također implementiran u Hadoop.
Mashup. Aplikacija koja koristi i kombinira prikaz podataka ili funkcionalnost iz dva ili više izvora za
stvaranje novih usluga. Te su aplikacije često dostupne na webu i često koriste podatke kojima se pristupa
putem otvorenih programskih sučelja aplikacija ili iz otvorenih izvora podataka.
Metapodaci. Podaci koji opisuju sadržaj i kontekst podatkovnih datoteka, npr. način stvaranja, svrha,
vrijeme i datum stvaranja te autor.
31 Sanjay Ghemawat, Howard Gobioff i Shun-Tak Leung, "Google datotečni sustav", 19. ACM simpozij o
načelima operativnih sustava, Lake George, NY, listopad 2003. (labs.google. com/papers/gfs.html).
32 Jeffrey Dean i Sanjay Ghemawat, “MapReduce: Pojednostavljena obrada podataka na velikom

klastera,” Sixth Symposium on Operating System Design and Implementation, San Francisco, CA,
prosinac 2004. (labs.google.com/papers/mapreduce.html).
Nerelacijska baza podataka. Baza podataka koja ne pohranjuje podatke u tablice (redove i stupce). (Za
razliku od relacijske baze podataka).
R. Otvoreni (besplatni) programski jezik i softversko okruženje za statističko računanje i grafiku.

Jezik R je postao de facto standard među statističarima za razvoj statističkog softvera i naširoko se
koristi za razvoj statističkog softvera i analizu podataka. R je dio projekta GNU, suradnje koja podržava
projekte otvorenog koda.
Relacijska baza podataka. Baza podataka sastavljena od zbirke tablica (relacija), tj. podaci su
pohranjeni u redovima i stupcima. Sustavi za upravljanje relacijskim bazama podataka (RDBMS)
pohranjuju vrstu strukturiranih podataka. SQL je najrašireniji jezik za upravljanje relacijskim bazama
podataka (vidi stavku u nastavku).
Polustrukturirani podaci. Podaci koji nisu u skladu s fiksnim poljima, ali sadrže oznake i druge oznake
za odvajanje podatkovnih elemenata. Primjeri polustrukturiranih podataka uključuju XML ili tekst s
HTML oznakama. Kontrast sa strukturiranim i nestrukturiranim podacima.
SQL. Izvorno akronim za strukturirani jezik upita, SQL je računalni jezik dizajniran za upravljanje
podacima u relacijskim bazama podataka. Ova tehnika uključuje mogućnost umetanja,
postavljanja upita, ažuriranja i brisanja podataka, kao i upravljanje shemom podataka (strukture baze
podataka) i kontrolu pristupa podacima u bazi podataka.
Obrada toka. Tehnologije dizajnirane za obradu velikih tokova podataka o događajima u stvarnom
vremenu. Obrada toka omogućuje aplikacije kao što su algoritamsko trgovanje financijskim uslugama,
aplikacije za obradu RFID događaja, otkrivanje prijevara, praćenje procesa i usluge temeljene na lokaciji
u telekomunikacijama. Poznato i kao obrada toka događaja.
Strukturirani podaci. Podaci koji se nalaze u fiksnim poljima. Primjeri strukturiranih podataka uključuju
relacijske baze podataka ili podatke u proračunskim tablicama. Suprotnost s polustrukturiranim podacima
i nestrukturiranim podacima.
Nestrukturirani podaci. Podaci koji se ne nalaze u fiksnim poljima. Primjeri uključuju tekst u
slobodnom obliku (npr. knjige, članci, tijelo poruka e-pošte), neoznačene audio, slikovne i video podatke.
Kontrast sa strukturiranim podacima i polustrukturiranim podacima.
Vizualizacija. Tehnologije koje se koriste za stvaranje slika, dijagrama ili animacija za prenošenje
poruke koje se često koriste za sintetiziranje rezultata analiza velikih podataka (pogledajte sljedeći
odjeljak za primjere).
VIZUALIZACIJA
Predstavljanje informacija na takav način da ih ljudi mogu učinkovito konzumirati ključni je izazov s
kojim se treba suočiti ako se želi da analiza podataka dovede do konkretnih radnji. Kao što smo
raspravljali u okviru 4, ljudska bića su evoluirala kako bi postala vrlo učinkovita u opažanju određenih
vrsta uzoraka svojim osjetilima, ali se i dalje suočavaju sa značajnim ograničenjima u svojoj sposobnosti
obrade drugih vrsta podataka kao što su velike količine numeričkih ili tekstualnih podataka. Iz tog
razloga trenutno postoji ogromna količina istraživanja i inovacija u području vizualizacije, tj. tehnika i
tehnologija koje se koriste za stvaranje slika, dijagrama ili animacija za komunikaciju, razumijevanje i
poboljšanje rezultata analiza velikih podataka. Predstavljamo neke primjere kako bismo dali uvid u ovo
rastuće i važno polje koje podržava velike podatke.
34
Oblak oznaka
Ova grafika je vizualizacija teksta ovog izvješća u obliku oblaka oznaka, tj. ponderirane vizualne
liste, u kojoj su riječi koje se najčešće pojavljuju veće, a riječi koje se rjeđe pojavljuju manje. Ova
vrsta vizualizacije pomaže čitatelju da brzo uoči najistaknutije koncepte u velikom tekstu.
Clustergram
Clustergram je tehnika vizualizacije koja se koristi za analizu klastera koja prikazuje kako su
pojedinačni članovi skupa podataka dodijeljeni klasterima kako se broj klastera povećava.33
Izbor broja klastera važan je parametar u analizi klastera. Ova tehnika omogućuje analitičaru da
postigne bolje razumijevanje toga kako rezultati klasteriranja variraju s različitim brojem klastera.
33 Matthias Schonlau, “Clustergram: graf za vizualizaciju hijerarhijskog i nehijerarhijskog

analize klastera,” The Stata Journal, 2002.; 2 (4): 391-402.
Tok povijesti
Tijek povijesti tehnika je vizualizacije koja prikazuje evoluciju dokumenta dok ga uređuje više
autora koji sudjeluju.34 Vrijeme se pojavljuje na vodoravnoj osi, dok su prilozi tekstu na okomitoj
osi; svaki autor ima različitu šifru boje, a okomita duljina trake označava količinu teksta koju je
svaki autor napisao.
Vizualizirajući povijest dokumenta na ovaj način, lako se pojavljuju različiti uvidi.
Na primjer, tijek povijesti koji ovdje prikazujemo, a koji prikazuje unos u Wikipediji za riječ
"islam", pokazuje da je sve veći broj autora dao doprinos u povijesti ovog unosa.35 Također
se lako može vidjeti da je duljina dokumenta rasla je tijekom vremena kako je više autora
razrađivalo temu, ali da je u određenim točkama bilo i značajnih brisanja, tj. kada se okomita
duljina smanjila. Čak se mogu vidjeti i primjeri “vandalizma” u kojem dokument ima
u potpunosti uklonjen iako je, zanimljivo, dokument bio vrlo brzo popravljen i vraćen u
prethodno stanje.
34 Fernanda B. Viegas, Martin Wattenberg i Kushal Dave, Proučavanje suradnje i sukoba između
autora s vizualizacijama toka povijesti, CHI2004 zbornik SIGCHI konferencije o ljudskim faktorima
u računalnim sustavima, 2004.
35 Za više primjera tokova povijesti, pogledajte galeriju koju je pružio Collaborative User
Istraživačka skupina IBM-a (www.research.ibm.com/visual/projects/history_flow/gallery.htm).
36
Protok prostornih informacija
Druga tehnika vizualizacije je ona koja prikazuje tokove prostornih informacija. Primjer koji ovdje
prikazujemo zove se New York Talk Exchange.36 Prikazuje količinu podataka internetskog protokola (IP) koja
teče između New Yorka i gradova diljem svijeta.
Veličina sjaja na određenoj gradskoj lokaciji odgovara količini IP prometa koji teče između tog mjesta
i New Yorka; što je veći sjaj, to je veći protok. Ova vizualizacija nam omogućuje da brzo odredimo koji su
nam gradovi najbliži
povezani s New Yorkom u smislu opsega svojih komunikacija.
36 New York Talk Exchange bio je izložen u njujorškom Muzeju moderne umjetnosti 2008.
(senseable.mit.edu/nyte/).
3. Transformativni potencijal velikih

podataka u pet domena
Kako bismo istražili koliko veliki podaci mogu stvoriti vrijednost i veličinu tog
potencijala, odabrali smo pet domena za dubinsko proučavanje: zdravstvena skrb u
Sjedinjenim Državama; uprava javnog sektora u Europskoj uniji; maloprodaja u Sjedinjenim
Državama; globalna proizvodnja; i globalne osobne podatke o lokaciji.
Zajedno ovih pet predstavljalo je blizu 40 posto globalnog BDP-a u 2010. (Prikaz 12).37
Tijekom naše analize ovih područja, obavili smo intervjue sa stručnjacima iz industrije i poduzeli
temeljit pregled aktualne literature. Za svaku domenu identificirali smo specifične poluge pomoću
kojih veliki podaci mogu stvoriti vrijednost; kvantificirao potencijal za dodatnu vrijednost; i
katalogizirao elemente koji su potrebni tvrtkama, organizacijama, vladama i pojedincima da uhvate
tu vrijednost.
Pet domena razlikuje se u svojoj sofisticiranosti i zrelosti u korištenju velikih podataka te stoga
nude različite poslovne lekcije. Oni također predstavljaju široki spektar ključnih segmenata
globalnog gospodarstva i obuhvaćaju niz regionalnih perspektiva.
Oni uključuju globalno razmjenjive sektore kao što je proizvodnja i nerazmjenjive sektore
kao što je uprava javnog sektora, kao i mješavinu proizvoda i usluga.
Zdravstvo je velik i važan segment gospodarstva SAD-a koji se suočava s ogromnim

izazovima produktivnosti. Ima višestruke i različite dionike, uključujući industriju
farmaceutskih proizvoda i medicinskih proizvoda, pružatelje usluga, platitelje i pacijente. Svaki
od njih ima različite interese i poslovne poticaje, ali su i dalje blisko isprepleteni. Svaki generira
skupove podataka, ali oni obično ostaju nepovezani jedan s drugim. Značajan dio kliničkih
podataka još nije digitaliziran. Postoji značajna prilika za stvaranje vrijednosti ako se ti skupovi
podataka mogu digitalizirati, kombinirati i učinkovito koristiti. Međutim, poticaji za iskorištavanje
velikih podataka u ovom sektoru često nisu usklađeni, nudeći poučan slučaj o intervencijama u
cijelom sektoru koje mogu biti potrebne za prikupljanje vrijednosti.
Javni sektor još je jedan veliki dio globalnog gospodarstva koji se suočava s ogromnim
pritiskom da poboljša svoju produktivnost. Vlade imaju pristup velikim bazama digitalnih
podataka, ali, općenito, jedva da su počele iskorištavati moćne načine na koje bi mogle koristiti te
informacije za poboljšanje učinka i transparentnosti.
Odabrali smo proučavati administrativne dijelove vlasti. Ovo je područje u kojem postoji velika
količina podataka, što nam daje priliku povući analogije s procesima u drugim industrijama
stručnjaka znanja, kao što je obrada potraživanja u osiguranju.
Za razliku od prve dvije domene, maloprodaja je sektor u kojem neki igrači već neko vrijeme
koriste big data za segmentiranje kupaca i upravljanje opskrbnim lancima. Unatoč tome, još
uvijek postoji golem potencijal u cijeloj industriji za pojedinačne igrače da prošire i poboljšaju
svoju upotrebu velikih podataka, osobito s obzirom na sve veću lakoću kojom mogu prikupljati
informacije o svojim potrošačima, dobavljačima i zalihama.
37 Za više detalja o metodologiji koju smo koristili u našim studijama slučaja, pogledajte dodatak.
38
Proizvodnja nudi detaljan uvid u industriju kojom se globalno trguje s često složenim
i široko rasprostranjenim lancima vrijednosti i velikom količinom dostupnih podataka.
Ova domena stoga nudi ispitivanje na više točaka u lancu vrijednosti, od iznošenja
proizvoda na tržište i istraživanja i razvoja (R&D) do usluga nakon prodaje.
Podaci o osobnoj lokaciji nova su domena koja presijeca industrijske sektore

od telekomunikacija preko medija do transporta. Generirani podaci brzo rastu,
odražavajući sve veće prihvaćanje pametnih telefona i drugih aplikacija. Ovo je
područje leglo inovacija koje bi mogle transformirati organizacije i živote pojedinaca,
potencijalno stvarajući značajnu količinu viška za potrošače.
Prikaz 12
Pet sektora ili domena koje smo odabrali za dubinsko proučavanje daju
važan doprinos globalnom gospodarstvu
Procijenjeni globalni BDP sektora u 2010
% ukupnog BDP-a
Nominalni trilijun dolara
zdravstvo 1 7 3.9
Javni sektor2 6 3.7
Maloprodaja 6 3.3
Proizvodnja 18 10.1
Telekomunikacije3 2 1.2
Ukupno 39 22.3
Ukupni globalni BDP 2010. =

57,5 trilijuna dolara
1 Uključuje zdravstvene i socijalne usluge, medicinsku i mjernu opremu i lijekove.

2 Odnosi se na javni sektor uprave, obrane i obveznog socijalnog osiguranja (isključuje obrazovanje).
3 Budući da su osobni podaci o lokaciji domena, a ne sektor, upotrijebili smo telekom kao usporedbu za BDP.
IZVOR: Global Insight; Analiza McKinsey Global Institute

3a. Zdravstvena zaštita (Sjedinjene Američke Države)
Reforma američkog zdravstvenog sustava kako bi se smanjila stopa rasta troškova uz

zadržavanje trenutne snage ključna je za Sjedinjene Države i kao društvo i kao
gospodarstvo. Zdravstvo, jedan od najvećih sektora američkog gospodarstva, čini nešto
više od 17 posto BDP-a i zapošljava oko 11 posto radnika u zemlji. Postaje jasno da je
povijesna stopa rasta rashoda za zdravstvo u SAD-u, koja se godišnje povećavala za gotovo
5 posto u realnom iznosu tijekom posljednjeg desetljeća, neodrživa i da je glavni uzrok visokim
razinama državnog duga za koje se predviđa da će se razviti tijekom sljedeća dva desetljeća.
Sve starije stanovništvo SAD-a i pojava novih, skupljih tretmana pojačat će ovaj trend. Do sada
je zdravstvo zaostajalo za drugim industrijama u poboljšanju operativnih performansi i
usvajanju poboljšanja procesa omogućenih tehnologijom.
Veličina problema i potencijalno dugi rokovi za provedbu promjena čine imperativom da se

odlučne mjere usmjerene na povećanje produktivnosti započnu u bliskoj budućnosti kako bi
se ublažili eskalirajući pritisci na troškove.
Moguće je odgovoriti na ove izazove oponašanjem i primjenom najboljih praksi u

zdravstvenoj skrbi, uvedenih u Sjedinjenim Državama i drugim zemljama. To će često
zahtijevati analizu velikih skupova podataka. MGI je proučavao sektor zdravstvene skrbi u
Sjedinjenim Državama, gdje smo zauzeli ekspanzivan pogled kako bismo uključili pružatelje,
platitelje i podsektore farmaceutskih i medicinskih proizvoda (PMP) kako bismo razumjeli kako
veliki podaci mogu pomoći u poboljšanju djelotvornosti i učinkovitosti zdravstvene skrbi kao
cijeli sustav. Neke od radnji koje mogu pomoći u zaustavljanju rastućih troškova zdravstvene
skrbi u SAD-u uz istovremeno poboljšanje njezine kvalitete ne zahtijevaju nužno velike
podatke. To uključuje, na primjer, rješavanje glavnih temeljnih problema kao što su visoka
učestalost i troškovi bolesti uzrokovane životnim stilom i ponašanjem, minimiziranje bilo
kakve ekonomske distorzije između potrošača i pružatelja usluga i smanjenje administrativne
složenosti uplatitelja.38 Međutim, korištenje velikih skupova podataka temelji još jedan
niz poluga koje imaju potencijal igrati glavnu ulogu u učinkovitijim i štedljivijim inicijativama
skrbi, pojavi boljih proizvoda i usluga te stvaranju novih poslovnih modela u zdravstvu i
povezanim industrijama. No uvođenje velikih podataka u ta područja moralo bi biti popraćeno
nizom pokretača, od kojih bi neki zahtijevali znatno preispitivanje načina na koji se pruža i
financira zdravstvena skrb.
Naše procjene potencijalne vrijednosti koju veliki podaci mogu stvoriti u zdravstvu
stoga nisu predviđanja onoga što će se dogoditi, već naš pogled na puni ekonomski
potencijal, pod pretpostavkom da su potrebna ulaganja u IT i skup podataka, analitičke
sposobnosti, zaštita privatnosti i odgovarajući ekonomski poticaji. staviti na mjesto. Uz ovo
upozorenje, procjenjujemo da za otprilike deset godina postoji prilika za prikupljanje više od
300 milijardi dolara godišnje u novoj vrijednosti, s dvije trećine toga u obliku smanjenja
nacionalnih rashoda za zdravstvenu skrb — oko 8 posto procijenjenih zdravstvenih troškova
izdaci za skrb na razini iz 2010.
TROŠKOVI ZDRAVSTVENE ZAŠTITE U SAD-U PREMAŠUJU GOSPODARSKI RAST
Sjedinjene Države troše više po osobi na zdravstvenu skrb nego bilo koja druga nacija u
svijetu – bez očitih dokaza o boljim ishodima. Očekuje se da će tijekom sljedećeg desetljeća
prosječni godišnji rast potrošnje za zdravstvo nadmašiti prosječni godišnji rast
38 Paul D. Mango i Vivian E. Riefberg, “Tri imperativa za poboljšanje zdravstvene skrbi u SAD-u,”
McKinsey Quarterly prosinac 2008.
40
BDP za gotovo 2 postotna boda.39 Dostupni dokazi upućuju na to da znatan udio američke
potrošnje na zdravstvenu skrb malo doprinosi boljim zdravstvenim ishodima.
Brojne studije su otkrile da Sjedinjene Države troše oko 30 posto više na skrb od
prosječne zemlje Organizacije za ekonomsku suradnju i razvoj (OECD) kada se prilagodi
BDP-u po glavi stanovnika i relativnom bogatstvu.40 Ipak, Sjedinjene Države još uvijek
padaju ispod prosjeka OECD- a na takve parametre zdravstvene zaštite kao što su
prosječni životni vijek i smrtnost dojenčadi. Dodatna potrošnja iznad trendova OECD-a
iznosi procijenjenih 750 milijardi dolara godišnje iz nacionalnog proračuna za zdravstvo
u 2007. od 2,24 trilijuna dolara—to je oko 2500 dolara po osobi godišnje (Prikaz 13). Dob,
opterećenje bolešću i zdravstveni ishodi ne mogu objasniti značajnu razliku.
Prikaz 13
Usporedba sa zemljama OECD-a sugerira da je ukupni ekonomski

potencijal za poboljšanja učinkovitosti oko 750 milijardi dolara
Izdaci za zdravstvo po stanovniku i BDP po stanovniku, zemlje OECD-a,
2007. $ pariteta kupovne moći (PPP)
Izdaci za zdravstvo po stanovniku 8.000
Ujedinjene države
7000
~2500
6000 dolara po stanovniku
5000 Kanada
Danska Norveška
Švicarska
Belgija
4000 Njemačka Nizozemska
Francuska Austrija Irska
Novi Zeland Švedska
Grčka Italija
3000
Island
Južna Korea
Izrael Japan
Republika Slovačka
2000 Australija
Slovenija
Ujedinjeno Kraljevstvo
Mađarska Španjolska
Finska
purica Poljska Estonija
1000 Češka Republika
Meksiko
Čile
0
10.000 15.000 20.000 25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000
BDP po glavi stanovnika
IZVOR: Organizacija za ekonomsku suradnju i razvoj (OECD)
Trenutačni sustav naknade ne stvara poticaje za liječnike, bolnice i druge pružatelje

zdravstvene skrbi – pa čak ni za njihove pacijente – da optimiziraju učinkovitost ili
kontroliraju troškove. Kako je trenutno konstruiran, sustav općenito plaća postupke bez
obzira na njihovu učinkovitost i nužnost. Značajno usporavanje rasta izdataka za
zdravstvo zahtijevat će temeljne promjene u današnjim poticajima.
Primjeri integriranih modela skrbi u Sjedinjenim Državama i šire pokazuju da, kada
su poticaji usklađeni i potrebni pokretači, učinak korištenja velikih podataka može biti
vrlo značajan (vidi okvir 6, „Sustavi zdravstvene zaštite u Sjedinjenim Državama i ondje
su pokazali rani uspjeh u korištenju velikih podataka”).
39 Centri za Medicare i Medicaid usluge, Nacionalne projekcije izdataka za zdravstvo

2009.–2019., rujan 2010.
40 Ove studije prilagođavaju relativno zdravlje koristeći paritet kupovne moći. Za više detalja,
vidi Računovodstvo troškova zdravstvene skrbi u SAD-u: Novi pogled na to zašto Amerikanci
troše više, McKinsey Global Institute, prosinac 2008. (www.mckinsey.com/mgi); Chris L.
Peterson i Rachel Burton, Potrošnja na zdravstvenu skrb u SAD-u: Usporedba s drugim
zemljama OECD-a, Istraživačka služba Kongresa, rujan 2007.; Mark Pearson, Odjel za
zdravstvo OECD-a, pisana izjava Posebnom odboru Senata za starenje, rujan 2009.
Okvir 6. Sustavi zdravstvene zaštite u Sjedinjenim Državama i šire

pokazali su rane uspjehe u korištenju velikih podataka
Fiskalni pritisci nametnuti rastućim troškovima zdravstvene skrbi potaknuli su

stvaranje obećavajućeg niza pilot programa u Sjedinjenim Državama i šire koji
koriste velike podatke i njihove analitičke i upravljačke poluge za hvatanje stvarne
srednjoročne i dugoročne vrijednosti. Primjeri takvih inovacija uključuju:
Odjel za pitanja veterana (VA) u Sjedinjenim Državama uspješno

je demonstrirao nekoliko zdravstvenih informacijskih tehnologija (HIT) i
programa daljinskog praćenja pacijenata. Zdravstveni sustav VA općenito
nadmašuje privatni sektor u praćenju preporučenih procesa za skrb o
pacijentima, pridržavanju kliničkih smjernica i postizanju većih stopa terapije
lijekovima utemeljene na dokazima. Ova su postignuća uvelike moguća
zahvaljujući okviru odgovornosti VA-a temeljenom na učinku i praksama
upravljanja bolestima omogućenim elektroničkim medicinskim zapisima (EMR) i
HIT-om.
Kalifornijski konzorcij integrirane upravljane skrbi Kaiser Permanente

rano je povezao kliničke podatke i podatke o troškovima, čime je osigurao
ključni skup podataka koji je doveo do otkrića nuspojava Vioxxovih lijekova i
kasnijeg povlačenja lijeka s tržišta.1
Nacionalni institut za zdravlje i kliničku izvrsnost, dio Nacionalne zdravstvene

službe Ujedinjenog Kraljevstva, bio je pionir u korištenju velikih skupova
kliničkih podataka za istraživanje kliničke i troškovne učinkovitosti novih
lijekova i skupih postojećih tretmana. Agencija izdaje odgovarajuće smjernice o
takvim troškovima za Nacionalnu zdravstvenu službu i često pregovara o
cijenama i uvjetima pristupa tržištu s PMP industrijama.
Talijanska agencija za lijekove prikuplja i analizira kliničke podatke o

iskustvima sa skupim novim lijekovima u sklopu nacionalnog programa
troškovne učinkovitosti. Agencija može nametnuti status "uvjetne nadoknade"
za nove lijekove i zatim može ponovno procijeniti cijene i uvjete pristupa
tržištu u svjetlu rezultata svojih studija kliničkih podataka.
1 Merck je dobio odobrenje FDA za stavljanje Vioxxa (rofekoksiba) na tržište u svibnju 1999.
pet godina koliko je proteklo prije nego što je Merck povukao Vioxx s tržišta, procjenjuje
se da je 80 milijuna pacijenata uzimalo lijek, što ga je učinilo "blockbusterom" s više od 2
milijarde dolara godišnje prodaje. Unatoč statističkim dokazima u brojnim studijama manjeg
opsega (kasnije analiziranim u metastudiji), trebalo je više od pet godina dok nisu dokazani
kardiovaskularni rizici Vioxxa. U kolovozu 2004., dokument na Međunarodnom
farmakoepidemiološkom skupu u Bordeauxu, Francuska, objavio je rezultate studije koja je
uključivala veliku bazu podataka Kaiser Permanente koja je uspoređivala rizik od štetnih
kardiovaskularnih događaja za korisnike Vioxxa s rizikom za korisnike Pfizerovog Celebrexa.
Studija je zaključila da se između 1999. i 2003. dogodilo više od 27 000 infarkta miokarda
(srčanog udara) i iznenadnih srčanih smrti koje su se mogle izbjeći. Uzimanje 25 miligrama
dnevno ili više Vioxxa rezultiralo je više od tri puta većim rizikom od akutnog srčanog udara ili
iznenadna srčana smrt u usporedbi s primjenom Celebrexa. Dana 30. rujna 2004., u onome
što su mnogi promatrači nazvali najvećim povlačenjem lijekova u povijesti medicine, Merck
je povukao Vioxx s polica ljekarni.
42
US HEALTH CARE IMA ČETIRI GLAVNA SKUPA PODATAKA
Sustav zdravstvene zaštite SAD-a ima četiri glavna skupa podataka unutar zdravstvene zaštite, od kojih svaki
primarno drži različito biračko tijelo. Podaci su u ovoj domeni jako fragmentirani. Četiri skupa su klinički podaci
pružatelja usluga, podaci o aktivnostima (potraživanja) i troškovima platitelja, podaci o istraživanju i razvoju
farmaceutskih i medicinskih proizvoda te podaci o ponašanju i raspoloženju pacijenata (Prikaz 14).
Količina podataka koja je dostupna, prikupljena i analizirana uvelike varira unutar sektora. Na
primjer, pružatelji zdravstvenih usluga obično imaju opsežno digitalizirane financijske i
administrativne podatke, uključujući računovodstvo i osnovne informacije o pacijentima.
Općenito, međutim, pružatelji usluga još su u ranoj fazi digitalizacije i prikupljanja kliničkih
podataka koji pokrivaju područja kao što su napredak i ishodi liječenja. Ovisno o postavci skrbi,
procjenjujemo da se čak 30 posto kliničkih tekstualnih/numeričkih podataka u Sjedinjenim
Državama, uključujući medicinsku dokumentaciju, račune te laboratorijska i kirurška izvješća,
još uvijek ne generira elektronički. Čak i kada su klinički podaci u digitalnom obliku, obično ih čuva
pojedinačni pružatelj usluga i rijetko ih dijeli. Doista, većina stvarno generiranih kliničkih podataka
je u obliku video zapisa i feedova monitora, koji se koriste u stvarnom vremenu, a ne pohranjuju.
Prikaz 14
U domeni zdravstvene skrbi u SAD-u danas postoje četiri različita velika skupa
podataka s malim preklapanjem u vlasništvu i niskom integracijom
Skupovi podataka
Podaci o farmaceutskom istraživanju i

razvoju Vlasnik: Farmaceutske tvrtke, Klinički podaci
akademska zajednica Primjeri Vlasnici: davatelji Primjeri

skupova podataka: klinička ispitivanja, skupova podataka: elektronički
knjižnice za probir visoke propusnosti medicinski kartoni, medicinske slike
(HTS)
Integracija skupova
podataka potrebna za velike
mogućnosti
Podaci o ponašanju i raspoloženju pacijenata
Podaci o aktivnostima (potraživanja) i Vlasnici: različiti, uključujući potrošače i dionike izvan

zdravstvene skrbi (npr. maloprodaja, odjeća)
troškovima Vlasnici: obveznici plaćanja,
pružatelji usluga Primjeri skupova podataka:
korištenje skrbi, procjene troškova Primjeri skupova podataka: ponašanja i preferencije
pacijenata, povijest kupnje u maloprodaji, podaci o
vježbanju snimljeni u tenisicama
U Sjedinjenim Američkim Državama postoji snažan politički pritisak da se elektronički

zdravstveni zapisi (EHR)—koji se ponekad nazivaju elektroničkim medicinskim zapisima (EMR)—
šire primjeni u postavkama pružatelja usluga. Američki Zakon o oporavku i ponovnom ulaganju
iz 2009. uključio je 20 milijardi dolara u poticajno financiranje tijekom pet godina kako bi liječnici i
bolnice potaknuli smislenu upotrebu EHR-a. Planovi naknade temeljeni na rezultatima također bi
mogli potaknuti implementaciju EHR-a jer bi zahtijevali točne i potpune baze podataka i analitičke
alate za mjerenje ishoda.
Platitelji, u međuvremenu, već godinama digitalno bilježe podatke o aktivnostima (potraživanja)

i troškove. Unatoč tome, informacije općenito nisu u obliku koji platitelji mogu koristiti za vrstu
napredne analize potrebne za stvaranje pravih uvida jer su rijetko standardizirane, često
fragmentirane ili generirane u naslijeđenim IT sustavima s nekompatibilnim formatima.
Podsektor PMP je nedvojbeno najnapredniji u digitalizaciji i korištenju podataka u sektoru zdravstva.

PMP digitalno prikuplja podatke o istraživanju i razvoju i već ih opsežno analizira. Dodatne
mogućnosti mogle bi proizaći iz kombiniranja PMP podataka s drugim skupovima podataka kao što
su podaci o genomici ili proteomici za osobnu medicinu ili klinički skupovi podataka od pružatelja
usluga za identifikaciju proširenih primjena i štetnih učinaka.
Osim kliničkih podataka, podataka o troškovima aktivnosti (zahtjevi) i skupova podataka o

farmaceutskom istraživanju i razvoju, pojavljuje se skup podataka koji se odnose na ponašanje
pacijenata (npr. sklonost promjeni načina života) i raspoloženje (npr. iz društvenih medija) koji su
potencijalno vrijedni ali ga ne drži zdravstveni sektor. Podaci o ponašanju i raspoloženju pacijenata
mogu se koristiti za utjecaj na pridržavanje režima liječenja, utjecaj na čimbenike stila života i utjecaj
na širok raspon wellness aktivnosti.
Mnoge poluge koje identificiramo u sljedećem odjeljku uključuju integraciju više skupova
podataka. Bit će imperativ za organizacije, a vjerojatno i kreatore politike, da smisle kako uskladiti
ekonomske poticaje i prevladati tehnološke prepreke kako bi se omogućilo dijeljenje podataka.
AMERIČKO ZDRAVSTVO MOŽE KORISTI VIŠE POLUGA ZA VELIKE PODATKE
Identificirali smo skup od 15 poluga u pet širokih kategorija koje imaju potencijal za poboljšanje
učinkovitosti i djelotvornosti sektora zdravstvene skrbi iskorištavanjem ogromne količine elektroničkih
informacija koje su, i koje bi mogle postati, dostupne u cijelom zdravstvenom sektoru SAD-a. Gdje je to
moguće, procjenjujemo financijski potencijal primjene ovih poluga u obliku uštede troškova,
povećane učinkovitosti, poboljšane učinkovitosti liječenja i povećanja produktivnosti. Do ovih smo
procjena došli pozivajući se na najbolju međunarodnu i američku praksu (više pojedinosti potražite
u dodatku). Pod pretpostavkom da američki sustav zdravstvene skrbi uklanja strukturne prepreke i
postavlja prave poticaje za različite dionike, procjenjujemo da veliki podaci mogu pomoći u otključavanju
više od 300 milijardi dolara godišnje dodatne vrijednosti u cijelom sektoru. Iznos koji će sektor realno
ostvariti ovisit će o zajedničkom djelovanju zdravstvenih organizacija i kreatora politike u prevladavanju
strukturnih i drugih prepreka.
Usredotočeni smo na poluge koje zahtijevaju analizu velikih skupova podataka koji se prvenstveno
odnose na razvoj i pružanje skrbi, a ne na sve HIT poluge kao što je automatizacija u obradi
zahtjeva. Naše procjene nemaju za cilj obuhvatiti cjelokupnu vrijednost koju je generirao HIT (npr.
isključujemo vrijednost koja u osnovi ne zahtijeva analizu velikih skupova podataka, kao što je
vrijeme koje su liječnici i medicinske sestre uštedjeli pri prepisivanju bilješki pomoću EMR-a ili
ušteda učinkovitosti i povećani pristup skrbi putem mobilnog zdravlja). Kako bismo potvrdili naše
nalaze, usporedili smo naše procjene s onima drugih istraživača i ustanovili da su usporedive (vidi
dodatak).
Poluge dijelimo u pet širokih kategorija: kliničke operacije, plaćanje/cijene, istraživanje i razvoj, novi
poslovni modeli i javno zdravstvo. Sada raspravljamo o svakom redom:
Kliničke operacije Unutar
kliničkih operacija pet je poluga velikih podataka koje uglavnom utječu na način na koji pružatelji
usluga, obveznici plaćanja i PMP pružaju kliničku skrb. Procjenjujemo da bi, ako se potpuno iskoriste,
ovih pet poluga moglo smanjiti nacionalne izdatke za zdravstvo do 165 milijardi dolara godišnje u
odnosu na 2,5 trilijuna dolara u 2009. godini.
44
1. Komparativno istraživanje učinkovitosti. Istraživanje temeljeno na ishodima utvrđuje koji će

tretmani biti najbolji za određene pacijente ("optimalni putovi liječenja") analizom
sveobuhvatnih podataka o pacijentima i ishodima radi usporedbe učinkovitosti različitih
intervencija. Ovo istraživanje uključuje ono što je poznato
kao komparativno istraživanje učinkovitosti (CER). Mnoga su istraživanja pokazala da postoje

velike varijacije u praksi zdravstvene skrbi, ishodima i troškovima među različitim pružateljima
usluga, zemljopisnim područjima i pacijentima. Kritička analiza velikih skupova podataka koji
uključuju karakteristike pacijenata te troškove i ishode liječenja može pomoći u prepoznavanju
klinički najučinkovitijih i najisplativijih tretmana za primjenu. Ako sustav zdravstvene skrbi provodi
CER, postoji potencijal za smanjenje incidenata pretjeranog liječenja – tj. intervencija koje čine
više štete nego koristi – i nedovoljno liječenja – slučajeva u kojima je određena terapija trebala
biti propisana, ali nije. I pretjerano i nedovoljno liječenje dugoročno rezultiraju lošijim ishodima
za pacijente i većim troškovima zdravstvene skrbi.
Diljem svijeta, agencije kao što su NICE u Ujedinjenom Kraljevstvu, Institut für Qualität
und Wirtschaftlichkeit im Gesundheitswesen (Institut za kvalitetu i učinkovitost zdravstvene
skrbi ili IQWIG) u Njemačkoj, Common Drug Review u Kanadi i Australska shema farmaceutskih
beneficija započeti CER programi s uspješnim rezultatima. Sjedinjene Države poduzele su
prvi korak u tom smjeru putem američkog Zakona o oporavku i ponovnom ulaganju iz 2009.
Zakonom je stvoreno Savezno koordinacijsko vijeće za komparativno istraživanje učinkovitosti,
koje, kao što mu ime kaže, koordinira komparativno istraživanje učinkovitosti u saveznoj
vladi i daje preporuke za 400 milijuna dolara izdvojenih za CER. Ako ova poluga želi postići
sustavnu razmjeru u Sjedinjenim Državama, mora prevladati neke značajne prepreke.
Sveobuhvatne i dosljedne skupove kliničkih podataka i podataka o tvrdnjama treba uhvatiti,
integrirati i staviti na raspolaganje istraživačima, a potrebno je pregovarati o brojnim
potencijalnim problemima. Na primjer, u trenutnoj žurbi za uvođenjem EHR-a, potencijalni
nedostatak standarda i interoperabilnosti mogao bi otežati kombiniranje skupova podataka.
Još jedna briga je kako osigurati privatnost pacijenta, a istovremeno pružiti dovoljno detaljne
podatke koji omogućuju učinkovite analize. Nakon što su identificirali optimalne načine
liječenja, platiteljima će se morati dopustiti da vežu odluke o naknadi troškova i dizajn
pogodnosti s rezultatima ovog istraživanja. Međutim, važeći američki zakon zabranjuje
centrima za Medicare i Medicaid usluge korištenje omjera troškova i koristi za odluke o
naknadi troškova. Širenje znanja o najučinkovitijim tretmanima medicinskim stručnjacima
zahtijevat će uvođenje ili nadogradnju alata, uključujući sustave podrške kliničkim odlukama
(vidi sljedeću polugu), tako da liječnici mogu dobiti preporuke najbolje prakse u trenutku
donošenja stvarne odluke o tretmanima.
2. Sustavi podrške kliničkom odlučivanju. Druga poluga je uvođenje sustava za podršku kliničkom
odlučivanju za poboljšanje učinkovitosti i kvalitete operacija. Ovi sustavi uključuju računalne
mogućnosti liječnika za unos naloga. Trenutna generacija takvih sustava analizira unose liječnika
i uspoređuje ih s medicinskim smjernicama kako bi upozorila na moguće pogreške kao što su
neželjene reakcije na lijekove ili događaji. Uvođenjem ovih sustava pružatelji usluga mogu
smanjiti nuspojave i stope pogrešaka u liječenju i zahtjeve za odgovornost, posebno one koji
proizlaze iz kliničkih pogrešaka. U jednoj osobito snažnoj studiji provedenoj na pedijatrijskoj
jedinici za intenzivnu njegu u glavnom gradskom području SAD-a, alat sustava za potporu
kliničkog odlučivanja smanjio je nuspojave i događaje za 40 posto u samo dva mjeseca.41
41 Amy L. Potts, Frederick E. Barr, David F. Gregory, Lorianne Wright i Neal R. Patel,
"Računalni unos liječničkih naloga i pogreške u liječenju u pedijatrijskoj jedinici za intenzivnu njegu,"
Pediatrics 113(1), 2004: 59–63.
U budućnosti, sustavi velikih podataka kao što su ovi mogu postati znatno inteligentniji
uključivanjem modula koji koriste analizu i prepoznavanje slike u bazama podataka
medicinskih slika (X-zrake, CT, MRI) za preddijagnostiku ili koji automatski istražuju medicinsku
literaturu za stvaranje medicinske baza podataka stručnjaka koja može liječnicima predložiti
mogućnosti liječenja na temelju medicinske dokumentacije pacijenata. Osim toga, sustavi
podrške kliničkom odlučivanju mogu omogućiti veći dio posla medicinskim sestrama i
liječničkim pomoćnicima automatiziranjem i olakšavanjem savjetodavne uloge liječnika i time
poboljšavanjem učinkovitosti skrbi za pacijente.
3. Transparentnost medicinskih podataka. Treća klinička poluga velikih podataka je analiza

podataka o medicinskim postupcima i stvaranje transparentnosti oko tih podataka kako bi se
identificirale mogućnosti izvedbe za medicinske stručnjake, procese i ustanove te kako bi se
pomoglo pacijentima da kupe skrb koja nudi najbolju vrijednost.
Skupovi podataka o radu i izvedbi iz postavki pružatelja mogu se analizirati kako bi se

izradile mape procesa i nadzorne ploče koje omogućuju transparentnost informacija. Cilj je
identificirati i analizirati izvore varijabilnosti i otpada u kliničkim procesima, a zatim optimizirati
procese. Mapiranje procesa i fizičkih tokova kao i "putovanja pacijenata" unutar organizacije
mogu pomoći u smanjenju kašnjenja u sustavu. Jednostavno objavljivanje podataka o
troškovima, kvaliteti i izvedbi, čak i bez opipljive financijske nagrade, često stvara konkurenciju
koja potiče poboljšanja izvedbe. Operativno usklađivanje koje proizlazi iz ovih analiza može
proizvesti smanjene troškove kroz lean procese, dodatni potencijal prihoda od oslobođenih
kapaciteta, učinkovitije osoblje koje odgovara potražnji, poboljšanu kvalitetu skrbi i bolja
iskustva pacijenata. Centres for Medicare and Medicaid Services testira nadzorne ploče kao dio
inicijative za implementaciju načela otvorene vlade transparentnosti, sudjelovanja javnosti i
suradnje. U istom duhu, Centri za kontrolu i prevenciju bolesti počeli su objavljivati zdravstvene
podatke u interaktivnom formatu i pružati napredne značajke za manipuliranje svojim unaprijed
tabličnim podacima.
Objavljivanje podataka o kvaliteti i učinku također može pomoći pacijentima da donose

informiranije odluke o zdravstvenoj skrbi u usporedbi s današnjom situacijom u kojoj
su im razlike u cijeni i kvaliteti uvelike nejasne.42 Transparentnost podataka o cijeni i kvaliteti,
zajedno s odgovarajućim shemama naknade (npr. , gdje su troškovi iz vlastitog džepa
pacijenata povezani sa stvarnim troškovima koje naplaćuju pružatelji usluga) potaknut će
pacijente da zauzmu pristup koji je svjesniji vrijednosti u potrošnji zdravstvene skrbi, što će
zauzvrat pomoći da pružatelji usluga budu konkurentniji i u konačnici poboljšati ukupne
performanse sektora.
4. Daljinsko praćenje pacijenata. Četvrta klinička poluga velikih podataka je prikupljanje podataka
iz daljinskog praćenja pacijenata za kronično bolesne pacijente i analiziranje dobivenih
podataka za praćenje pridržavanja (određivanje rade li pacijenti stvarno ono što je
propisano) i za poboljšanje budućih lijekova i mogućnosti liječenja. Procjenjuje se da je 150
milijuna pacijenata u Sjedinjenim Američkim Državama 2010. bilo kronično bolesno od bolesti
kao što su dijabetes, kongestivno zatajenje srca i hipertenzija, te su činili više od 80 posto
troškova zdravstvenog sustava te godine. Sustavi za daljinsko praćenje pacijenata mogu biti
vrlo korisni za liječenje takvih pacijenata. Sustavi uključuju uređaje koji prate stanje srca, šalju
informacije o razinama šećera u krvi, prenose povratne informacije od njegovatelja, pa čak
uključuju i tehnologiju "čip na piluli"—lijekove koji djeluju kao instrumenti za izvješćivanje kada
ih pacijent proguta— koji dostavlja podatke u gotovo stvarnom vremenu elektroničkim
42 Razlike u troškovima mogu biti prilično značajne. Na primjer, cijena kolonoskopije može varirati
faktor šest unutar područja San Francisca.
46
baze podataka medicinskih kartona. Jednostavno upozoravanje liječnika da pacijent

s kongestivnim zatajenjem srca dobiva na težini zbog zadržavanja vode može
spriječiti hitnu hospitalizaciju. Općenitije, korištenje podataka iz sustava daljinskog
nadzora može smanjiti broj dana pacijenta u bolničkom krevetu, smanjiti posjete
odjelima hitne pomoći, poboljšati ciljanje njege u domovima za starije osobe i posjete
liječniku izvan bolnice te smanjiti dugoročne zdravstvene komplikacije.
5. Napredna analitika primijenjena na profile pacijenata. Peta velika klinička operacija

data lever primjenjuje naprednu analitiku na profile pacijenata (npr. segmentaciju i prediktivno
modeliranje) kako bi identificirao pojedince koji bi imali koristi od proaktivne skrbi ili promjena
načina života. Na primjer, ovi pristupi mogu pomoći u identificiranju pacijenata koji su pod
visokim rizikom od razvoja određene bolesti (npr. dijabetesa) i koji bi imali koristi od programa
preventivne skrbi. Ovi pristupi također mogu omogućiti bolji odabir bolesnika s već postojećim
stanjem za uključivanje u program upravljanja bolešću koji najbolje odgovara njihovim
potrebama. I, naravno, podaci o pacijentima mogu pružiti poboljšanu sposobnost mjerenja
uspjeha ovih programa, što je vježba koja predstavlja veliki izazov za mnoge trenutne
programe preventivne skrbi.
Plaćanje/cijene
Dvije poluge u ovoj kategoriji uglavnom uključuju poboljšanje plaćanja i cijena zdravstvene
zaštite, a prvenstveno su usmjerene na poslovanje obveznika. Zajedno imaju potencijal
stvoriti vrijednost od 50 milijardi dolara, od čega bi polovica rezultirala uštedama troškova
nacionalne zdravstvene skrbi.
1. Automatizirani sustavi. Prva poluga je implementacija automatiziranih sustava (npr. tehnika

strojnog učenja kao što su neuronske mreže) za otkrivanje prijevara i provjeru točnosti
i dosljednosti potraživanja platitelja. Američka industrija platitelja procjenjuje da je 2 do 4
posto godišnjih potraživanja lažno ili neopravdano; službene procjene za Medicare i
Medicaid kreću se do 10 posto udjela. Uštede se mogu postići kroz sveobuhvatnu i dosljednu
bazu podataka o zahtjevima (npr. predloženu bazu podataka o zahtjevima za sve platiše) i
uvježbane algoritme za obradu i provjeru točnosti zahtjeva i otkrivanje slučajeva s velikom
vjerojatnošću prijevare, nedostataka ili netočnosti, bilo retroaktivno ili u stvarnom vremenu.
Kada se koriste u gotovo stvarnom vremenu, ovi automatizirani sustavi mogu identificirati
preplaćena sredstva prije isplate, nadoknađujući značajne troškove.
2. Zdravstvena ekonomika i rezultati istraživanja i temeljeni na učinku

planovi cijena. Druga poluga je korištenje zdravstvene ekonomije i istraživanja ishoda i
cjenovnih planova temeljenih na učinku koji se temelje na podacima o ishodima
pacijenata iz stvarnog svijeta kako bi se postigla poštena ekonomska naknada, od cijena
lijekova koje se plaćaju farmaceutskim tvrtkama do naknada koje pružateljima isplaćuju platitelji.
U slučaju određivanja cijena lijekova, farmaceutske tvrtke dijelile bi dio terapijskog rizika.
Za platitelje, ključna korist je da sheme podjele troškova i rizika za nove lijekove omogućuju
kontrolu ili ograničenje značajnog dijela potrošnje na zdravstvenu skrb. U isto vrijeme, PMP
tvrtke mogle bi dobiti bolji pristup tržištu uz snažne napore da se obuzdaju troškovi
zdravstvene skrbi. PMP tvrtke također mogu osigurati potencijalno veći prihod od
učinkovitije upotrebe lijekova putem inovativnih shema određivanja cijena. Pacijenti bi
dobili poboljšane zdravstvene ishode uz formular temeljen na vrijednosti i dobili pristup
inovativnim lijekovima po razumnoj cijeni. Da bi se postigla maksimalna vrijednost za sustav
zdravstvene skrbi, Sjedinjene Države trebale bi omogućiti kolektivno pregovaranje platitelja.
U tijeku je nekoliko pilot programa određivanja cijena lijekova koji se temelje na ekonomici zdravlja
i istraživanju ishoda, prvenstveno u Europi. Novartis se, na primjer, dogovorio s njemačkim zdravstvenim
osiguravateljima da će pokriti troškove veće od 315 milijuna eura (468 milijuna dolara) godišnje za
Lucentis, njegov lijek za liječenje makularne degeneracije povezane sa starenjem.
Neki platitelji također mjere troškove i kvalitetu pružatelja usluga i dogovaraju naknade
na temelju podataka. Na primjer, obveznici mogu isključiti pružatelje usluga čiji su troškovi liječenja
različitih bolesti izvan okvira nakon prilagodbe za komorbiditete (prisutnost jedne ili više bolesti uz
primarnu bolest). Alternativno, mogu pregovarati o inovativnim cjenovnim planovima, kao što su plaćanja
temeljena na rezultatima, ako pružatelji postignu određene standarde kvalitete i ishoda.
istraživanje i razvoj
Pet poluga velikih podataka moglo bi poboljšati produktivnost istraživanja i razvoja u podsektoru PMP-a.
Zajedno bi te poluge mogle stvoriti vrijednost veću od 100 milijardi dolara, od čega bi oko 25 milijardi moglo
biti u obliku nižih nacionalnih rashoda za zdravstvo.
1. Prediktivno modeliranje. Prva poluga je agregacija istraživačkih podataka kako bi PMP tvrtke mogle
izvesti prediktivno modeliranje za nove lijekove i odrediti najučinkovitiju i isplativu raspodjelu resursa
za istraživanje i razvoj. Ovo “racionalno
dizajn lijeka” znači korištenje simulacija i modeliranja na temelju pretkliničkih ili ranih kliničkih
skupova podataka duž lanca vrijednosti istraživanja i razvoja za predviđanje kliničkih ishoda što je
brže moguće. Čimbenici procjene mogu uključivati sigurnost proizvoda, učinkovitost, potencijalne
nuspojave i ukupne rezultate ispitivanja. Ovo prediktivno modeliranje može smanjiti troškove
obustavom istraživanja i skupih kliničkih ispitivanja suboptimalnih spojeva ranije u istraživačkom
ciklusu.
Prednosti ove poluge za PMP sektor uključuju niže troškove istraživanja i razvoja i ranije
prihod od manjeg, bržeg i više ciljanog istraživanja i razvoja. Poluga pomaže bržem plasiranju
lijekova na tržište i proizvodnji više ciljanih spojeva s većim potencijalnim tržištem i stopom
terapeutskog uspjeha. Prediktivno modeliranje može smanjiti 3 do 5 godina od otprilike 13 godina koliko
je potrebno da se nova smjesa iznese na tržište.
2. Statistički alati i algoritmi za poboljšanje dizajna kliničkog ispitivanja. Druga je poluga korištenje
statističkih alata i algoritama za poboljšanje dizajna kliničkih ispitivanja i ciljanje regrutiranja pacijenata
u kliničkim fazama procesa istraživanja i razvoja. Ova poluga uključuje rudarenje podataka o
pacijentima kako bi se ubrzala klinička ispitivanja procjenom izvedivosti regrutiranja pacijenata,
preporukom učinkovitijih dizajna protokola i sugeriranjem mjesta ispitivanja s velikim brojem
potencijalno prihvatljivih pacijenata i dobrim rezultatima. Tehnike koje se mogu primijeniti uključuju
izvođenje simulacija scenarija i modeliranje kako bi se optimizirala veličina etikete (raspon indikacija
primjenjivih na određeni lijek) kako bi se povećala vjerojatnost stope uspjeha ispitivanja. Algoritmi
mogu kombinirati podatke istraživanja i razvoja i ispitivanja s komercijalnim modeliranjem i povijesnim
regulatornim podacima kako bi pronašli optimalni kompromis između veličine i karakteristika ciljane
populacije pacijenata za ispitivanja i šanse za regulatorno odobrenje novog spoja. Analize također
mogu poboljšati proces odabira istražitelja usmjeravanjem na one s dokazanim rezultatima.
3. Analiza podataka kliničkih ispitivanja. Treća poluga povezana s istraživanjem i razvojem je analiza podataka
kliničkih ispitivanja i zapisa pacijenata kako bi se identificirale dodatne indikacije i otkrile nuspojave.
Može biti promjena položaja lijeka ili marketing za dodatne indikacije

48
moguće nakon statističke analize velikih skupova podataka o rezultatima za otkrivanje signala dodatnih
koristi. Analiza prikupljanja izvješća o nuspojavama (gotovo) u stvarnom vremenu omogućuje
farmakovigilanciju, otkrivanje sigurnosnih signala koji su previše rijetki da bi se pojavili u tipičnom
kliničkom ispitivanju ili, u nekim slučajevima, identificiranje događaja koji su bili nagoviješteni u kliničkim
ispitivanjima, ali koji nisu imali dovoljno statistička snaga.
Ovi analitički programi mogu biti osobito važni u sadašnjem kontekstu u kojemu je godišnja povlačenja
lijekova u 2008. godini dosegnula rekordnu razinu svih vremena, a ukupni broj novih odobrenja za lijekove
opada. Povlačenje lijekova često je vrlo javno štetno za tvrtku. Uklanjanje lijeka protiv bolova Vioxx s
tržišta 2004. rezultiralo je oko 7 milijardi dolara pravnih i odštetnih troškova za Merck i 33-postotni pad
vrijednosti za dioničare u samo nekoliko dana.
4. Personalizirana medicina. Još jedna obećavajuća inovacija velikih podataka koja bi mogla
stvaranje vrijednosti u areni istraživanja i razvoja je analiza velikih skupova podataka u nastajanju (npr.
podaci o genomu) za poboljšanje produktivnosti istraživanja i razvoja i razvoj personalizirane medicine.
Cilj ove poluge je ispitati odnose između genetske varijacije, predispozicije za specifične bolesti i specifičnih
odgovora na lijekove, a zatim objasniti genetsku varijabilnost pojedinaca u procesu razvoja lijeka.
Personalizirana medicina obećava poboljšanje zdravstvene skrbi na tri glavna načina: nudi rano
otkrivanje i dijagnozu prije nego što pacijent razvije simptome bolesti; učinkovitije terapije jer se pacijenti
s istom dijagnozom mogu segmentirati prema podudaranju molekularnih potpisa (tj. pacijenti s istom
bolešću često ne reagiraju na isti način na istu terapiju, dijelom zbog genetske varijacije); i prilagođavanje
doza lijeka prema molekularnom profilu pacijenta kako bi se smanjile nuspojave i maksimalizirao odgovor.
Personalizirana medicina je u ranoj fazi razvoja. Zabilježeni su impresivni početni uspjesi, osobito u
ranom otkrivanju raka dojke, u prenatalnom testiranju gena i testiranju doze u liječenju leukemije i raka
debelog crijeva. Procjenjujemo da bi potencijal za uštedu troškova smanjenjem propisivanja lijekova na
koje pojedini pacijenti ne reagiraju mogao iznositi 30 do 70 posto ukupnih troškova u nekim slučajevima.
Isto tako, ranije otkrivanje i liječenje mogli bi značajno smanjiti teret raka pluća za zdravstvene sustave, s
obzirom na to da su troškovi operacije u ranom stadiju približno upola manji od troškova liječenja u
kasnom stadiju.
5. Analiza obrazaca bolesti. Peta poluga za stvaranje vrijednosti velikih podataka povezana s istraživanjem i razvojem je
analiziranje obrazaca bolesti i trendova za modeliranje buduće potražnje i troškova te donošenje
strateških odluka o ulaganju u istraživanje i razvoj. Ova analiza može pomoći PMP tvrtkama da
optimiziraju fokus svog istraživanja i razvoja kao i raspodjelu resursa uključujući opremu i
osoblje.
Novi poslovni modeli
Proliferacija digitalnih zdravstvenih podataka, od kliničkih do informacija o zahtjevima, stvara poslovne
modele koji mogu nadopuniti ili se natjecati s postojećim i njihovim polugama. Ističemo dva potencijalna nova
poslovna modela:
1. Skupljanje i sintetiziranje kliničkih zapisa pacijenata i skupova podataka o zahtjevima.
Prva vrsta novog poslovnog modela je onaj koji agregira i analizira kartone pacijenata kako bi pružio
podatke i usluge trećim stranama. Tvrtke bi mogle izgraditi robusne skupove kliničkih podataka koji bi
omogućili brojne susjedne tvrtke.
To može uključivati licenciranje i analizu podataka o kliničkim ishodima za platitelje i regulatore kako
bi se poboljšalo donošenje kliničkih odluka, koristeći baze podataka pacijenata

pomoći PMP tvrtkama da identificiraju pacijente koji ispunjavaju određene kriterije za

uključivanje u kliničko ispitivanje ili omogućiti pristup kliničkim bazama podataka za
otkrivanje biomarkera koji pomažu pri odabiru tretmana. Susjedno tržište koje se
razvija ne samo da pruža usluge temeljene na kliničkim zapisima pacijenata, već također
integrira skupove podataka o zahtjevima za pružanje usluga PMP sektoru za istraživanje
i razvoj i komercijalno modeliranje. Tržišta kliničkih podataka i podataka o zahtjevima i
usluga tek se počinju razvijati i rasti—stopa njihova širenja ovisit će o tome koliko brzo
industrija zdravstvene skrbi implementira elektroničke medicinske zapise i medicinu
utemeljenu na dokazima.
2. Online platforme i zajednice. Još jedan potencijalni novi poslovni model

omogućen velikim podacima jest on-line platforme i zajednice koje već generiraju vrijedne
podatke. Primjeri ovog poslovnog modela u praksi uključuju web stranice kao što su
PatientsLikeMe.com, gdje pojedinci mogu podijeliti svoja iskustva kao pacijenti u sustavu;
Sermo.com, forum za liječnike koji dijele svoje medicinske uvide; i Participatorymedicine.org,
web mjesto koje je učinila dostupnom neprofitna organizacija koja potiče aktivizam
pacijenata. Ove online platforme mogle bi postati vrijedan izvor podataka. Na primjer, Sermo
naplaćuje PMP sektoru za pristup svojim liječnicima članovima i informacijama iz njihovih
interakcija na stranici.
Javno zdravstvo
Korištenje velikih podataka može poboljšati javnozdravstveni nadzor i odgovor.

Koristeći nacionalnu bazu podataka o pacijentima i liječenju, službenici javnog zdravstva
mogu osigurati brzo, koordinirano otkrivanje zaraznih bolesti i sveobuhvatan nadzor
izbijanja bolesti i odgovor kroz Integrirani program nadzora i odgovora na bolesti. Ova poluga
nudi brojne prednosti, uključujući manji broj zahtjeva i isplata, zahvaljujući pravovremenoj
javnozdravstvenoj reakciji koja bi rezultirala nižom pojavnošću infekcija. Sjedinjene Države
bi također bile bolje pripremljene - u smislu laboratorijskih kapaciteta, na primjer - za nove
bolesti i izbijanja. Također bi se povećala svijest javnosti o zdravstvenim rizicima povezanim sa
zaraznim bolestima, što bi zauzvrat smanjilo mogućnost zaraze zahvaljujući točnim i
pravovremenim javnozdravstvenim savjetima. Uzete zajedno, sve te komponente pomogle bi
boljoj kvaliteti života.
BIG DATA MOŽE OMOGUĆITI VIŠE OD 300 MILIJARDI USD GODIŠNJE

STVARANJE VRIJEDNOSTI U NAŠEM ZDRAVSTVU
Sve poluge s omogućenim velikim podacima koje smo opisali mogu odigrati značajnu
ulogu u preispitivanju produktivnosti američkog zdravstvenog sustava, poboljšanju
kvalitete skrbi i liječenja, poboljšanju iskustva pacijenata, jačanju konkurentnosti industrije
i stvaranju niza svježi poslovni modeli i usluge.
Ukupno procjenjujemo da bi zdravstvo SAD-a moglo ostvariti vrijednost veću od 300
milijardi dolara svake godine, s dvije trećine toga u obliku smanjenja rashoda za nacionalnu
zdravstvenu skrb od oko 8 posto. Održavanje ishoda zdravstvene skrbi konstantnima
(konzervativna pretpostavka s obzirom na to da će mnoge poluge poboljšati kvalitetu
zdravstvene skrbi, što je teško kvantificirati), uzimanje u obzir godišnjih operativnih troškova
i pretpostavka da potencijal vrijednosti svake poluge velikih podataka raste linearno s rashodima
za zdravstvenu skrb , to bi značilo da bi godišnja produktivnost američkog zdravstvenog
sektora mogla porasti za dodatnih 0,7 posto. Ovo povećanje produktivnosti pretpostavlja da
industrija ostvari sve potencijalne koristi od korištenja velikih podataka tijekom sljedećih deset
godina (Prikaz 15).43 Kao što smo rekli, stvarna količina vrijednosti koju će sektor
43 Ovaj izračun uzima u obzir tekuće operativne troškove EMR-a u cijeloj zemlji, procijenjene na oko 20
milijardi dolara godišnje, nakon početnog postavljanja (procijenjeno na do 200 milijardi dolara).
Pogledajte dodatak za naš izračun produktivnosti.
50
obuhvat će ovisiti o zajedničkom djelovanju zdravstvenih organizacija i kreatora politike u

prevladavanju strukturnih i drugih prepreka.
Prednosti ovih dramatičnih potencijalnih poboljšanja pritekli bi pacijentima,

davateljima usluga, obveznicima plaćanja i PMP sektoru. Međutim, korištenje ovih
poluga također bi redistribuiralo vrijednost među igračima u cijeloj industriji kako se prihodi
i profiti mijenjaju i pojavljuju se novi, maštoviti lideri.
Prikaz 15
Procijenjena dugoročna vrijednost identificiranih poluga je Izravno smanjenje nacionalnih

rashoda za zdravstvo
više od 300 milijardi dolara, s potencijalno više od 200
Nejasan utjecaj na nacionalne
milijardi dolara uštede na državnoj potrošnji za zdravstvo izdatke za zdravstvenu skrb
Potencijal vrijednosti od korištenja velikih podataka
milijardu dolara godišnje
Primjeri poluga
Prediktivno modeliranje za određivanje raspodjele resursa za

istraživanje i razvoj 25 82 108
istraživanje i razvoj, dizajn kliničkih ispitivanja i personaliziranu medicinu
Kliničke Komparativno istraživanje učinkovitosti (CER), sustav podrške

165 165 kliničkom odlučivanju i nadzorne ploče za transparentnost
operacije
kliničkih podataka
Računovodstvo/ Napredni algoritmi za otkrivanje prijevara, određivanje cijena

27 47
cijene lijekova na temelju učinka
Javno zdravstvo 9 Sustavi nadzora i odgovora na javno zdravlje
Novi poslovni Agregacija zapisa o pacijentima radi pružanja skupova podataka i

5
modeli uvida; online platforme i zajednice
Potencijal
226 107 333
ukupne bruto vrijednosti1
1 Isključujući početna IT ulaganja (~120 – 200 milijardi USD) i godišnje operativne troškove (~20 milijardi USD godišnje).
IZVOR: Razgovori stručnjaka; pretraživanje tiska i literature; Analiza McKinsey Global Institute
Pacijenti bi vidjeli niže troškove za bolju skrb i imali bi širi, jasniji pristup većem broju
informacija o zdravstvenoj skrbi, što bi ih učinilo informiranijim potrošačima medicinskog
sustava. Pacijenti bi mogli usporediti ne samo cijene lijekova, tretmana i liječnika, već i njihovu
relativnu učinkovitost, što bi im omogućilo odabir učinkovitijih, bolje ciljanih lijekova, od
kojih su mnogi prilagođeni njihovom osobnom genetskom i molekularnom sastavu. Pacijenti
bi također imali pristup širem spektru informacija o epidemijama i drugim javnozdravstvenim
informacijama ključnim za njihovu dobrobit.
Pružatelji usluga, obveznici plaćanja i PMP sektor iskusit će različite prednosti od primjene
poluga velikih podataka. Moraju biti svjesni posljedičnih promjena vrijednosti i promjena
poslovnih modela. Neke bi poluge trebale donijeti dodatnu vrijednost svim dionicima.
Na primjer, sprječavanjem neželjenih događaja vezanih uz lijekove, sustavi podrške
kliničkim odlukama trebali bi dovesti do manje tužbi za odgovornost za platitelje, nižih
stopa osiguranja od nesavjesnog liječenja za pružatelje usluga i boljih ishoda za pacijente.
Međutim, u slučaju drugih poluga, jedan bi igrač mogao dobiti na račun drugoga, rezultat
koji bi se odrazio na cijelu industriju, stvarajući pobjednike i gubitnike na kraju. U slučaju
usvajanja komparativnog istraživanja učinkovitosti, na primjer, pružatelji usluga mogli bi
vidjeti smanjenje svojih prihoda za tretmane za koje se utvrdi da nisu optimalno učinkoviti.
Daljinski nadzor pacijenata još je jedan primjer. Ova poluga će smanjiti pogreške i štetne
učinke liječenja te će poboljšati kvalitetu skrbi i života osoba s kroničnim bolestima. Ali to
će postići smanjenjem potrebe za liječenjem u općim bolnicama i smanjenjem nuspojava
lijekova, nagrizajući neke tradicionalne izvore prihoda za bolnice i klinike.
Potencijal za smanjenje prihoda mogao bi se pokazati kao poticaj za bolnice i klinike da potraže
načine za sudjelovanje u valu novih poslovnih modela i prilika koje poluge velikih podataka
pomažu stvoriti. Te organizacije mogu, na primjer, pokušati analizirati i koristiti baze podataka
pacijenata kako bi proširile svoju ponudu preventivne skrbi. Pojavit će se, naravno, i posve novi
poslovni modeli. Na primjer, osobna zdravstvena evidencija koju nude Google Health i Microsoft
Healthvault omogućuje potrošačima stvaranje osobnih zdravstvenih profila i ciljeva, praćenje
tretmana i recepata te praćenje njihovih iskustava kao pacijenata.
VELIKI PODACI IMAJU ZNAČAJNE IMPLIKACIJE ZA ZDRAVSTVENU ZAŠTITU
IZVRŠNI LUKCI I KREATORI POLITIKA
Opće je poznato da planovi nadoknade zdravstvenih troškova koji se koriste u Sjedinjenim

Državama pružaju malo poticaja za prepoznavanje otpada, rješavanje poznatih operativnih
neučinkovitosti ili poboljšanje produktivnosti. Ti se planovi temelje na plaćanjima za aktivnosti,
uključujući dijagnostičke testove, recepte za lijekove, posjete liječniku i naručene postupke, a ne na
dokazanim zdravstvenim ishodima. Oni nagrađuju veliki obujam aktivnosti, a ne kvalitetu, učinkovitost
ili čak nužnost te aktivnosti.
Prelazak na modele nadoknade temeljene na učinku i ishodu pomoći će u usklađivanju poticaja

koji mogu pomoći u usvajanju ovih poluga. Platitelji i njihovi klijenti mogu potaknuti takve
promjene, što im omogućuju regulatori. Američko ministarstvo za pitanja veterana i agencije u
Ujedinjenom Kraljevstvu, Italiji i Njemačkoj, među ostalima, rade na programima koji temelje
plaćanje na učinkovitosti i rezultatima pacijenata. Poboljšanje kvalitete i dostupnosti informacija
o usporedbama liječenja, lijekova, liječnika i bolnica pomoći će u promjeni ovog modela. Već
postoje neki napori da se ocijene bolnice i liječnici i da se stvori transparentnost u vezi s
troškovima različitih usluga, a te inicijative dobivaju određeni značaj kod javnosti i poslodavaca.
Ali svi ovi poticaji usmjereni na rezultate morat će postati ugrađeni i široko prihvaćeni u
zdravstvenoj skrbi SAD-a ako poluge velikih podataka o kojima smo raspravljali žele postati sastavni
dio sustava i ako se njihovoj vrijednosti želi u potpunosti pristupiti.
Jasno je da primjereno usklađeni poticaji mogu potaknuti dionike da prihvate velike podatkovne
poluge za poboljšanje učinka. Farmaceutska industrija očit je primjer. Industrija je počela rudariti
i skupljati podatke o prodaji i receptima jer je ova poluga pomogla tvrtkama da poboljšaju svoju
krajnju vrijednost učinkovitijim ciljanjem prodaje, upravljanjem resursima prodajnog osoblja i
odabirom glavnih područja za istraživanje i razvoj.
U isto vrijeme, pružatelji usluga će morati značajno uložiti u uvođenje sustava elektroničkih
medicinskih zapisa, koji pružaju temelj za provođenje komparativnih istraživanja učinkovitosti
liječenja i lijekova. Neke procjene navode da se taj trošak kreće od 80 000 do 100 000 USD po
krevetu.44 Iako će davatelji usluga imati značajne koristi od korištenja takvih sustava (npr.
ušteda vremena od izvlačenja i održavanja papirnatih kartona), primarna ušteda će se prikupiti
platiteljima i pacijentima od identifikacije najviše učinkovite tretmane i manje nuspojava lijekova.
Opet, financijski poticaji morali bi se preusmjeriti - možda kroz vladinu intervenciju - prije nego što
se u cijeloj zemlji dogodi usvajanje elektroničkih medicinskih zapisa i informacijske tehnologije
zdravstvene skrbi.
Osim strukturalnih problema, rukovoditelji u zdravstvu morat će prevladati izazove povezane s

tehnologijom, pristupom podacima, talentom i promjenom načina razmišljanja i ponašanja kako
bi iskoristili vrijednost velikih podataka. Tehnološki zahtjevi uvelike će varirati među podsektorima
44 Francois M. Laflamme, Wayne E. Pietraszek i Nilesh V. Rajadhyax, “Reforma bolnica

s IT ulaganjem,” McKinsey Quarterly, kolovoz 2010.
52
i organizacije. Na primjer, često će biti potrebna značajna kapitalna ulaganja kako bi se

modernizirali i standardizirali IT sustavi i učinili ih kompatibilnima za optimizaciju stvaranja
vrijednosti koja se može prikupiti iz velikih podataka. Do danas, smisleno usvajanje elektroničkih
medicinskih zapisa i dalje se kreće oko 20 posto; dostupnost federalnih poticaja mogla bi pomoći
u povećanju te stope.45 Za mnoge pružatelje usluga, postavljanje tehnologije za generiranje i
snimanje digitalnih kliničkih podataka ključni je prvi korak. To će samo po sebi biti ogroman izazov
jer je poznato da je velike IT projekte teško izvesti.46 Jednako važan zadatak je osigurati da su
uspostavljeni interoperabilni standardi kako bi podacima generiranim kod jednog pružatelja
drugi mogao pristupiti u korisnom obliku. .
Za sofisticiranije PMP tvrtke, potrebna poboljšanja tehnologije velikih podataka mogu

uključivati pružanje dovoljno prostora za pohranu ili implementaciju napredne analitike. Za
druge će tehnološki izazovi uključivati konsolidaciju fragmentiranih internih baza podataka i
njihovu usklađivanje jedna s drugom u formatu koji će omogućiti da integrirani prikaz informacija
bude dostupan prema potrebi. U mnogim je organizacijama interna dostupnost i dostupnost
različitih baza podataka i dalje ozbiljno ograničena.
Snaga mnogih poluga velikih podataka koje smo opisali ovisi o pristupu podacima—i to
često na razini većoj od one koju generira pojedinačna organizacija.
Ove poluge mogu zahtijevati kombiniranje različitih skupova podataka kao što su zapisi
pacijenata i podaci o kliničkim zahtjevima. Dionici u industriji često ne dijele postojeće skupove
podataka zbog pravnih ograničenja kao što su zakoni o privatnosti, nedostatak poticaja ili
nekompatibilni IT sustavi ili formati. Osjetljiva priroda zdravstvenih informacija i mogućnost
diskriminacije koja se temelji na njima čini sigurnost i zaštitu prava na privatnost kritičnom.
Mnoge zemlje imaju propise kao što su HIPAA i HITECH, američki zakoni osmišljeni za zaštitu
sigurnosti i privatnosti zdravstvenih zapisa. Kako korištenje velikih podataka postaje sve
važnije za industriju, kreatori politika će možda morati preispitati ove zakone ili intervenirati
kako bi osigurali da je pristup podacima dostupan na sigurnom
način koji također omogućuje optimizaciju ishoda zdravstvene skrbi.
Naposljetku, poteškoće u zapošljavanju i zadržavanju pravog talenta i stvaranju ispravnog

načina razmišljanja unutar institucija među najtvrdoglavijim su preprekama u iskorištavanju
vrijednosnih prilika velikih podataka. Lideri koji razumiju koje vrste vrijednih uvida mogu proizaći
iz podataka i talent koji mogu analizirati velike količine podataka su ključni. Spremnost
zaposlenika da koriste uvide temeljene na podacima u donošenju odluka također je ključna.
Hvatanje ušteda komparativnih istraživanja učinkovitosti, na primjer, zahtijevat će od liječnika
da propisuju najisplativije intervencije prema smjernicama izvedenim iz velikih podataka. Ali
studije u mnogim kliničkim područjima pokazuju da se liječnici često opiru ili se jednostavno
ne pridržavaju takvih smjernica. Postizanje takvog pomaka bit će teško — ali neophodno.
45 Nacionalni centar za zdravstvenu statistiku, Centri za kontrolu i prevenciju bolesti, “Korištenje elektroničkog
medicinskog zapisa/elektroničkog zdravstvenog zapisa od strane ordinacijskih liječnika,” prosinac 2009.;
Ashish K. Jha i sur., "Uporaba elektroničkih zdravstvenih zapisa u američkim bolnicama", New England Journal
of Medicine 360(16), 16. travnja 2009.:1628–38.
46 Za više o izazovima uspješne implementacije IT-a kod pružatelja zdravstvenih usluga i obveznika,
pogledajte “Razbijanje tri vodeće pogrešne percepcije o IT-u u zdravstvenoj skrbi,” Health
International 2010., broj 10.
Američki zdravstveni sektor suočava se s hitnim imperativom postizanja

radikalnog poboljšanja svoje troškovne učinkovitosti. Naše istraživanje pokazuje da
niz poluga koje koriste velike podatke mogu biti ključni čimbenici smanjenja troškova
uz barem održavanje kvalitete zdravstvene skrbi. Međutim, američka zdravstvena
industrija neće postići značajnu vrijednost dostupnu od velikih podataka bez radikalnih
promjena u propisima i poticaja u cijelom sustavu. Postizanje tih promjena bit će teško -
ali potencijalna nagrada je toliko velika da rukovoditelji u zdravstvu i kreatori politike ne bi
trebali zanemariti ove prilike.
54
3b. Uprava javnog sektora (Europska unija)

Vlade u mnogim dijelovima svijeta su pod sve većim pritiskom da povećaju svoju
produktivnost – drugim riječima, učine više s manje. Osobito nakon nedavne globalne
recesije, mnoge su vlade suočene s potrebom da nastave pružati visoku razinu javnih usluga
u vrijeme značajnih proračunskih ograničenja jer nastoje smanjiti velike proračunske deficite
i razine nacionalnog duga nastale nakon što su potrošili javnog novca u velikoj mjeri za
poticanje rasta. Osim pritisaka smanjenja razine duga, mnoge se zemlje suočavaju sa
srednjoročnim do dugoročnim proračunskim ograničenjima uzrokovanim starenjem
stanovništva koja će značajno povećati potražnju za medicinskim i socijalnim uslugama.
Kao što je pokazalo nedavno istraživanje MGI-a, način na koji će se vlade morati nositi
s takvim ograničenjima jest postizanje koraka promjene u njihovoj (često relativno niskoj)
produktivnosti.47 Iako produktivnost u javnom sektoru nije lako izmjeriti, postoje dokazi da
rast produktivnosti javnog sektora zaostaje za rastom produktivnosti privatnog sektora u
mnogim (ili većini) gospodarstava. Eksperimentalne procjene Ureda za nacionalnu statistiku
Ujedinjenog Kraljevstva pokazale su pad produktivnosti u javnom sektoru od 1995. do 2005.,
dok je istraživanje MGI pokazalo pozitivan rast produktivnosti u tržišnom sektoru.48 U
velikoj mjeri, sve lošija produktivnost javnog sektora Ujedinjenog Kraljevstva rezultat je
vladinog sve većeg zapošljavanja.49
Mogu li veliki podaci pomoći javnom sektoru da poveća svoju produktivnost? Kako
bismo pokušali odgovoriti na ovo pitanje, proučavali smo administrativne aktivnosti javnog
sektora, s fokusom na Europu (vidi Okvir 7, “Kako smo proučavali upravu javnog sektora”).
Otkrili smo da poluge velikih podataka, poput povećanja transparentnosti i primjene napredne
analitike, javnom sektoru nude moćan arsenal strategija i tehnika za povećanje produktivnosti
i postizanje viših razina učinkovitosti i djelotvornosti.
Naše istraživanje pokazuje da bi europski javni sektor potencijalno mogao smanjiti
troškove administrativnih aktivnosti za 15 do 20 posto, stvarajući ekvivalent od 150 do 300
milijardi € (223 do 446 milijardi USD)—ili čak i više—u novoj vrijednosti. Ova procjena
uključuje i povećanje učinkovitosti i smanjenje jaza između stvarne i potencijalne naplate
poreznih prihoda. Ove poluge mogle bi ubrzati godišnji rast produktivnosti za do 0,5
postotnih bodova u sljedećih deset godina.
Vjerujemo da veliki podaci mogu igrati sličnu ulogu iu drugim zemljama i regijama.
Druge vlade diljem svijeta suočavaju se s mnogim istim društvenim i ekonomskim
izazovima, a velike podatkovne prilike o kojima raspravljamo u ovoj studiji slučaja
usmjerenoj na Europu primjenjivat će se i drugdje, posebice u drugim razvijenim zemljama i regijama.
47 Vidi Martin N. Baily, Karen Croxson, Thomas Dohrmann i Lenny Mendonca, Imperativ produktivnosti
javnog sektora, McKinsey & Company, ožujak 2011. (www.mckinsey.com/en/ Client_Service/Public_Sector/
Latest_thinking/~/media/McKinsey/ dotcom/client_service/ Public%20Sector/PDFS/
Public%20Sector%20Productivity%20Imperative_March%202011. ashx); i Tony Danker, Thomas
Dohrmann, Nancy Killefer i Lenny Mendonca, "Kako američka vlada može odgovoriti na svoj izazov
produktivnosti?" McKinsey Quarterly, srpanj 2006. (www. mckinseyquarterly.com). Također pogledajte
izvješća MGI-a Izvan štednje: Put do gospodarskog rasta i obnove u Europi, listopad 2010., i Rast i
obnova u Sjedinjenim Državama: Retooling američkog ekonomskog motora, veljača 2011.
(www.mckinsey.com/.mgi).
48 Imajte na umu da se tržišni sektor odnosi na privatni sektor plus onaj dio javnog sektora koji prodaje
dobra ili usluge uz naknadu. Također, treba napomenuti da su podaci o produktivnosti javnog sektora
eksperimentalni, temeljeni na ishodu (neprilagođeni za vrijednost) i podijeljeni s ukupnim inputima, dok
se podaci o produktivnosti tržišnog sektora temelje na dodanoj vrijednosti i inputima rada.
Eksperimentalne procjene su one napravljene korištenjem najsuvremenijih, i stoga neprovjerenih, metodologija.
49 Od štednje do prosperiteta: Sedam dugoročnih prioriteta, McKinsey Global Institute, studeni 2010.
(www.mckinsey.com/mgi).
Okvir 7. Kako smo proučavali upravu javnog sektora

Javni sektor nudi posebne izazove jer je iznimno raznolik u svojim funkcijama i
proračunima. Usredotočili smo se na administraciju u dvije uobičajene vrste vladinih
agencija, porezne i radne, a zatim proširili našu analizu na druge relevantne dijelove vlade.
Administrativni posao nedvojbeno je temelj mnogih funkcija i agencija u javnom sektoru, a
mnogi aspekti ove vrste posla zajednički su agencijama. Administrativni posao obično
uključuje mnoge interakcije s "kupcima" i stvara veliku količinu obrazaca i/ili plaćanja za
obradu.
Klasičan primjer je rad poreznih agencija i agencija za rad. Glavne djelatnosti poreznih
agencija uključuju obradu podnesaka, preglede, naplatu i usluge poreznim obveznicima,
sve u velikom opsegu. Agencije za zapošljavanje obavljaju različite analitičke funkcije,
uključujući ispitivanje tržišta, provjeru kupaca, a zatim distribuciju odgovarajućih
beneficija i usluga zapošljavanja. Druge agencije, uključujući prijevoz i useljeništvo,
imaju slične funkcije i odgovornosti. Aktivnosti privatnog sektora, uključujući obradu
zahtjeva za osiguranje, također uključuju slične administrativne zadatke, a možemo izvući
dodatne uvide iz onoga što znamo o tim aktivnostima u privatnom sektoru.
Započeli smo s provođenjem mikroanaliza poreznih agencija i agencija za rad u kojima

smo identificirali i procijenili veličinu potencijalne vrijednosti koju velike poluge mogu stvoriti.
Zatim smo ekstrapolirali te nalaze kako bismo procijenili vrijednosni potencijal tih poluga u
drugim sličnim odjelima. Neke od poluga koje smo otkrili bile su specifične za porezne
agencije i agencije za rad, uključujući poluge usmjerene na smanjenje poreznog jaza ili
smanjenje lažnih isplata naknada. Međutim, mnoge poluge učinkovitosti kao što su
nadzorne ploče performansi i integracija podataka i kombiniranja relevantni su i za mnoge
druge agencije (pogledajte dodatak za više detalja o našoj metodologiji).
JAVNI SEKTOR SE SUOČAVA SA ZNAČAJNIM UČINKOM
IZAZOV
Europski javni sektor čini gotovo polovicu BDP-a, uključujući transferna plaćanja koja čine oko 20
posto.50 Isključujući transferna plaćanja, oko 10 do 30 posto ovog udjela može se pripisati
administraciji.51 Ovaj visoki udio u ukupnom gospodarskom rezultatu stavlja znatne dugotrajne
dugoročni pritisak na europsku proračunsku i dužničku poziciju—iznad utjecaja nedavne globalne
recesije. Danas su razine javnog duga već visoke, a prethodna istraživanja MGI-a pokazuju da je
proces smanjivanja duga nakon recesije dugotrajan.52
Proračunske pritiske s kojima se suočava europska vlada pogoršava demografsko

starenje kontinenta. Do 2025. godine gotovo 30 posto stanovništva u zrelim gospodarstvima
diljem svijeta bit će u dobi od 60 ili više godina, što je porast u odnosu na 20 posto u 2000.
godini. Socijalna sigurnost, zdravstvo i mirovine suočit će se s rastućom potražnjom (Prikaz 16).
50 OECD statistička baza podataka.
51 Transferna plaćanja redistribuiraju dohodak u tržišnom sustavu. Primjeri uključuju socijalnu skrb (financijsku
pomoć), socijalno osiguranje i državne subvencije za određene tvrtke (firme).
52 Dug i razduživanje: Globalni kreditni balon i njegove ekonomske posljedice, McKinsey

Globalni institut, siječanj 2010. (www.mckinsey.com/mgi).
56
Prikaz 16
Starenje stanovništva bit će teret za državne proračune 2007. godine
Državni rashodi povezani sa starenjem 2035
postotak BDP-a
Zapadna Europa Istočna Europa
(EU–15) (EU–10)
10.2 9.2
Mirovine
12.0 9.6
6.9 4.7
Zdravstvena njega
7.9 5.5
1.3 0.3
Dugotrajna njega
1.9 0,5
18.4 14.2
Ukupno
21.8 15.6
IZVOR: Europska komisija, Gospodarstvo i proračun za EU-27 država članica (2008.–60.)
KAKVE PODATKE GENERIRA UPRAVA U JAVNOM SEKTORU?
Podaci koji se generiraju u upravi javnog sektora prvenstveno su tekstualni ili numerički.
Dakle, u usporedbi sa sektorima kao što je pružanje zdravstvene zaštite koji generiraju
značajne količine multimedijskog sadržaja (opsežne elektroničke slike, na primjer, uz
tekst), nalazimo da uprava javnog sektora ima tendenciju generirati niži — ali još uvijek
značajan — volumen jedinstvenih podataka mjerenih u bajtovima.
Međutim, za razliku od zdravstva, velika većina — do 90 posto — podataka koji se generiraju
u upravi javnog sektora stvara se u digitalnom obliku, dijelom kao rezultat inicijativa e-uprave
poduzetih u posljednjih 15 godina.
Međutim, čak iu zemljama čiji su programi e-uprave najnapredniji, agencije javnog sektora
često ne čine podatke dostupnima na učinkovit način ni u organizacijskim silosima, ni
građanima i poduzećima. Protokoli oblikovanja i unosa često su nedosljedni. Umjesto
elektroničkog premještanja podataka, nije neuobičajeno da zaposlenik jedne agencije
dobije kopiju podataka faksom ili poštom s podacima od druge agencije, iako su ti podaci
možda pohranjeni elektronički. A postoje neka pravila i/ili pravna ograničenja koja
sprječavaju dijeljenje podataka.
Nedostatak transparentnosti podataka o učinku vlade također može biti faktor koji pridonosi
prije spomenutim izazovima produktivnosti. Teško je poboljšati aktivnosti koje se ne mjere,
a relativni nedostatak transparentnosti u metrici učinka i produktivnosti javnog sektora faktor
je koji pridonosi ranije opisanom jazu u produktivnosti.
JAVNI SEKTOR MOŽE KORISTITI POLUGE ZA VELIKE PODATKE U SVAKOJ OD
IDENTIFICIRALI SMO PET KATEGORIJA
Javni sektor u Europi i šire ima priliku primijeniti poluge velikih podataka u svakoj od pet
širokih kategorija koje proizlaze iz našeg istraživanja u različitim sektorima.
Poluge o kojima raspravljamo odnose se na porezne agencije i agencije za rad, ali vjerujemo da njihova
uporaba može biti jednako relevantna iu drugim dijelovima javnog sektora.
1. Stvaranje transparentnosti
I vanjski dionici poput građana i poduzeća i interni dionici
kao što su državni službenici i agencije mogu poboljšati svoju učinkovitost kada podaci iz velikih baza
podataka javnog sektora postanu dostupniji. Na primjer, vladine agencije redovito prikupljaju veliku količinu
podataka o pojedincima i tvrtkama putem raznih regulatornih i drugih prijava. Ipak, građani i tvrtke često
moraju ispunjavati obrasce za koje su neki od podataka već prikupljeni i pohranjeni. Kad bi agencije unaprijed
ispunjavale obrasce za građane i tvrtke iz podataka koji su već pohranjeni u državnim bazama podataka, to
bi uštedjelo vrijeme podnositeljima obrazaca, kao i državnim agencijama koje ne bi morale ponovno unositi
podatke. Prethodno punjenje bi također imalo prednost smanjenja grešaka i ubrzanja vremena obrade.
Zauzimanje ovog pristupa zahtijevalo bi, međutim, prevladavanje političkih i zakonskih prepreka za dijeljenje
podataka.
Švedska porezna uprava unaprijed ispunjava obrasce za svoje građane, uključujući podatke o
prihodima i plaćenim porezima za prethodnu godinu. Agencija omogućuje građanima da te podatke
potvrde ili izmijene putem usluge kratkih poruka (SMS) putem mobitela ili interneta. Potencijalne uštede
vremena za porezne obveznike mogu biti značajne. U Sjedinjenim Američkim Državama, na primjer,
pojedinačni porezni obveznici potroše otprilike 5 do 20 sati ili više na aktivnosti prijave poreza. Prethodno
ispunjavanje također može znatno uštedjeti vrijeme poreznim vlastima. Jedna je porezna uprava uspjela
preraspodijeliti oko 15 posto osoblja dodijeljenog obradi podnesaka.
Državni službenici i njihove odgovarajuće agencije također mogu imati koristi od stavljanja podataka na
raspolaganje svim agencijama i organizacijskim silosima. To može smanjiti vrijeme pretraživanja između i
unutar agencija, koje može činiti značajan dio vremena državnih službenika. Jedna je porezna agencija
uspjela preraspodijeliti 20 posto svojih zaposlenika s punim radnim vremenom dobivši online pristup bazama
podataka ugovora o prijenosu stambenog prostora umjesto prikupljanja podataka od druge državne agencije
na fizičkim medijima (CD-ima) i ručnog pretraživanja podataka.
Sve više vlada (na svim razinama) počinje usvajati načela "otvorenih podataka" prema kojima
javnosti stavljaju na raspolaganje više neobrađenih vladinih baza podataka. Data.gov.uk u
Ujedinjenom Kraljevstvu i web portal Aporta u Španjolskoj (www. proyectoaporta.es) središnja su web
mjesta koja su primjeri ovog trenda, u kojima vanjski dionici mogu pristupiti sve većem broju baza
podataka. Takvi napori otključali su ogromnu količinu inovacija koje kombiniraju podatke iz više izvora
(npr. "službene" vladine informacije od tijela za provedbu zakona i javnih radova s "neslužbenim"
informacijama koje su građani prijavili s društvenih medija) za stvaranje usluga kao što su hiperlokalne
vijesti koje opisuju događaji specifični za gradsku četvrt. Drugi primjeri, uključujući expectmore.gov i Dr.
Foster Intelligence, koji građanima UK-a pružaju informacije o zdravstvenoj skrbi, osmišljeni su za izravno
mjerenje uspješnosti programa (pogledajte točku 5 u ovom odjeljku o novim poslovnim modelima za daljnju
raspravu o tim mogućnostima).
2. Omogućivanje eksperimentiranja za otkrivanje potreba, otkrivanje varijabilnosti i poboljšanje izvedbe

Jedan vrlo vrijedan doprinos koji veliki podaci mogu dati jest otkrivanje ogromne varijabilnosti u izvedbi unutar
različitih dijelova vladine agencije koji obavljaju općenito slične funkcije — varijabilnost koja ne pojaviti na
agregatnoj razini. Takve informacije mogu biti vrlo vrijedna prilika za poboljšanje učinka operativnih jedinica
unutar agencije. Na primjer, nadzorne ploče učinka koje prikazuju operativne i financijske podatke omogućuju
agenciji mjerenje i usporedbu učinka svojih različitih jedinica i razvoj pristupa za poboljšanje produktivnosti.
Promatrači obično navode nedostatak vanjske konkurencije kao objašnjenje za relativno nisku produktivnost
u upravi javnog sektora, a to
58
sigurno igra ulogu. Ali čak i u kontekstu slabog konkurentskog pritiska, sposobnost izlaganja
varijacija u učinku među različitim jedinicama javnog sektora može stvoriti unutarnju konkurenciju
koja povećava učinak. Čak i u nedostatku opipljivih financijskih nagrada za poboljšanje učinka,
menadžeri u podparlamentarnim jedinicama često će htjeti poboljšati tu izvedbu jer se osjećaju
nelagodno kada im se javno pokaže da su pri dnu agencijske hrpe (iako mogu i više raditi na
poboljšanju učinka jer bi to moglo povećati njihove šanse za napredovanje i veću plaću u
nastavku).53
Porezne agencije s najboljom praksom koriste integrirane mjesečne tablice rezultata koje mjere
prikupljeni prihod i prate rezultate zadovoljstva korisnika, rezultate angažmana osoblja i povratne
informacije od javnosti i voditelja agencija. Podizanje donjeg kvartila u smislu izvedbe za jedan ili dva
kvartila može biti velika prilika za poboljšanje učinkovitosti. Dok poslovne jedinice privatnog
sektora mogu varirati u svojoj izvedbi za faktor dva, jedinice javnog sektora mogu varirati za faktor
šest.54 Agencije s kolegama u drugim zemljama mogu proširiti svoje usporedbe uspješnosti s
internih na globalne referentne vrijednosti (Prikaz 17).
Prikaz 17
Porezne agencije u različitim zemljama razlikuju se po razini učinka

Rezultati izvedbe indeksirani na 100
Zbirke Podnesci
100 Služba za porezne obveznike Ispitivanja
90
80
70
60 Prosječna
izvedba
50
indeksirana
40 na 50
30
20
10
0
01 2 3 456 7 8 9 10 11 12 13
zemlje
IZVOR: McKinsey porezna benchmarking studija (uključuje analizu 13 zemalja: Australija, Belgija, Brazil, Kanada, Čile,
Danska, Francuska, Irska, Norveška, Južnoafrička Republika, Španjolska, Švedska i Sjedinjene Države)
Mehanizmi za usporedbu mogu omogućiti administratorima javnog sektora mjerenje i rangiranje

učinka dobavljača i pružatelja usluga. Nabava obično nudi veliku priliku za uštedu troškova za
vladu budući da nabava iznosi u prosjeku oko jedne trećine potrošnje javnog sektora (isključujući
transferna plaćanja). Iskustvo McKinseyja u radu na projektima javnog sektora sugerira da vlada
može, u prosjeku, ostvariti uštede do 30 posto učinkovitijom dodjelom ugovora za niz usluga i
dobara.55
53 Neki menadžeri u javnom sektoru primaju bonuse za dobre rezultate. Za više o korištenju
statusnih nagrada za motiviranje dobrog učinka, vidi Timothy Besley i Maitreesh Ghatak,
“Statusni poticaji,” American Economic Review 98(2), 2008: 206–11.
54 McKinsey je 2008. i 2009. proveo dubinsku usporednu analizu 13 poreznih agencija na globalnoj razini.
Za nalaze pogledajte Thomas Dohrmann i Gary Pinshaw, Put do poboljšane usklađenosti, McKinsey
white paper, rujan 2009.
55 posto kao osnova troška nabave; vidi Christian Husted i Nicolas Reinecke, “Poboljšanje
nabave u javnom sektoru,” McKinsey on Government, 2009.
Građani i vanjski dionici također mogu koristiti podatke javnog sektora koji otkrivaju
varijabilnost u izvedbi. U Ujedinjenom Kraljevstvu vlada stavlja na raspolaganje podatke o ishodima
zdravstvene skrbi kako bi građani mogli donositi informiranije odluke
o pružateljima usluga. Na sličan način, dostupnost podataka o obrazovnim rezultatima u osnovnim

i srednjim školama može omogućiti roditeljima da donose informiranije odluke o tome gdje će
živjeti ili u koje škole će smjestiti svoju djecu. Uz naoružavanje korisnika takvih javnih usluga
informacijama koje su im potrebne za donošenje učinkovitih izbora, javno dostupnost ove vrste
podataka vjerojatno će potaknuti pružatelje takvih usluga da poboljšaju svoju izvedbu.
3. Segmentiranje populacije radi prilagodbe radnji
Korištenje segmentacije za prilagođavanje usluga pojedincima odavno je prihvaćena

praksa u privatnom sektoru. Međutim, načelo javnog sektora je da bi vlade trebale pružati
potpuno iste usluge svim građanima. Naše istraživanje pokazuje da segmentiranje i
prilagođavanje državnih usluga pojedincima i skupinama stanovništva može povećati
djelotvornost, učinkovitost i zadovoljstvo građana.
Na primjer, Bundesagentur für Arbeit (Njemačka savezna agencija za rad ili skraćeno BA)
analizirala je svoju ogromnu količinu povijesnih podataka o svojim klijentima, uključujući povijesti
nezaposlenih radnika, intervencije koje je poduzela i ishode uključujući podatke o tome koliko je
ljudima trebalo vremena pronaći posao. Ideja je bila razviti segmentaciju na temelju ove analize
kako bi agencija mogla prilagoditi svoje intervencije za nezaposlene radnike. Ovaj proces, zajedno s
drugim inicijativama koje su se primjenjivale tijekom tri godine, omogućio je agenciji da smanji svoju
potrošnju za 10 milijardi eura (14,9 milijardi dolara) godišnje, u isto vrijeme kad je smanjio vrijeme
koje je nezaposlenim radnicima trebalo da pronađu posao i povećao zadovoljstvo među korisnicima
njegovih usluga (vidi Okvir 8, “Njemačka savezna agencija za rad koristila se velikim podacima kako
bi smanjila značajne troškove svog poslovanja”).
Slično tome, porezne agencije najbolje prakse koriste velike podatke za segmentiranje
pojedinačnih i poslovnih poreznih obveznika, odvajajući ih u kategorije i klase za aktivnosti
pregleda i prikupljanja. Na primjer, ove agencije mogu kategorizirati porezne obveznike
prema zemljopisnom području, njihovoj povijesti ispunjavanja obveza, potencijalnom riziku
neplaćanja, poteškoćama u naplati i, naravno, razini prihoda i demografskim podacima. Korištenje
učinkovite segmentacije može pomoći u smanjivanju jaza između stvarnih i potencijalnih kolekcija
do 10 posto. U isto vrijeme, bolje ciljane interakcije mogu povećati zadovoljstvo kupaca za čak 15 posto.
4. Zamjena/podrška ljudskom donošenju odluka automatiziranim algoritmima Neke od

sofisticiranijih primjena velikih podataka koriste automatizirane algoritme za analizu velikih
skupova podataka kako bi pomogli u donošenju boljih odluka. Ove vrste tehnika često se
mogu vrlo učinkovito primijeniti u aktivnostima usklađivanja, na primjer, među agencijama
javnog sektora koje trebaju pronaći anomalije u plaćanjima kao što su naplata poreza ili isplate
naknada od odjela za rad ili socijalnu sigurnost. Sofisticirane porezne agencije primjenjuju
automatizirane algoritme koji obavljaju sustavne višerazinske provjere poreznih prijava i
automatski označavaju prijave koje zahtijevaju daljnje ispitivanje ili reviziju. Ovaj pristup može
značajno poboljšati naplatu, smanjujući porezni jaz do 10 postotnih bodova. Slične metode mogu
koristiti i druge agencije kako bi imale učinkovitu ulogu u borbi protiv terorizma i zaštiti djece.
Algoritmi mogu puzati kroz velike podatke iz raznih izvora, identificirajući

nedosljednosti, pogreške i prijevare. Na primjer, algoritmi temeljeni na pravilima mogu
označiti sumnjive korelacije kao što je osoba koja prima naknadu za nezaposlene dok podnosi
zahtjev za nesreću na radu. Korištenje sofisticiranijih i dobro podešenih algoritamskih tehnika
kao što su neuronske mreže može smanjiti vjerojatnost i lažno pozitivnih
60
(odabir predmeta za daljnje ispitivanje koji nema problem) i lažno negativni (neodabir predmeta za
daljnje ispitivanje gdje postoji problem). Nakon korištenja automatiziranih analiza, BA je izvijestio o
smanjenju pogrešno isplaćenih naknada za 20 posto.
Okvir 8. Njemačka savezna agencija za rad upotrijebila je velike podatke kako

bi smanjila značajne troškove svog poslovanja
Bundesagentur für Arbeit (Njemačka savezna agencija za rad ili skraćeno BA), s
godišnjim proračunom od 54 milijarde eura i 120 000 zaposlenih s punim radnim
vremenom, oštro je poboljšala svoje korisničke usluge i smanjila troškove za oko 10
milijardi eura posljednjih godina koristeći velike podatkovne strategije (prikaz 18). BA
zapošljava nezaposlene i pruža cijeli niz usluga savjetovanja i podrške putem deset
regionalnih centara i 178 agencija za zapošljavanje.
Agencija je izgradila sposobnosti za proizvodnju i analizu podataka koji su omogućili

niz novih programa i nove pristupe postojećim programima. BA sada može točnije analizirati
podatke o rezultatima za svoje programe zapošljavanja, uočavajući one programe koji su
relativno neučinkoviti i poboljšavajući ih ili eliminirajući. Agencija je uvelike unaprijedila
sposobnost definiranja i evaluacije karakteristika svojih nezaposlenih i djelomično zaposlenih
klijenata. Kao rezultat toga, BA je razvio segmentirani pristup koji pomaže agenciji da ponudi
učinkovitije postavljanje i savjetovanje pažljivo ciljanim segmentima kupaca. Ankete njihovih
kupaca pokazuju da oni percipiraju i visoko odobravaju promjene koje BA provodi.
Prikaz 18
Njemačka je postigla značajno smanjenje svoje potrošnje na aktivne politike

tržišta rada bez povećanja nacionalne nezaposlenosti
Raspoloživi proračun za aktivne politike tržišta rada, 2003. – 10
milijardi €
13.5
10.3
4.4 4.5 4.3

3.3 3.3 3.6
2003. godine 04 05 06 07 08 09 2010
4.4 4.4 4.9 4.5 3.8 3.3 3.4 3.2

Nezaposlene osobe
milijun
IZVOR: Bundesagentur für Arbeit; Analiza McKinsey Global Institute
5. Inoviranje novih poslovnih modela, proizvoda i usluga s velikim podacima Veliki podaci iz vlade
mogu otključati inovacije unutar i izvan javnog sektora.

Pružanje lako dostupnih alata za velike podatke i analitike može omogućiti komercijalnim,
neprofitnim i pojedinačnim trećim stranama stvaranje nove vrijednosti za javni sektor na različite načine.
To može uključivati povratne informacije o uslugama, uvid u bolje prakse upravljanja i prijedloge
za poboljšanje novih i postojećih programa. Inovacije velikih podataka mogu dovesti do
eksperimenata u javnoj politici i programima javnog sektora za poboljšanje učinka vlade. U
Ujedinjenom Kraljevstvu, na primjer, neprofitna organizacija Open Knowledge
Zaklada je koristila baze podataka koje su dostupne kroz vladinu inicijativu otvorenih podataka za
razvoj wheredoesmymoneygo.org, stranice koja građanima olakšava pregled i razumijevanje
javne potrošnje Ujedinjenog Kraljevstva analizom i vizualizacijom podataka.56
Startup tvrtka BrightScope iskopala je podatke Ministarstva rada SAD-a o 401 (k) naknadama za
upravljanje koje plaćaju poslodavci i otkrila da male tvrtke plaćaju više od 4 milijarde dolara
više u naknadama za upravljanje od većih tvrtki. Na temelju tih podataka i podataka iz nekoliko
javnih izvora kao što su Securities and Exchange Commission i US Census Bureau, BrightScope
sada nudi online alat za kvantitativno ocjenjivanje planova 401(k).
U travnju 2011. konzorcij europskih organizacija za otvorene podatke najavio je "izazov

otvorenih podataka", natjecanje za dizajnere, programere, istraživače i širu javnost kako bi
došli do ideja, aplikacija, vizualizacija i izvedenih skupova podataka temeljenih na skupovima
podataka koje proizvodi Europska javna tijela. Konzorcij je stavio na raspolaganje 20.000 € u
nagradnom fondu. Ovaj je projekt djelomično inspiriran natječajem Apps for Democracy Distrikta
Columbia, koji je privukao više od 40 uspješnih aplikacija u vrijednosti od najmanje 2 milijuna
dolara općinskoj upravi DC-a uz ukupnu cijenu od 50.000 dolara.
Kao iu drugim industrijskim i poslovnim sektorima koje smo proučavali, značajna vrijednost
može se uhvatiti samo ako su podaci dostupni i transparentni (i primjenom jednostavne
analitike). Potencijalni dobici naglo rastu kako dionici prelaze na napredne analitičke tehnike kao
što je primjena složenih algoritama i tehnika segmentacije.
POTENCIJALNE KORISTI VELIKIH PODATAKA U JAVNOM SEKTORU

ADMINISTRACIJA
U cijelom europskom javnom sektoru, poluge velikih podataka koje smo identificirali za
administraciju mogu donijeti tri glavne kategorije mjerljive novčane vrijednosti sve dok postoje
prave politike i pokretači. To su uštede troškova od operativne učinkovitosti, smanjenje troškova
pogrešaka i prijevara u upravljanju naknadama te povećanje poreznih primitaka smanjenjem
poreznog jaza. Procjenjujemo da se poluge učinkovitosti koje smo identificirali primjenjuju na 20 do
25 posto operativnih proračuna s potencijalnim uštedama od 15 do 20 posto. Smanjenje pogreške
i troškova primanja na prijevaru moguće je u procijenjenih 1 do 3 posto transfernih plaćanja (imajte
na umu da se ovo odnosi na dio transfernih plaćanja koji imaju nezanemarive iznose pogrešaka i
prijevare i procijenjeni postotak troškova pogreške i prijevare) , štedeći do 40 posto troškova
nastalih iz tih izvora.57 Što se tiče povećanja poreznih primitaka, procjenjujemo da će porezni jaz
biti u rasponu od 5 do 10 posto ukupnih europskih poreznih primitaka i da će do 20 posto toga
može se nadoknaditi. Sveukupno, javni sektori 23 najveće europske vlade mogli bi potencijalno
stvoriti 150 do 300 milijardi €—i potencijalno više—u novoj vrijednosti godišnje tijekom deset
godina. To implicira povećanje godišnjih stopa rasta produktivnosti u javnom sektoru za oko 0,5
postotnih bodova iznad očekivanih, ako se trenutni trendovi održe (Prikaz 19).
56 Vidi Jason Baumgarten i Michael Chui, “E-government 2.0,” McKinsey Quarterly, srpanj 2009. za priču o
Zakladi Sunlight, organizaciji koja je stvorila sličnu stranicu u Sjedinjenim Državama.
57 Na temelju studija koje su provele vlade, procjenjujemo da prijevara ili pogreška mogu utjecati na
približno 55 posto transfernih plaćanja i da ta pogreška i prijevara mogu povećati troškove do 3 posto.
62
Prikaz 19
Veliki podaci imaju potencijal stvoriti vrijednost od 150 do 300 milijardi eura ili
više u cijelom javnom sektoru OECD-a u Europi
Ukupna baza1 Adresabilni % % smanjenja Ukupna vrijednost
milijarda € milijardu eura
Operativni 4000 20–25 (prikaz, stručni). 15–20 (prikaz, stručni). 120–200 (prikaz, stručni).
Uštede
rashodi
operativne
učinkovitosti
Plaćanje 2500 1–32

Smanjenje
30–40 (prikaz, stručni). 7–30 (prikaz, stručni).
prijevara i prijenosom
greška
Porezni prihod 5400 5–103 (prikaz, ostalo). 10–20 (prikaz, stručni). 25–110 (prikaz, stručni).
Povećanje
naplate poreza
150–300+
1 Osnovica za uštede operativne učinkovitosti su ukupni državni rashodi neto transfernih plaćanja; osnova za smanjenje prijevara je
ukupna državna transferna plaćanja; osnova za povećanje naplate poreza su porezni prihodi.
2 Uzima u obzir postotak transfernog plaćanja koje može imati prijevaru/pogrešku kao i procijenjeni trošak pogreške i prijevare.
3 U slučaju naplate poreza, postotak koji se može adresirati odnosi se na postotak procijenjenog poreznog jaza.
IZVOR: Međunarodni monetarni fond; OECD; Analiza McKinsey Global Institute
Osim toga, veliki podaci mogu donijeti niz značajnih nemonetarnih dobitaka u javnom sektoru,
uključujući poboljšanu raspodjelu sredstava u programe, kvalitetnije usluge, povećanu odgovornost
javnog sektora, bolje informirano građanstvo i gotovo sigurno povećano povjerenje javnosti u vlada.58
Nakon što je jedna od agencija za rad u EU počela segmentirati svoje usluge, došlo je do
dokumentiranog povećanja kvalitete interakcije između klijenata agencije i voditelja slučaja. Građani
i tvrtke mogu potrošiti manje vremena i truda u interakciji s vladinim agencijama i dobiti usluge koje
su bolje usmjerene na njihove potrebe. Veća transparentnost informacija stvara bolju odgovornost u
agencijama javnog sektora i veće povjerenje javnosti.
Nadzorne ploče i komparativni mehanizmi građanima nude sredstva za mjerenje učinkovitosti

programa i politika. Jedna od skrivenih prednosti stavljanja vlastitih podataka građanima na
raspolaganje jest to što su oni obično najmotiviraniji osigurati točnost tih podataka. Dakle,
pružanje građanima mogućnosti elektroničkog ispravljanja pogrešnih osobnih podataka u
bazama podataka agencija može poboljšati točnost državnih baza podataka. Sve poluge o kojima
smo govorili mogu dovesti do informiranijih i boljih odluka građana, kreatora politika i rukovoditelja
javnog sektora.
ČELNICI JAVNOG SEKTORA TREBAJU SE RAZVOJITI NIZOM PITANJA
ZA UČINKOVITO KORIŠTENJE VELIKIH PODATAKA
Čelnici javnog sektora koji žele ostvariti vrijednosni potencijal koji nude veliki podaci moraju se
pozabaviti brojnim unutarnjim i vanjskim problemima. To uključuje implementaciju odgovarajuće
tehnologije, regrutiranje i obuku talentiranog osoblja i upravljanje promjenama unutar njihovih
organizacija. Jednako važno, vlada će morati upotrijebiti politiku kako bi podržala prikupljanje
vrijednosti velikih podataka i dijeljenje podataka između agencija.
Prvi zadatak je uspostaviti kulturu unutar javnog sektora u kojoj se odluke usmjerene na poboljšanje
učinka donose na temelju podataka. Tek kada vlada svoje ciljeve učinka i popratne podatke učini
transparentnima, vladine će se agencije i javnost značajnije uključiti u te ciljeve. Kada
58 Ova poboljšanja u kvaliteti pruženih državnih usluga nisu uključena u

proračun produktivnosti.
vlada uspostavlja institucije za reviziju svoje odgovornosti i produktivnosti, građani i

zaposlenici u javnom sektoru "shvaćaju poruku".
Srećom, mnogi podaci u administrativnim funkcijama javnog sektora u razvijenim

zemljama već su u digitalnom obliku, ali agencije se značajno razlikuju u sofisticiranosti kojom
rukuju tim digitalnim informacijama.59 Neke će se agencije i dalje morati baviti problemima kao
što su nedosljedni podaci formate i definicije te probleme povezane s naslijeđenim sustavima.
Sposobnost integracije različitih skupova podataka bit će ključna za, primjerice, omogućavanje
poreznim agencijama da unaprijed ispune obrasce poreznih obveznika i automatski ih pregledaju,
a agencijama za zapošljavanje da točno integriraju podatke o nezaposlenima kako bi mogle
učinkovitije ciljati usluge. Anegdotski, porezne agencije u Europi i drugim regijama prijavljuju
poteškoće u dobivanju i korištenju podataka od drugih agencija zbog nekompatibilnih formata
podataka.
Zapošljavanje i zadržavanje analitičkih talenata bit će ključno pitanje za agencije u

javnom sektoru, baš kao što je to slučaj u privatnom sektoru. Vjerojatno će jaz u analitičkom
talentu biti još veći u javnom sektoru, s obzirom na njegovu slabu evidenciju o natjecanju za
vrhunske talente, te je ključno da čelnici javnog sektora shvate potrebu da se pozabave ovim nedostatkom.
Također će biti sve veća potražnja za osobljem koje može učinkovito upravljati promjenama
i prilagođavati se promjenama, a neke će vlade morati prevladati kulturu u kojoj vlada staž i
otupljuje utjecaj poticaja za bolji učinak. Javni sektor treba promijeniti stav zaposlenika prema
dijeljenju i korištenju podataka, nudeći odgovarajuće poticaje i sustave kako bi se osiguralo da
uvidi proizašli iz velikih podataka zapravo pokreću akcije i odluke u organizacijama. Način
razmišljanja zaposlenika može biti jednako velika prepreka ostvarenju vrijednosti velikih podataka
kao i tehnološka neadekvatnost.
U području balansiranja prava na privatnost i pristupa podacima, djelovanje među odjelima

vjerojatno će biti od pomoći. Novi zakoni ili propisi mogu biti potrebni kako bi se vladinim
agencijama omogućio pristup podacima njihovih kolega u drugim dijelovima sustava, dok se
istovremeno štiti sigurnost tih informacija i privatnost njihovih subjekata. Tvorci politike trebaju
donositi odluke o privatnosti u suradnji s javnim mnijenjem, informirajući građane o kompromisima
između privatnosti i sigurnosnih rizika dijeljenja podataka i prednosti dijeljenja podataka.
Javni sektor u naprednim gospodarstvima suočava se s neviđenim pritiscima za

poboljšanjem produktivnosti, a naša analiza javne uprave u Europi pokazuje da poluge
velikih podataka mogu dati značajan doprinos tim naporima diljem svijeta. Inteligentno
korištenje velikih podataka ima potencijal za stvaranje značajne vrijednosti za javni sektor sve dok
se poduzimaju mjere za prevladavanje tehnoloških prepreka, zapošljavanje i prekvalificiranje
ljudi s odgovarajućim vještinama te upravljanje promjenama potrebnim unutar organizacija za
prihvaćanje i iskorištavanje velikih podataka .
59 Ovo opažanje odnosi se na vladine administrativne funkcije proučavane u ovom dubokom

skoku, koje nisu uključivale obrazovanje ili državnu zdravstvenu skrb. U većem dijelu Europe
online pružanje javnih usluga ima stalan napredak. Najosnovnijih 20 e-usluga (uključujući online
porezne prijave i upise u škole) imalo je prosječnu dostupnost od 82 posto diljem Europe u 2010.
Za više, pogledajte Digitalizacija javnih usluga u Europi: Stavljanje ambicije u akciju, Europska
komisija, prosinac 2010.
64
3c. Maloprodaja (Sjedinjene Američke Države)
U američkoj maloprodajnoj industriji korištenje informacijske tehnologije i digitalnih podataka već je

desetljećima ključno za povećanje profitabilnosti pojedinačnih igrača i produktivnosti cijelog sektora. U
nadolazećim godinama, nastavak usvajanja i razvoja velikih podatkovnih poluga ima potencijal za daljnje
povećanje produktivnosti cijelog sektora za najmanje 0,5 posto godišnje do 2020. Među pojedinačnim
poduzećima, te bi poluge mogle povećati operativne marže za više od 60 posto za oni pioniri koji
maksimiziraju korištenje velikih podataka. Takvo povećanje profitabilnosti bilo bi posebno značajno u
sektoru u kojem su marže notorno niske. Ovo je također
bogato područje u kojem se ispituju interakcije između trgovaca i potrošača.
Ovo je područje u kojem digitalni podaci igraju sve veću ulogu jer potrošači pretražuju, istražuju,
uspoređuju, kupuju i dobivaju podršku na mreži, a proizvodi koje prodaju trgovci sve više generiraju
vlastite digitalne podatke. Naravno, vrijednost koju će igrači u maloprodajnom sektoru i njihovi kupci stvarno
uhvatiti ovisit će kritično o akcijama trgovaca na malo da prevladaju prepreke povezane s tehnologijom,
talentom i organizacijskom kulturom.
Ova studija fokusirana je na američki maloprodajni sektor, ali također se oslanjamo na najbolju praksu i
iskustva kompanija širom svijeta. Potencijalni pozitivni učinak većine poluga velikih podataka koje opisujemo
gotovo bi sigurno bio sličan u drugim razvijenim zemljama. Ispitali smo primjenu velikih podataka u većini
maloprodajnih podsektora kako je opisano standardnim sjevernoameričkim sustavom klasifikacije djelatnosti
(NAICS). Konkretno, u našu analizu uključujemo one podsektore u kojima kupci obavljaju male do umjerene
prosječne pojedinačne kupnje i one s umjerenom do visokom učestalošću interakcije (vidi okvir 9, „Koje smo
maloprodajne podsektore proučavali?“). Ne uključujemo tvrtke privatnih robnih marki trgovaca na malo. U
našoj studiji slučaja o proizvodnji pokrivamo dobavljače robe.
Okvir 9. Koje smo maloprodajne podsektore proučavali?
Za našu analizu pogledali smo 10 od 12 maloprodajnih podsektora NAICS-a: zdravlje i osobna
njega; Opća trgovačka roba; građevinski materijal i vrtna oprema; trgovci na malo izvan trgovina;
hrane i pića; odjeća i dodaci; sportska oprema, hobi, knjige i glazba; elektronika i uređaji; razno; te
namještaj i pokućstvo.
Nismo uključili trgovce motornim vozilima i dijelovima niti benzinske postaje. Primarni razlog za
isključivanje trgovaca motornim vozilima bio je taj što je učestalost kupnje motornih vozila, često
drugog najvrjednijeg predmeta u kućanstvu nakon samog doma, relativno rijetka, tako da je razina
interakcije s potrošačima također na različitoj razini. i učestalost u usporedbi s drugim

maloprodajnim podsektorima. Odlučili smo ne pokriti benzinske crpke jer je prodaja robe (benzina)
čini manje usporedivom s drugim podsektorima maloprodaje s daleko većom raznolikošću proizvoda
i čijim ulaznim troškovima manje dominira jedan promjenjivi čimbenik (cijene nafte).
MALOPRODAJA JE VAŽNA KOMPONENTA US EKONOMIJE,

ALI PROFITABILNOST JE POD JAKIM PRITISKOM
Maloprodaja čini znatan dio gospodarstva SAD-a. Godine 2009. taj je udio iznosio procijenjenih 6
posto gospodarstva, što je postotni bod manje u odnosu na 2000. Predviđanja industrije ukazuju na
samo skroman rast u sljedećih pet godina jer će sektor postojano,
ali se polako oporavlja od recesije. Povijesni trendovi pokazali su da postoji bliska veza između
rasta maloprodaje i rasta razvijenih tržišnih gospodarstava u cjelini. Za referencu, Međunarodni
monetarni fond (MMF) predviđa godišnji rast američkog BDP-a od 2,7 posto do 2015. godine.
Udio maloprodaje u ukupnoj potrošačkoj potrošnji je u padu, pao je sa 50 posto u

1990. na 42 posto u 2009. A profitabilnost sektora je pod velikim pritiskom, pritisnut
kako od strane dobavljača, koji hvataju sve veći iznos viška, tako i od strane kupaca ,
koji vrše pritisak na cijene.
Za svakih 1,00 USD operativnog profita od robe široke potrošnje u 2008., trgovci su
prikupili približno 0,31 USD, što je pad u odnosu na 0,60 USD u 1999., dok su dobavljači,
pakeri i ostali ispod maloprodaje u lancu vrijednosti dobili 0,69 USD (Prikaz 20).
Prikaz 20
Pritisak dobavljača na smanjenje cijena na trgovce na malo smanjio je udio

trgovaca u potrošačkoj dobiti
Skup operativne dobiti za robu široke potrošnje %
100 100
90 90 Za svakih 1,00 $
operativne dobiti
80 80
Trgovac danas, trgovci dobivaju
70 70
približno 0,31 USD, dok

60 60 roba široke potrošnje
(CPG) dobiva 0,69 USD
50 50
40 40
Daljnji pritisci na
30 30 cijene smanjit će 0,31
USD operativne dobiti
CPG
20 20
koju trgovac trenutno
kontrolira
10 10
0 0 1998 99 2000 01 02 03 04 05 06 07 2008
IZVOR: Bernstein; McKinsey analiza
Niz razvoja velikih podataka izvršit će veći pritisak na snižavanje cijena na trgovce.
Taj će pritisak doći zbog niza novih tehnologija koje kupcima daju moćne informacije o
cijenama, promocijama i proizvodima, često u stvarnom vremenu. Aplikacije kao što je
RedLaser, na primjer, omogućuju kupcima da svojim pametnim telefonima skeniraju crtični
kod artikla u trgovini i odmah dobiju usporedbu cijena i proizvoda. Osim toga, usvajanje
internetske i mobilne trgovine (više od 50 posto maloprodaje bit će online ili pod utjecajem
online kanala do 2014.) moglo bi osigurati veliko povećanje transparentnosti cijena koje će
prenijeti ogromnu vrijednost na potrošače (Prikaz 21). Ovaj će trend vjerojatno smanjiti
marže za trgovce na malo koji se natječu isključivo cijenom. Već je jasno da tamo gdje kupci
imaju lak pristup usporedbi cijena među trgovcima na malo, cijene su znatno niže.60
60 Postoji duga povijest akademske literature o odnosu između oglašavanja (online i offline) i
cijena koja je pokrivala proizvode od naočala do alkohola i usluga kao što su odvjetnici. Vidi,
na primjer, Lee Benham, “Učinak oglašavanja na cijenu naočala,” Journal of Law and Economics
15(2), listopad 1972.: 337–352.
66
Prikaz 21
Predviđa se da će maloprodajna prodaja u SAD-u pod utjecajem interneta postati više od

polovice ukupne prodaje do 2013. milijarde dolara
1,658
1,542
1,423 249
230
1,307
210
1,194
192
1,072 173
Internetska maloprodaja 155
1,409
1,312
1,213
Maloprodaja pod 1,115
917 1,021
utjecajem weba
2009. godine 10 11 12 13 2014
% od ukupnog broja
42 46 48 50 51 53
prodaja u SAD-u
IZVOR: Forrester Research Prognoza maloprodaje pod utjecajem interneta, prosinac 2009
TRENDOVI INFORMACIJSKIH TEHNOLOGIJA NUDE ZNAČAJNE NOVOSTI
MOGUĆNOSTI STVARANJA VRIJEDNOSTI U MALOPRODAJI
Iako veliki podaci povezani s novom tehnologijom na neki način potiskuju industriju,
oni također nude značajne nove prilike za stvaranje vrijednosti. Trgovci u sektoru i
njihovi konkurenti u stalnoj su utrci za prepoznavanje i implementaciju onih poluga
velikih podataka koje će im dati prednost na tržištu. Količina podataka nezaustavljivo
raste jer trgovci ne samo da bilježe svaku kupčevu transakciju i operaciju, već također
prate nove izvore podataka kao što su čipovi za radiofrekvencijsku identifikaciju (RFID)
koji prate proizvode te ponašanje i raspoloženje kupaca na mreži.
Zapravo, maloprodaja u SAD-u već desetljećima koristi informacijsku tehnologiju.

Podaci o transakcijama na prodajnom mjestu, primarno dobiveni upotrebom crtičnih
kodova, prvi put su se pojavili 1970-ih.61 Od 1990-ih mnogi vodeći trgovci na malo
koriste podatke na razini trgovine i opskrbnog lanca kako bi optimizirali distribuciju i
logistiku, izoštrili planiranje robe i upravljanje i nadogradnju poslovanja trgovine. U
prethodnom istraživanju MGI-ja o ubrzanju produktivnosti u maloprodaji opće robe
1990-ih, otkrili smo da je Wal-Mart izravno i neizravno uzrokovao najveći dio ubrzanja
produktivnosti kroz stalne menadžerske inovacije (npr. formati velikih kutija,
svakodnevne niske cijene) koje povećao konkurentski intenzitet i potaknuo širenje
najbolje upravljačke i tehnološke prakse.62 Wal-Mart je bio pionir u širenju sustava
elektroničke razmjene podataka kako bi elektronički povezao svoj lanac opskrbe. Wal
Mart je također razvio "Retail Link", alat koji svojim dobavljačima daje uvid u potražnju
u njihovim trgovinama tako da znaju kada trgovine trebaju obnoviti zalihe umjesto da
čekaju narudžbu od Wal-Marta. Ovaj "inventar kojim upravlja dobavljač" bio je
revolucionaran koncept kada je predstavljen kasnih 1980-ih. Obje ove inicijative poboljšale su
61 Paket Wrigley's žvakaćih guma bio je prvi artikl u trgovini skeniran pomoću Universala
Kod proizvoda—u supermarketu Marsh u Troyu, Ohio, 1974.
62 Za više informacija o pokretačima produktivnosti, posebno o tehnologiji u maloprodajnom sektoru

1990-ih, pogledajte Kako IT omogućuje rast produktivnosti, McKinsey Global Institute, studeni 2002.
(www. mckinsey.com/mgi).
kapital i produktivnost rada trgovca na malo i troškovni položaj. Kad su 1990-ih drugi trgovci krenuli
oponašati ono što je Wal-Mart bio pionir kako bi ostali konkurentni, produktivnost je porasla u cijeloj
industriji.
Danas vodeći igrači istražuju podatke o kupcima kako bi informirali odluke koje donose o upravljanju
svojim opskrbnim lancem do prodaje i cijena. Wal-Martovo detaljno i troškovno učinkovito praćenje
kupaca daje trgovcu mogućnost istraživanja petabajta podataka o preferencijama kupaca i kupovnom
ponašanju, te na taj način dobiva važne ustupke u određivanju cijena i distribuciji od tvrtki za robu
široke potrošnje.
Trgovci na malo u cijeloj industriji postaju sve sofisticiraniji u rezanju velikih podataka koje prikupljaju
iz višestrukih prodajnih kanala, kataloga, trgovina i online interakcija. Široko rasprostranjena
upotreba sve preciznijih podataka o kupcima može omogućiti trgovcima na malo da poboljšaju
učinkovitost svog marketinga i merchandisinga. Poluge velikih podataka primijenjene na operacije i
opskrbne lance nastavit će smanjivati troškove i sve više stvarati nove konkurentske prednosti i
strategije za rastuće trgovce na malo.
prihod.
MGI JE IDENTIFICIRAO 16 POLUGA ZA VELIKE PODATKE U MALOPRODAJI
Identificirali smo 16 velikih maloprodajnih poluga koje trgovci mogu koristiti duž lanca vrijednosti.
Ove poluge spadaju u pet glavnih kategorija marketinga, prodaje robe, operacija, opskrbnog lanca i
novih poslovnih modela (Prikaz 22).
Prikaz 22
Poluge za maloprodaju velikih podataka mogu se grupirati prema funkciji
Funkcija Poluga velikih
Marketing podataka
Unakrsna prodaja Marketing
temeljen na lokaciji Analiza
ponašanja u trgovini Mikrosegmentacija
kupaca Analiza sentimenta
Poboljšanje višekanalnog iskustva
potrošača
Trgovanje robom Optimizacija asortimana

Optimizacija cijena Optimizacija
plasmana i dizajna
Operacije Transparentnost rada

Optimizacija uloženog rada
Lanac opskrbe Upravljanje zalihama

Optimizacija distribucije i logistike
Informiranje u pregovorima
s dobavljačima
Novi poslovni modeli Usluge usporedbe cijena

Tržišta temeljena na webu
Marketing
1. Unakrsna prodaja. Najsuvremenija unakrsna prodaja koristi sve podatke koji se mogu znati o
kupcu, uključujući kupčeve demografske podatke, povijest kupovine, preferencije, lokacije u
stvarnom vremenu i druge činjenice za povećanje prosječne veličine kupnje. Na primjer,
Amazon.com koristi kolaborativno filtriranje za generiranje upita "možda biste i vi željeli" za svaki
kupljeni ili posjećeni proizvod. U jednom je trenutku Amazon izvijestio da je 30 posto prodaje bilo
zahvaljujući njegovom mehanizmu preporuka. Još jedan primjer ove poluge je korištenje analize
velikih podataka za optimizaciju promocija u trgovini koje povezuju komplementarne artikle i
proizvode u paketu.
68
2. Marketing temeljen na lokaciji. Marketing temeljen na lokaciji oslanja se na rastuću primjenu

pametnih telefona i drugih mobilnih uređaja s omogućenim osobnim podacima o lokaciji.
Cilja na potrošače koji su blizu trgovina ili su već u njima. Na primjer, kada se potrošač
približi trgovini odjeće, ta trgovina može poslati posebnu ponudu za džemper na kupčev
pametni telefon. Startup PlaceCast tvrdi da je više od 50 posto njegovih korisnika izvršilo
kupnju kao rezultat takvih lokacijskih oglasa. Gotovo 50 posto vlasnika pametnih telefona
koristi ili planira koristiti svoje telefone za mobilnu kupnju.63
3. Analiza ponašanja u trgovini. Analiza podataka o ponašanju u trgovini može pomoći u

poboljšanju rasporeda trgovine, kombinacije proizvoda i pozicioniranja na policama. Nedavne
inovacije omogućile su trgovcima da prate obrasce kupnje kupaca (npr. pješačku stazu i
vrijeme provedeno u različitim dijelovima trgovine), crtanje podataka o lokaciji u stvarnom
vremenu iz aplikacija za pametne telefone (npr. Shopkick), transpondera košarice za kupnju
ili pasivno praćenje lokacije mobilnih telefona u maloprodajnom okruženju. Neki trgovci
koriste sofisticirani softver za analizu slike povezan s njihovim kamerama za videonadzor kako
bi pratili obrasce prometa u trgovinama i ponašanje potrošača.
4. Mikrosegmentacija kupaca. Sljedeća poluga velikih podataka povezana s marketingom je

mikrosegmentacija kupaca. Iako je ovo poznata ideja u maloprodaji, veliki podaci omogućili
su goleme inovacije posljednjih godina. Količina podataka dostupnih za segmentaciju
eksplodirala je, a sve veća sofisticiranost analitičkih alata omogućila je podjelu na sve preciznije
mikrosegmente—do točke u kojoj neki trgovci mogu tvrditi da se bave personalizacijom, a ne
samo segmentacijom. Uz korištenje tradicionalnih podataka o istraživanju tržišta i podataka
o povijesnim kupnjama, trgovci sada mogu pratiti i iskoristiti podatke o ponašanju pojedinačnih
kupaca—uključujući podatke o klikovima s weba.
Trgovci sada mogu ažurirati ove sve preciznije podatke u gotovo stvarnom vremenu kako bi
se prilagodili promjenama kupaca. Neiman Marcus, vrhunski trgovac na malo, razvio je
segmentaciju ponašanja i višeslojni program nagrađivanja članstva, a ta je kombinacija
dovela do znatno veće kupnje proizvoda s višom maržom od njegovih najimućnijih kupaca s
višom maržom.
5. Analiza sentimenta. Analiza sentimenta iskorištava opsežne tokove podataka koje generiraju
potrošači u različitim oblicima društvenih medija kako bi pomogla u donošenju raznih
poslovnih odluka. Na primjer, trgovci na malo mogu koristiti analizu raspoloženja kako bi
procijenili odgovor u stvarnom vremenu na marketinške kampanje i prilagodili smjer prema
tome. Razvojno polje analize podataka društvenih medija igra ključnu ulogu jer se potrošači
sve više oslanjaju na mišljenje i preporuke kolega pri donošenju odluka o kupnji. Pojavili su
se različiti alati za praćenje u stvarnom vremenu i odgovor na ponašanje i odabire potrošača
na webu.
6. Poboljšanje višekanalnog iskustva potrošača. Poboljšanje višekanalnog iskustva za

potrošače može biti snažan pokretač prodaje, zadovoljstva kupaca i lojalnosti. Trgovci na
malo mogu koristiti velike podatke kako bi neprimjetno integrirali promocije i cijene za kupce,
bilo da su ti potrošači online, u trgovini ili pregledavaju katalog. Williams-Sonoma je, na primjer,
integrirala baze podataka kupaca s informacijama o oko 60 milijuna kućanstava, prateći stvari
kao što su njihov prihod, vrijednost stambenog prostora i broj djece. Ciljani e-mailovi koji se
temelje na ovim informacijama dobivaju deset do 18 puta veću stopu odgovora od e-mailova
koji nisu ciljani, a tvrtka je u mogućnosti kreirati različite verzije svojih kataloga usklađene s
ponašanjem i preferencijama različitih skupina kupaca.
63 ABI istraživanje, Consumer Technology Barometer: Mobile, 2010.

Trgovanje robom
1. Optimizacija asortimana. Odlučivanje o tome koji će se proizvodi nositi u kojim trgovinama

na temelju lokalne demografije, percepcije kupaca i drugih velikih podataka—takozvana
optimizacija asortimana—može značajno povećati prodaju. Jedan vodeći trgovac lijekovima,
na primjer, koristio se istraživanjem potrošača, analizom tržišta i konkurencije te
detaljnim ekonomskim modeliranjem kako bi identificirao uzroke svog ravnog i opadajućeg
rasta na razini kategorije. Smanjio je ukupni broj skladišnih jedinica (SKU) za 17 posto,
prebacio robne marke privatnih robnih marki s 10 posto u miksu proizvoda na 14 posto i
postigao povećanje zarade od 3 posto, kao i povećanje prodaje od 2 posto.
2. Optimizacija cijena. Trgovci na malo danas mogu iskoristiti sve veću granularnost
podataka o cijenama i prodaji i koristiti više razine analitičke snage kako bi
optimizaciju cijena podigli na novu razinu. Razni izvori podataka mogu se koristiti za
procjenu i donošenje odluka o cijenama u gotovo stvarnom vremenu. Složeni modeli
elastičnosti potražnje ispituju povijesne podatke o prodaji kako bi dobili uvid u cijene na
razini SKU-a, uključujući smanjenje cijena i raspored. Prodavci mogu upotrijebiti dobivene
podatke za analizu promotivnih događaja i procijeniti izvore porasta prodaje i sve temeljne
troškove koje bi oni mogli uključiti. Jedan trgovac hranom ispituje cjenovnu elastičnost
među svojim kupcima za različite kategorije. Ruralni potrošači hrane, na primjer, vide
maslac i rižu kao viši prioritet pri kupnji i stoga su ti proizvodi možda manje cjenovno
elastični nego što bi bili za urbane kupce. Urbani potrošači, u međuvremenu, teže
stavljati žitarice i slatkiše na viši nivo među svojim prioritetima.
3. Optimizacija postavljanja i dizajna. Fizički trgovci na malo također mogu značajno dobiti
optimiziranjem postavljanja robe i vizualnog dizajna (npr. završnih kapa, polica) rudarenjem
podataka o prodaji na razini SKU-a — u biti, lokalne verzije vrsta optimizacije koje zahtijevaju
prednost podataka o pješačkom prometu. Mrežni trgovci na malo mogu prilagoditi
položaje web stranica na temelju podataka o interakciji stranice kao što su pomicanje,
klikovi i prelasci mišem. Na primjer, eBay je proveo tisuće eksperimenata s različitim
aspektima svoje web stranice kako bi odredio optimalan izgled i druge značajke od navigacije
do veličine svojih fotografija.
Operacije 1.
Transparentnost rada. Trgovci sada mogu provoditi dnevne analize

performanse koje mogu agregirati i izvješćivati prema prodaji u trgovini, SKU prodaji i
prodaji po zaposleniku. Danas se ti sustavi sve više približavaju stvarnom vremenu.
Trgovci mogu provjeriti točnost blagajnika i transakcije po satu te kvalitetu korisničke
usluge na temelju postotka problema s kupcima riješenih jednim pozivom, pritužbi
kupaca i anketa o zadovoljstvu. Iako industrija već naširoko koristi izvješćivanje o učinku
na osnovnoj razini, trend prema mnogo većoj učestalosti, neposrednosti i detaljnom
izvješćivanju omogućuje menadžerima da uvedu konkretne prilagodbe u svom poslovanju
na puno pravovremeniji način, tj. još uvijek postoji prostor za povećanje vrijednosti pomoću
ove poluge.
2. Optimizacija utroška rada. Još jedna operativna poluga koja može stvoriti vrijednost
kroz smanjenje troškova uz održavanje razine usluge je oko optimizacije inputa rada,
automatiziranog praćenja radnog vremena i prisutnosti te poboljšanog rasporeda rada. Ova
poluga može stvoriti točnija predviđanja potreba za osobljem, posebno tijekom vršnih
razdoblja, tako da se može izbjeći preveliki kapacitet. Budući da rad u trgovini predstavlja
približno 30 posto fiksnih troškova prosječnog trgovca, korištenje ove poluge se itekako
isplati.
70
Lanac opskrbe
1. Upravljanje zalihama. S dodatnim detaljima koje nudi napredno analitičko rudarenje višestrukih skupova
podataka, veliki podaci mogu nastaviti poboljšavati upravljanje zalihama trgovaca, najbolje u klasi
upravljanje zalihama pruža potpunu transparentnost na razini SKU-a, dok sustavi crtičnog koda
povezani s automatiziranim procesima nadopunjavanja smanjuju incidente nestanka zaliha. Vodeći
trgovci na malo poboljšavaju predviđanje zaliha kombiniranjem više skupova podataka kao što su
povijest prodaje, vremenska predviđanja i sezonski ciklusi prodaje. Zajedno, poboljšano upravljanje
zalihama omogućuje trgovcima na malo da drže nižu razinu zaliha jer su zalihe mnogo čvršće
povezane sa signalima potražnje, istovremeno smanjujući broj izgubljenih prodaja zbog nestašice
robe.
2. Optimizacija distribucije i logistike. Vodeći trgovci na malo također optimiziraju prijevoz korištenjem
velike podatkovne telematike s omogućenim GPS-om (tj. daljinsko izvješćivanje o položaju, itd.) i
optimizacijom ruta kako bi poboljšali upravljanje svojim voznim parkom i distribucijom. Transportna
analitika može poboljšati produktivnost optimiziranjem učinkovitosti goriva, preventivnog
održavanja, ponašanja vozača i rutiranja vozila.
3. Informiranje pregovora s dobavljačima. U svijetu velikih podataka, vodeći trgovci na malo mogu
analizirati preferencije kupaca i kupovno ponašanje kako bi informirali svoje pregovore s
dobavljačima. Oni mogu koristiti podatke o cijenama i transakcijama kako bi usmjerili dogovorene
koncesije na ključne proizvode, na primjer. Korištenje velikih podataka u ovoj areni značajna je
prilika, s obzirom na to da cijena prodane robe čini najveći dio troškova za trgovca na malo.
Međutim, trebali bismo primijetiti da dobavljači također prepoznaju važnost razumijevanja
preferencija kupaca te aktivno dobivaju pristup i analiziraju podatke o ponašanju potrošača kako
bi otkrili uvide koji jačaju njihovu ulogu u pregovorima s trgovcima na malo.
Novi poslovni modeli
Lavina podataka u maloprodajnoj industriji, zajedno s drugim naprecima u poslovanju, omogućuje pojavu
inovativnih poslovnih modela. Ti su modeli najintrigantniji i najinovativniji—ali i potencijalno najopasniji—
za tradicionalne trgovce. Dva nova poslovna modela s najvećom privlačnošću danas su usluge usporedbe
cijena i tržišta temeljena na webu.
1. Usluge usporedbe cijena. Danas je uobičajeno da treće strane nude stvarne

određivanje cijena u vremenu ili gotovo u stvarnom vremenu i povezana transparentnost cijena za
proizvode kod više trgovaca. Potrošači mogu odmah usporediti cijenu određenog proizvoda na
više prodajnih mjesta. Gdje su te usporedbe moguće, cijene su obično niže. Studije pokazuju da
potrošači u prosjeku štede 10 posto kada mogu kupovati koristeći takve usluge. Trgovci moraju
pažljivo razmisliti o tome kako odgovoriti na takve usluge usporedbe cijena. Oni koji se mogu
natjecati cijenom htjet će osigurati da budu najvidljiviji na takvim uslugama. Trgovci na malo koji se
ne mogu natjecati cijenom morat će odrediti kako se razlikovati od konkurenata u cjenovno
transparentnom svijetu, bilo da se radi o kvaliteti kupovnog iskustva, diferenciranim proizvodima ili
pružanju drugih usluga s dodanom vrijednošću.
2. Tržišta temeljena na webu. Tržišta temeljena na webu, poput onih koje nudi
Amazon i eBay pružaju pretražive popise proizvoda velikog broja dobavljača. Osim
transparentnosti cijena, oni nude pristup velikom broju prodajnih niša koji inače nemaju
marketinšku ili prodajnu snagu da dođu do potrošača. Oni također pružaju ogromnu
količinu korisnih informacija o proizvodu, uključujući recenzije koje generiraju potrošači i
koje potrošačima pružaju dodatnu transparentnost.
Budući da smo se oslanjali na najbolju globalnu praksu, nalazi ove studije slučaja mogu se
primijeniti na druge zemlje i regije—uz određene rezerve. Razvijena gospodarstva naći će poluge
koje smo identificirali i rezultirajuće analize izravno primjenjivima. Ali potencijalne prilike mogle
bi biti još veće u područjima koja još nisu počela koristiti velike podatke kao pokretač rasta. U
regijama kao što je Europa gdje su zakoni o radu relativno rigidniji, poluge optimizacije radnih
resursa mogu dati manje dramatične rezultate.
VELIK PODATAKA MOŽE OSTVARITI VEĆE MARŽE I PRODUKTIVNOST
Procijenili smo potencijalni učinak svake od 16 poluga velikih podataka koje smo opisali,
koristeći kombinaciju vlastitih studija slučaja, akademskog i industrijskog istraživanja te
intervjua sa stručnjacima; za više o našoj metodologiji pogledajte dodatak. Iako procjenjujemo
ukupnu potencijalnu vrijednost koju veliki podaci mogu omogućiti, ne predviđamo koju će
vrijednost sektor stvarno ostvariti jer to uvelike ovisi o radnjama koje poduzimaju trgovci na malo
kako bi prevladali brojne prepreke, uključujući prepreke povezane s tehnologijom, talentom i
kulturom , kao i vanjski čimbenici poput toga jesu li potrošači spremni na istraživanje podataka
o njihovom ponašanju i sposobnost dobavljača da iskoriste neke od istih poluga u pregovorima.
Marketinške poluge mogu utjecati na 10 do 30 posto operativne marže; poluge

merchandisinga mogu utjecati na 10 do 40 posto; a poluge opskrbnog lanca mogu imati utjecaj od
5 do 35 posto (Prikaz 23). Nasuprot tome, poluge transparentnosti cijena težit će smanjenju cijena
i smanjenju marži.
Ukupan potencijalni učinak pojedinačnih poluga velikih podataka značajno se razlikuje među
maloprodajnim podsektorima (Prikaz 24). Neki će podsektori već povući velike podatkovne poluge
više od drugih, djelomično objašnjavajući ovu varijaciju.
72
Prikaz 23
Različite poluge imaju različite utjecaje na operativne marže poduzeća
Utjecaj na operativnu maržu %
-30 -20 -10 0 10 20 30 40 50
Marketing
Trgovanje robom
Operacije
Lanac opskrbe
Transparentnost cijena
IZVOR: Razgovori stručnjaka; javno dostupni podaci; McKinsey studije slučaja; Analiza McKinsey Global Institute
Dokaz 24
Potencijal velike vrijednosti podataka u maloprodaji Najveća relevantnost
razlikuje se u različitim podsektorima Najniža relevantnost
Općenito Hrane Odjeća i Sport, hobi,

Zdravlje i mer i pića knjiga, Elektronika iNamještaj
trgovine chandis e Trgovci na malo pristup glazba primijeniti i pokućstvo
za osobnu njegu trgovine Građevinski izvan
materijal
trgovinai vrt sories ances Ostalo
Poboljšana unakrsna
prodaja
Marketing temeljen
na lokaciji
Analiza ponašanja u
trgovini
Marketing
Mikro segmentacija
kupaca
Analiza
sentimenta
Poboljšanje
višekanalnog
iskustva
Asortiman
optimizacija
Optimizacija cijena
Optimizacija
postavljanja i dizajna
Transparentnost
Trgovačke
operacije
izvedbe
Optimizacija
utroška rada
Poboljšano
upravljanje
zalihama
Optimizacija
opskrbe
Lanac
distribucije i logistike
Informiranje
pregovora s
dobavljačima
posao
Novi
1 Usluge
usporedbe
cijena
1 Utjecaj tržišta temeljenih na webu vrlo je teško kvantificirati i to nije ovdje uključeno.

Dok pojedinačni igrači mogu koristiti velike podatkovne poluge za rast svojih vrhunskih
linija i operativnih marži, ti će dobici uvelike promijeniti vrijednost unutar industrije, a ne
povećati njezinu ukupnu veličinu. Tvrtke koje su relativno bolje u implementaciji poluga
velikih podataka doživjet će značajne dobitke nauštrb onih koje to ne provode dobro.
Ukupni pobjednici trebali bi biti potrošači koji će imati koristi od robe koja bolje odgovara
njihovim potrebama.
Također smo procijenili potencijalne dobitke produktivnosti na razini industrije,

odlučivši se zauzeti konzervativan pristup takvim procjenama primjenom samo učinaka
poluga u operacijama i opskrbnim lancima koji smanjuju troškove (pogledajte dodatak
za detalje o našoj metodologiji). Ako gledamo samo na učinkovitost, procjenjujemo da
poluge velikih podataka imaju potencijal stvoriti godišnje ubrzanje produktivnosti od 0,5
posto do 2020. Da to stavimo u kontekst, akademsko istraživanje je procijenilo da IT
ulaganja u cijelo američko gospodarstvo, uključujući maloprodaju, tijekom 1990-ih s visokim
rastom dodalo 1 do 2 posto ukupnoj godišnjoj stopi rasta produktivnosti u SAD-u.64
Ova procjena ne uzima u obzir činjenicu da će korištenje velikih podataka biti

blagodat za potrošače kroz ekonomski višak koji će uhvatiti i stoga je konzervativna.
Na primjer, čak i ako maloprodajni potrošači ne potroše više novca u cjelini, mnoge
marketinške i prodajne poluge koje smo opisali poboljšat će njihovo iskustvo kupnje.
Potrošači će pronaći bolje proizvode koji odgovaraju njihovim potrebama (npr. potrošači
koji se odluče uključiti u marketinške programe koji koriste velike podatke za bolje ciljanje
ponuda) i potrošiti manje vremena tražeći te proizvode po pravoj cijeni (npr. jer mogu
dobiti informacije o dostupnosti zaliha prije posjeta trgovini ili koristiti usluge usporedbe
cijena). To bi trebalo povećati stvarnu dodanu vrijednost maloprodajnog sektora, čak i ako je
teško procijeniti vrijednost ovog potrošačkog viška.
Vjerujemo da će korištenje velikih skupova podataka nastaviti mijenjati lice maloprodaje.

Posljednjih desetljeća IT i podaci koji su korišteni za optimizaciju opskrbnih lanaca pomogli
su u stvaranju kategorije veleprodajnih trgovaca koji prodaju velike količine širokog spektra
proizvoda po niskim cijenama. Posljednjih godina internetski trgovci poput Amazona, eBaya
i Groupona redefiniraju što maloprodaja može značiti. Umjesto da informacije o robi i
uslugama primaju od prodajnih timova ili oglasa, potrošači informacije koje su im potrebne
pronalaze od svojih kolega kupaca i pronalaze ono što žele kupiti putem elektroničkih
tržnica.
INDUSTRIJU I KREATORE POLITIKA TREBAJU SAVLADATI
PREPREKE ZA ISKORIŠĆIVANJE POTPUNE MOGUĆNOSTI VELIKIH PODATAKA
Ako maloprodajna industrija želi ostvariti potencijalnu vrijednost korištenja velikih

podataka, i industrija i vlada morat će se suočiti s brojnim važnim preprekama. Tvorci
politike će odlučiti kako će regulirati upotrebu informacija o potrošačima u industriji - izbor
politike koji će imati duboke implikacije na mnoge druge industrije koje će, kao i maloprodaja,
izazivati sve izraženiju zabrinutost oko privatnosti i sigurnosti u eri velikih podataka . Sigurno
je da se stavovi potrošača prema korištenju njihovih osobnih podataka, posebice osobnih
podataka o lokaciji i elektroničkih podataka koji nastaju korištenjem interneta, brzo mijenjaju.
Ali mnogi ljudi ostaju neinformirani o tome kako, gdje i u kojoj mjeri se te informacije
koriste u ciljanom oglašavanju i drugim marketinškim strategijama.
64 Stephen Oliner i Daniel Sichel, “Informacijska tehnologija i produktivnost: Gdje smo sada i kamo
idemo?”, Federal Reserve Bank of Atlanta Economic Review, 2002.
74
Diljem svijeta promatramo pojavu različitih koncepata elektroničke privatnosti. Njemačka je,
primjerice, ograničila korištenje Street View funkcije Google karata. Ovisno o nadležnosti i
svrsi, postoje različite definicije osobnih podataka (PII)—što se zakonski računa kao informacije
koje identificiraju osobu za razne svrhe. Neke su definicije općenitije od drugih, a veliki igrači bi
imali koristi od standarda jedne zemlje ili industrije.
Sa svoje strane, rukovoditelji maloprodaje moraju upravljati i prevladati brojne prepreke kako
bi ostvarili puni potencijal velikih podataka. Prvi je način razmišljanja zaposlenika i tvrtki; mnogi
ljudi još uvijek IT vide kao back-office funkciju i stoga kao veliko troškovno središte, a ne kao
pokretač poslovnog rasta. Nasuprot tome, vodeće tvrtke u svom korištenju velikih podataka
shvaćaju da će njihove IT inicijative biti ključni izvor konkurentske prednosti. Te se tvrtke moraju
pobrinuti da poslovni i IT čelnici blisko surađuju kako bi upotreba velikih podataka poduprla
poboljšanja u poboljšanju učinkovitosti i prilike za stvaranje vrijednosti. Tvrtke bi također trebale
aktivno tražiti i implementirati inovacije temeljene na velikim podacima koje će im dati dugoročne
konkurentske prednosti.
Još jedna uobičajena prepreka predvodnicima velikih podataka su njihovi naslijeđeni IT sustavi.
Mnogi od ovih sustava instalirani su prije nekoliko desetljeća, mnogo prije nego što su današnje
prilike za velike podatke bile razmatrane ili čak moguće. Ovi naslijeđeni sustavi obično uključuju više
silosa informacija generiranih u nekompatibilnim standardima i formatima tako da ih nije moguće lako
integrirati, pristupiti im i analizirati. Pokušaji nadogradnje i integracije ovih sustava mogu biti toliko
teški i opterećeni potencijalom uvođenja novih grešaka u sustavu da se jedan maloprodajni
stručnjak požalio da je takav pokušaj "puno gori od pokretanja od nule".
Čak i implementacija novih IT-omogućenih sustava može predstavljati ogromne izazove.

Jaz između predviđenog opsega usvajanja RFID sustava i njihove stvarne primjene upozorava
nas. RFID je obećavao pružanje izvora podataka o opskrbnom lancu koji bi se mogli iskoristiti
korištenjem tehnika velikih podataka. U ranim danima, pouzdanost RFID čitača bila je daleko gora od
prvobitno očekivanog, zahtijevajući ručne unose za ispravljanje pogrešaka čitača. To je uništilo
povećanje produktivnosti koje se očekivalo od primjene ove tehnologije. Usvajanje je usporeno,
potražnja za RFID oznakama je manja, a troškovi po oznaci nisu pali tako brzo kao što se očekivalo,
jer je ekonomija razmjera bila prigušena. Više cijene oznaka štete poslovnom slučaju za daljnju
implementaciju RFID-a, pojačavajući negativan ciklus u kojem je primjena poluga velikih podataka
temeljenih na ovoj tehnologiji odgođena.
Potencijalno jednako zastrašujući za rukovoditelje maloprodaje zadatak je pronalaženja talenta

koji može izvršiti velike podatkovne poluge. Globalno se rukovoditelji žale na manjak
visokokvalitetnih kandidata za te poslove, a mnogi trgovci na malo nemaju dovoljno talenta u
tvrtki. Štoviše, postojećim analitičkim i tehničkim talentima obično se upravlja neučinkovito,
izolirani su u određenim odjelima ili raštrkani po različitim poslovnim jedinicama. Ljudi s
potrebnim vještinama rijetko su izravno uključeni u donošenje strateških odluka i imaju malo
utjecaja osim odgovaranja na vrlo specifična pitanja. Trgovci s predviđanjem i inteligencijom da
zaposle talente za velike podatke u dovoljnom broju i zatim uključe te zaposlenike u strateške
odluke i planiranje će u potpunosti iskoristiti prilike za stvaranje vrijednosti nauštrb svojih manje
spretnih konkurenata.
U okruženju u kojem se trgovci na malo suočavaju sa značajnim pritiscima zbog sporog

rasta BDP-a u kombinaciji s cjenovnim pritiscima dobavljača uzvodno i potrošača
nizvodno, trgovci se moraju žestoko natjecati kako bi osigurali svoj opstanak i relevantnost.
Dok su informacijska tehnologija i podaci već imali valove utjecaja, naše istraživanje
otkriva da postoji značajan prostor koji proizlazi iz inovacija koje trgovci mogu iskoristiti.
Trgovci na malo koji razvijaju i vježbaju svoje mišiće velikih podataka povećat će svoje
šanse za nadmetanje i pobjedu na račun onih koji ne iskoriste ovu priliku u godinama
koje dolaze.
76
3d. Proizvodnja (globalno)

Proizvodni sektor bio je rani i intenzivni korisnik podataka za poticanje kvalitete i učinkovitosti,
usvajajući informacijsku tehnologiju i automatizaciju za dizajn, izradu i distribuciju proizvoda od
osvita računalne ere. U 1990-ima, proizvodne tvrtke ostvarile su impresivan godišnji porast
produktivnosti zbog operativnih poboljšanja koja su povećala učinkovitost njihovih proizvodnih
procesa i poboljšanja u kvaliteti proizvoda koje su proizvodili. Na primjer, napredni proizvedeni
proizvodi poput računala postali su mnogo moćniji.
Proizvođači su također optimizirali svoj globalni otisak postavljanjem lokacija u regije s niskim
troškovima ili eksternalizacijom proizvodnje u regije s niskim troškovima. No unatoč takvom
napretku, proizvodnja se, nedvojbeno više od većine drugih sektora, suočava s izazovom stvaranja
značajnog poboljšanja produktivnosti u industrijama koje su već postale relativno učinkovite.
Vjerujemo da veliki podaci mogu poduprijeti još jedan znatan val dobitaka.65
Ti će dobici doći iz poboljšane učinkovitosti u dizajnu i proizvodnji, daljnjih poboljšanja u

kvaliteti proizvoda i boljeg zadovoljavanja potreba kupaca kroz preciznije ciljane proizvode te
učinkovitu promociju i distribuciju. Na primjer, veliki podaci mogu pomoći proizvođačima smanjiti
vrijeme razvoja proizvoda za 20 do 50 posto i eliminirati nedostatke prije proizvodnje putem
simulacije i testiranja. Koristeći podatke u stvarnom vremenu, tvrtke također mogu upravljati
planiranjem potražnje u proširenim poduzećima i globalnim opskrbnim lancima, istovremeno
smanjujući kvarove i prerade unutar proizvodnih pogona. Općenito, veliki podaci pružaju sredstva
za postizanje dramatičnih poboljšanja u upravljanju složenim, globalnim, proširenim lancima
vrijednosti koji prevladavaju u proizvodnji i za zadovoljavanje potreba kupaca na inovativne i preciznije
načine, kao što je kolaborativni razvoj proizvoda temeljen na podaci o kupcima.
Ove zaključke temeljimo na ispitivanju višestrukih proizvodnih podsektora koji obuhvaćaju diskretnu
i procesnu proizvodnju, od osnovnih proizvodnih podsektora kao što su roba široke potrošnje i
hrana, do naprednih proizvodnih podsektora kao što su automobilska i zrakoplovna industrija.
Naslonili smo se na primjere najbolje globalne prakse upotrebe velikih podataka kako bismo
identificirali sedam poluga stvaranja vrijednosti, opisali raspon potencijalnog utjecaja i prepreke koje
je potrebno prevladati da bi se uhvatila ta vrijednost.66
PROIZVODNJA JE POVIJESNO BILA PRODUKTIVNOST

LEADER, I VELIK PODATAK MOŽE POMOĆI U POVEĆANJU DOBITAKA
Proizvodni sektor bio je okosnica mnogih razvijenih gospodarstava i tamo je i dalje važan pokretač
BDP-a i zapošljavanja. Međutim, s porastom proizvodnih kapaciteta i mogućnosti u Kini i drugim
zemljama s niskim troškovima, proizvodnja je postala sve globalnija aktivnost, koja uključuje
proširene opskrbne lance omogućene napretkom informacijske i komunikacijske tehnologije.
Iako globalizacija nije nedavni fenomen, eksplozija informacijske i komunikacijske tehnologije,

zajedno sa smanjenim međunarodnim troškovima prijevoza i nižim preprekama ulasku na
tržišta diljem svijeta, uvelike je ubrzala industrijsku
65 Proizvodnja je sektor s višestrukim problemima kojima se napredna gospodarstva moraju pozabaviti,

od kojih mnogi ne uključuju velike podatke. U ovom smo istraživanju usredotočeni na ulogu koju veliki podaci mogu
imati.
66 Naša analiza prvenstveno se usredotočuje na temeljne proizvodne procese proizvođača—tj.

Istraživanje i razvoj, lanac opskrbe i proizvodni procesi—a manje na susjedne procese kao što su marketing i
prodaja.
razvojni put i stvorio sve složenije mreže vrijednosnih lanaca koji obuhvaćaju svijet.67
Sve globalniji i fragmentirani proizvodni lanci vrijednosti stvaraju nove izazove koje
proizvođači moraju prevladati kako bi održali rast produktivnosti. U mnogim su
slučajevima tehnološke promjene i globalizacija omogućile zemljama da se specijaliziraju
za određene faze proizvodnog procesa. Kao rezultat toga, proizvođači su okupili globalnu
proizvodnju i mreže opskrbnog lanca kako bi postigli troškovne prednosti. Na primjer,
tipični globalni proizvođač potrošačke elektronike ima proizvodne pogone na gotovo
svim kontinentima, odmjeravajući troškove logistike u odnosu na troškove proizvodnje
kako bi optimizirao otisak svojih pogona. Napredni proizvođači također često imaju
velik broj dobavljača, specijaliziranih za proizvodnju specifičnih vrsta komponenti gdje imaju
održive prednosti i u cijeni i u kvaliteti. Tipično je da veliku tvornicu za montažu
proizvođača originalne automobilske opreme (OEM) opskrbljuje do 4000 vanjskih dobavljača.
Kako bi nastavili s postizanjem visokih razina rasta produktivnosti, proizvođači će morati

iskoristiti velike skupove podataka kako bi potaknuli učinkovitost u cijelom proširenom
poduzeću te dizajnirali i plasirali na tržište proizvode više kvalitete. “Sirovina” je lako
dostupna; proizvođači već imaju značajnu količinu digitalnih podataka s kojima mogu raditi.
Proizvodnja pohranjuje više podataka nego bilo koji drugi sektor—blizu 2 egzabajta novih
podataka pohranjenih u 2010. Ovaj sektor generira podatke iz mnoštva izvora, od
instrumentiranih proizvodnih strojeva (kontrola procesa), do sustava upravljanja opskrbnim
lancem, do sustava koji nadziru performanse proizvoda koji su već prodani (npr. tijekom
jednog međunarodnog leta, Boeing 737 generira 240 terabajta podataka).
A količina generiranih podataka nastavit će eksponencijalno rasti. Predviđa se da će broj

RFID oznaka prodanih na globalnoj razini porasti s 12 milijuna u 2011. na 209 milijardi u
2021. IT sustavi instalirani duž vrijednosnog lanca za praćenje proširenog poduzeća
stvaraju dodatna spremišta sve složenijih podataka, koji se trenutačno nalaze samo u IT
sustav u kojem se generira. Proizvođači će također početi kombinirati podatke iz različitih
sustava uključujući, na primjer, računalno potpomognuti dizajn, računalno potpomognuti
inženjering, računalno potpomognutu proizvodnju, kolaborativno upravljanje razvojem
proizvoda i digitalnu proizvodnju, te preko organizacijskih granica u, na primjer, krajnjem
podaci o opskrbnom lancu do kraja.
PROIZVOĐAČI MOGU KORISTITI VELIKE PODATKE U LANCU VRIJEDNOSTI
Big data ima potencijal omogućiti sedam poluga za poboljšanje performansi za

proizvođače, utječući na cijeli lanac vrijednosti (Prikaz 25). U ovom ćemo odjeljku redom
raspravljati o svakom od njih.
Istraživanje i razvoj i dizajn proizvoda Korištenje velikih
podataka nudi daljnje mogućnosti za ubrzavanje razvoja proizvoda, pomaže dizajnerima

da se usredotoče na najvažnije i najvrednije značajke na temelju konkretnih korisničkih
unosa kao i na dizajne koji minimiziraju troškove proizvodnje i iskoriste uvide potrošača
za smanjenje troškove razvoja kroz pristupe koji uključuju otvorene inovacije.
67 Dok je prijelaz na postindustrijsko gospodarstvo trajao oko 200 godina u Ujedinjenom Kraljevstvu
i oko 130 godina u Njemačkoj, Južnoj Koreji trebalo je oko 60 godina. Vidi Eberhard Abele,
Tobias Meyer, Ulrich Näher, Gernot Strube i Richard Sykes, ur., Globalna proizvodnja: priručnik
za strategiju i provedbu (Berlin: Springer, 2008.).
78
Dokaz 25
Identificirali smo sljedeće poluge velikih podataka u lancu

vrijednosti proizvodnje
Upravljanje Tržište i Usluga
istraživanje i razvoj i Proizvodnja
lancem prodaja nakon
oblikovati
opskrbe prodaje
1 Izgradite dosljedne interoperabilne, međufunkcionalne baze podataka

za istraživanje i razvoj i dizajn proizvoda duž opskrbnog lanca kako
biste omogućili istodobni inženjering, brzo eksperimentiranje i
simulaciju te zajedničko stvaranje
2 Skupite podatke o klijentima i učinite ih široko dostupnima kako

biste poboljšali razinu usluge, uhvatili prilike za unakrsnu i veću
prodaju i omogućili dizajn prema vrijednosti
3 Izvor i dijeljenje podataka putem virtualnih stranica za suradnju (tržišta

ideja za omogućavanje prikupljanja podataka)
4 Implementirajte napredno predviđanje potražnje i planiranje ponude

među dobavljačima i korištenjem vanjskih varijabli
5 Provedite vitku proizvodnju i modelirajte proizvodnju virtualno (digitalna

tvornica) kako biste stvorili transparentnost procesa, razvili nadzorne
ploče i vizualizirali uska grla
6 Implementirajte operacijsku analitiku temeljenu na podacima senzora

kako biste poboljšali propusnost i omogućili masovnu prilagodbu
7 Prikupite podatke nakon prodaje od senzora i povratne informacije u

stvarnom vremenu kako biste pokrenuli usluge nakon prodaje i otkrili
nedostatke u proizvodnji ili dizajnu
1. Upravljanje životnim ciklusom proizvoda. Tijekom desetljeća proizvodne su tvrtke

implementirale IT sustave za upravljanje životnim ciklusom proizvoda, uključujući
računalno potpomognuti dizajn, inženjering, proizvodnju i alate za upravljanje
razvojem proizvoda i digitalnu proizvodnju. Međutim, veliki skupovi podataka koje
generiraju ti sustavi obično ostaju zarobljeni unutar svojih odgovarajućih sustava.
Proizvođači bi mogli iskoristiti značajnu priliku za velike podatke kako bi stvorili veću
vrijednost uspostavljanjem platformi za upravljanje životnim ciklusom proizvoda (PLM)
koje mogu integrirati skupove podataka iz više sustava kako bi se omogućila učinkovita
i dosljedna suradnja. Na primjer, PLM bi mogao pružiti platformu za "kokreaciju", npr.
spajanje unutarnjih i vanjskih inputa za stvaranje novih proizvoda.
Ovo je posebno korisno u područjima kao što je zrakoplovstvo gdje se novi
proizvod može sastaviti sa stotinama tisuća komponenti koje isporučuju stotine
dobavljača iz cijelog svijeta. U tom kontekstu, zajedničko stvaranje dizajna OEM-a
s dobavljačima može biti iznimno vrijedno. PLM platforme također mogu značajno
omogućiti eksperimentiranje u fazi projektiranja. Dizajneri i proizvodni inženjeri
mogu dijeliti podatke i brzo i jeftino stvarati simulacije za testiranje različitih dizajna,
izbora dijelova i dobavljača te povezanih troškova proizvodnje. To je osobito korisno
jer odluke donesene u fazi projektiranja obično pokreću 80 posto troškova
proizvodnje.
Vodeći igrači u naprednim industrijama već prihvaćaju zajedničko korištenje

podataka i kontrolirano eksperimentiranje. Toyota, Fiat i Nissan skratili su vrijeme
razvoja novih modela za 30 do 50 posto; Toyota tvrdi da je otklonila 80 posto
nedostataka prije izrade prvog fizičkog prototipa.68 Međutim, dok je isplata za ovu
priliku velika, proizvođači će vjerojatno morati uložiti značajnu nadogradnju svojih
sustava, koji su u mnogim slučajevima stari desetljećima. Osim tehničkog rada
integracije skupova podataka iz
68 Imajte na umu da osim smanjenja vremena razvoja, proizvođači, kao rezultat korištenja
integrirani PLM, mogu poboljšati kvalitetu i smanjiti resurse kako bi razvili više izvedenica ili
proširenja proizvoda.
različitih IT sustava, proizvođači će morati osigurati da članovi osoblja iz različitih funkcija

(Istraživanje i razvoj, proizvodnja) i organizacija (OEM-ovi, dobavljači) koriste ove alate za suradnju.
Danas je nedostatak suradnje između silosa bliži normi.
2. Dizajn prema vrijednosti. Dok dobivanje ulaznih podataka od kupaca kroz istraživanje tržišta ima
Tradicionalno dio procesa dizajna proizvoda, mnogi proizvođači tek trebaju sustavno izvući ključne
uvide iz sve veće količine podataka o kupcima kako bi poboljšali postojeće dizajne i pomogli u razvoju
specifikacija za nove modele i varijante. Najbolji proizvođači u klasi provode zajedničke analize kako bi
odredili koliko su kupci spremni platiti za određene značajke i kako bi razumjeli koje su značajke
najvažnije za uspjeh na tržištu.69 Te tvrtke nadopunjuju takve napore dodatnim kvantitativnim
uvidima o kupcima iz izvora kao što su kao podaci o prodajnom mjestu i povratne informacije kupaca.
Novi izvori podataka koje proizvođači počinju iskopavati uključuju komentare kupaca na društvenim
mrežama i podatke senzora koji opisuju stvarnu upotrebu proizvoda.
Međutim, dobivanje pristupa sveobuhvatnim podacima o kupcima u svrhu postizanja

holističkih uvida može biti značajna prepreka za proizvođače; distributeri, trgovci na malo i
drugi igrači možda neće htjeti dijeliti takve podatke, smatrajući ih konkurentskom imovinom.
Unatoč tome, veličina nagrade za uspješno projektiranje prema vrijednosti može biti znatna,
posebno u podsektorima s visokom diferencijacijom proizvoda i promjenjivim preferencijama kupaca.
Na primjer, jedan proizvođač telekomunikacijske opreme upotrijebio je podatke o uvidima kupaca
kako bi poboljšao bruto maržu za 30 posto u 24 mjeseca, eliminirajući nepotrebne skupe značajke i
dodajući one koje su imale veću vrijednost za kupca i za koje je kupac bio spreman platiti višu cijenu.
3. Otvorena inovacija. Poticati inovacije i razvijati proizvode koji se bave

nadolazećim potrebama kupaca, proizvođači se sve više oslanjaju na vanjske unose putem
inovativnih kanala. S pojavom Weba 2.0, neki proizvođači pozivaju vanjske dionike da predaju
ideje za inovacije ili čak surađuju na razvoju proizvoda putem web platformi.
Tvrtke koje se bave proizvodnjom robe široke potrošnje kao što su Kraft i Procter and Gamble
pozivaju svoje potrošače na ideje, kao i surađuju s vanjskim stručnjacima, uključujući akademike i
industrijske istraživače, na razvoju novih proizvoda. Početkom 2000-ih, P&G se suočio s problemom
rastućih troškova istraživanja i razvoja, ali sve manjom isplativošću. Kao odgovor na to, tvrtka je
stvorila program otvorenih inovacija Connect and Develop, čiji je jedan element bio iskorištavanje
InnoCentivea, web platforme koja poziva stručnjake da riješe tehničke izazove s kojima se P&G
suočava.
Danas polovica novih proizvoda ima elemente koji su nastali izvan tvrtke, što je porast u odnosu na
15 posto u 2000. Produktivnost istraživanja i razvoja u P&G-u porasla je za 60 posto, a udio
istraživanja i razvoja u prihodu pao je s 4,8 na 3,4 posto. Ali koliko god uspješne ove otvorene
inovacijske inicijative mogle biti, jedan ključni problem je kako izvući, na učinkovit način, istinski
vrijedne ideje iz potencijalno velikog broja inputa koje ovi programi mogu generirati. To je zadatak koji
tehnike velikih podataka poput automatiziranih algoritama mogu pomoći riješiti.
Otvorene inovacije putem velikih podataka proširene su i na napredne industrije. BMW je, na
primjer, stvorio "sustav za upravljanje idejama" kako bi pomogao u procjeni ideja predanih putem
svoje "virtualne agencije za inovacije". Ovo je presjeklo
69 Zajednička analiza je statistička tehnika koja uključuje pružanje kontroliranog skupa

potencijalnih proizvoda i usluga za izvlačenje preferencija krajnjih korisnika kroz koje se može
odrediti implicitna procjena pojedinačnih elemenata koji čine proizvod ili uslugu.
80
vrijeme potrebno za prepoznavanje ideja visokog potencijala za 50 posto i također je smanjilo

vrijeme potrebno za donošenje odluke o tome koliko je neka ideja izvediva. Rezultat
je da je tvrtka svake godine u svoje modele uključila dvije ili tri glavne ideje iz svojih napora
otvorenih inovacija. Dodatna prednost ovih tehnika otvorene inovacije je da stvaraju više
angažmana robne marke kod sudionika u tim naporima, kao i pozitivan "halo" učinak kako ove
inicijative postaju šire prepoznate.
Lanac opskrbe
Proizvođači, posebno oni koji proizvode robu široke potrošnje, imaju značajne dodatne
mogućnosti za poboljšanje predviđanja potražnje i planiranja opskrbnog lanca. Nestalnost potražnje
kritično je pitanje za proizvođače. Njihovi kupci u maloprodaji snažno su se zalagali za veću fleksibilnost
i osjetljivost dobavljača, s obzirom na različite i stalno mijenjajuće preferencije potrošača.
Ostali trendovi, poput sve većeg korištenja promocija i taktičkog određivanja cijena, samo su povećali
probleme volatilnosti s kojima se dobavljači suočavaju.
Proizvođači mogu poboljšati svoje predviđanje potražnje i planiranje ponude poboljšanom

upotrebom vlastitih podataka. No, kao što smo vidjeli u drugim domenama, daleko se više vrijednosti
može otključati kada tvrtke mogu integrirati podatke iz drugih izvora uključujući podatke od trgovaca,
kao što su podaci o promociji (npr. artikli, cijene, prodaja), podaci o lansiranju (npr. određene stavke
koje treba navesti/ukloniti, planove povećanja/smanjenja) i podatke o zalihama (npr. razine zaliha po
skladištu, prodaja po trgovini). Uzimajući u obzir podatke iz cijelog lanca vrijednosti (potencijalno kroz
zajedničko upravljanje lancem opskrbe i planiranje), proizvođači mogu izgladiti uzorke šiljastih
narudžbi.
Prednosti toga će se protezati kroz lanac vrijednosti, pomažući proizvođačima da učinkovitije koriste
gotovinu i isporuče višu razinu usluge. Najbolji proizvođači u klasi također ubrzavaju učestalost
ciklusa planiranja kako bi ih uskladili s proizvodnim ciklusima. Doista, neki proizvođači koriste podatke
gotovo u stvarnom vremenu za prilagodbu proizvodnje. Drugi surađuju s trgovcima na malo kako bi
oblikovali potražnju na razini trgovine s vremenskim popustima.
Proizvodnja
Veliki podaci pokreću dodatnu učinkovitost u proizvodnom procesu uz primjenu simulacijskih

tehnika na već veliku količinu podataka koje proizvodnja generira. Sve veća primjena
"Interneta stvari" također omogućuje proizvođačima korištenje podataka senzora u stvarnom
vremenu za praćenje dijelova, nadzor strojeva i vođenje stvarnih operacija.70
1. Digitalna tvornica. Uzimanje inputa iz razvoja proizvoda i povijesti

proizvodnih podataka (npr. podataka o narudžbi, performansi stroja), proizvođači mogu
primijeniti napredne računalne metode za stvaranje digitalnog modela cjelokupnog proizvodnog
procesa. Takva "digitalna tvornica" - uključujući sve strojeve, radnu snagu i opremu - može se
koristiti za dizajn i simulaciju najučinkovitijeg proizvodnog sustava, od rasporeda do slijeda koraka,
za određeni proizvod. Vodeći proizvođači automobila upotrijebili su ovu tehniku za optimiziranje
rasporeda proizvodnje novih pogona, osobito kada postoje bezbrojna ograničenja kao što su
prostor i distribucija komunalnih usluga. Proizvođač čelika upotrijebio je simulaciju za modeliranje
cijelog svog portfelja tvornica i brzo testiranje poluga za poboljšanje; ovo je dovelo do
70 “Internet stvari” odnosi se na senzore i aktuatore unutar mreža fizičkih objekata. Za više
informacija pogledajte Michael Chui, Markus Löffler i Roger Roberts, “The Internet of Things”,
McKinsey Quarterly, ožujak 2010.
poboljšanje pouzdanosti isporuke od 20 do 30 postotnih bodova. Studije slučaja u

automobilskoj, zrakoplovnoj i obrambenoj industriji te poluvodičima pokazuju da ove vrste
naprednih simulacija mogu smanjiti broj promjena crteža u proizvodnji, kao i troškove
dizajna i konstrukcije alata.71 Postrojenja dizajnirana ovim tehnikama također su ostvarila
znatna smanjenja u sati montaže, ušteda troškova, pa čak i poboljšana pouzdanost
isporuke.
2. Operacije vođene senzorima. Proliferacija aplikacija Internet of Things proizvođačima

omogućuje optimiziranje operacija ugradnjom visoko granularnih podataka u stvarnom
vremenu iz umreženih senzora u opskrbni lanac i proizvodne procese. Ovi podaci
omogućuju sveprisutnu kontrolu procesa i optimizaciju za smanjenje otpada i maksimiziranje
prinosa ili protoka. Oni čak omogućuju inovacije u proizvodnji koje do sada nisu bile moguće,
uključujući nano proizvodnju.72
Neki od najboljih primjera korištenja velikih podataka iz senzorskih mreža dolaze iz

procesne proizvodnje kao što je rafiniranje nafte. Desetljećima je naftna industrija koristila
ogromne količine podataka u stvarnom vremenu za razvoj sve više teško dostupnih ležišta.
Sada je industrija proširila svoju upotrebu velikih podataka na stranu proizvodnje na
automatizirana, daljinski nadzirana naftna polja. Prednost ovog pristupa je u tome što
smanjuje operativne troškove i troškove održavanja koji mogu činiti 60 posto uzaludnih
troškova. U digitalnom naftnom polju, jedan sustav prikuplja podatke iz monitora protoka u
bušotinama, seizmičkih senzora i satelitskih telemetrijskih sustava. Podaci se prenose u vrlo
velike podatkovne farme, a zatim se prenose u operativni centar u stvarnom vremenu koji
nadzire i prilagođava parametre za optimizaciju proizvodnje i smanjenje vremena zastoja.
Iskustvo pokazuje da digitalna naftna polja mogu smanjiti operativne troškove za 10 do 25
posto, čak i uz potencijalno povećanje proizvodnje za 5 posto ili više.
Marketing i podrška prodaji/nakon prodaje Kao što
smo opisali, proizvodne tvrtke koriste podatke iz interakcija s kupcima ne samo za poboljšanje
marketinga i prodaje, već i za donošenje odluka o razvoju proizvoda. Sve je više ekonomski
izvedivo ugraditi senzore u proizvode koji mogu "telefonirati kući", generirajući podatke o
stvarnom korištenju i izvedbi proizvoda. Proizvođači sada mogu u stvarnom vremenu dobiti
podatke o nedostacima koji se pojavljuju i odmah prilagoditi proizvodni proces. Operacije
istraživanja i razvoja mogu dijeliti te podatke za redizajn i razvoj novih proizvoda. Mnogi
proizvođači građevinske opreme već ugrađuju senzore u svoje proizvode, a to može pružiti
precizne podatke u stvarnom vremenu o korištenju i obrascima korištenja, omogućujući tim
proizvođačima da poboljšaju predviđanja potražnje, kao i njihov budući razvoj proizvoda.
Postoje i mnoge prilike za iskorištavanje velikih skupova podataka u aktivnostima marketinga,

prodaje i usluga nakon prodaje. Kao što možemo primijetiti u mnogim sektorima, mogućnosti
se kreću od segmentacije kupaca do primjene analitike kako bi se poboljšala učinkovitost
prodajnih snaga. Sve važnija primjena za proizvođače je korištenje podataka senzora iz
proizvoda nakon što su u upotrebi za poboljšanje ponude usluga. Na primjer, analiza podataka
koje su prijavili senzori ugrađeni u složene proizvode omogućuje proizvođačima zrakoplova,
dizala i poslužitelja podatkovnih centara stvaranje proaktivnih pametnih paketa usluga
preventivnog održavanja. Popravak
71 Vidi primjerice U. Bracht i T. Masurat, “Digitalna tvornica između vizije i stvarnosti”,

Računala u industriji 56(4), svibanj 2005.
72 Primjer je ispis u nanorazmjerima u poluvodičima.
82
tehničar može biti poslan prije nego što kupac uopće shvati da će komponenta
vjerojatno pokvariti. Drugi su proizvođači uspjeli transformirati komercijalni odnos s
kupcima iz odnosa u kojem prodaju proizvod u odnos u kojem prodaju uslugu. Primjer su
proizvođači mlaznih motora koji prodaju "snagu po satu".
VELIKI PODATACI U SKUPNOM PODRUČJU ZNAČAJNIH
POTENCIJAL PRODUKTIVNOSTI I INOVACIJA
Za proizvođače, mogućnosti koje omogućuju veliki podaci mogu potaknuti povećanje

produktivnosti kroz poboljšanje učinkovitosti i kvalitete proizvoda (Prikaz 26).73 Dobici u
učinkovitosti proizlaze iz cijelog lanca vrijednosti, od smanjenja nepotrebnih ponavljanja u
ciklusima razvoja proizvoda do optimizacije procesa sklapanja. Realna izlazna vrijednost
proizvoda povećava se poboljšanjem njihove kvalitete i izradom proizvoda koji bolje
odgovaraju potrebama kupaca.
Prikaz 26
Poluge velikih podataka mogu isporučiti vrijednost duž lanca vrijednosti

proizvodnje u smislu troškova, prihoda i radnog kapitala
Udarac
Obrtni Primjenjivost podsektora
Primjeri poluga trošak Prihod kapital
Konkurentni +20–50% PD2 troškova -20-50% vremena do Visoka – Niska složenost

inženjering/PLM1 tržišta
Istraživanje i
Dizajn prema +30% bruto marže Visoka – Niska složenost
razvoj i dizajn
vrijednosti Crowd sourcing -25% PD2 troškova B2C – B2B
Predviđanje/oblikovanje +2–3% profitna -3–7% FMCG3 – Kapitalna dobra

Upravljanje lancem potražnje i planiranje marža jednokratno
opskrbe ponude
Vođen podacima senzora -10–25% Do +7% prihoda Kapitalno intenzivno – CPG3

operativna analitika operativni troškovi
Proizvodnja "Digitalna tvornica" za vitku -10–50% troškovi +2% prihoda Kapitalno intenzivno – CPG3
proizvodnju montaže
Analiza podataka senzora -10–40% +10% godišnje Kapitalno intenzivno – CPG3

Postprodajne proizvoda za usluge nakon troškova proizvodnje
usluge prodaje održavanja
1 Upravljanje životnim ciklusom proizvoda.

2 Razvoj proizvoda.
3 Roba široke potrošnje i pakirana roba široke potrošnje.
IZVOR: Razgovori stručnjaka; pretraživanje tiska i literature; Analiza McKinsey Global Institute
Osim povećanja produktivnosti, veliki podaci omogućuju inovativne usluge, pa čak i

nove poslovne modele u proizvodnji. Podaci senzora omogućili su inovativne usluge
nakon prodaje. Na primjer, BMW-ov ConnectedDrive nudi vozačima upute na temelju
informacija o prometu u stvarnom vremenu, automatski poziva pomoć kada senzori
pokažu problem, upozorava vozače o potrebi održavanja na temelju stvarnog stanja
automobila i dostavlja podatke o radu izravno servisnim centrima. Mogućnost praćenja
korištenja proizvoda na mikrorazini također je omogućila modele monetizacije koji se
ne temelje na kupnji proizvoda, već na uslugama koje se cijene prema njihovoj upotrebi,
kao što smo opisali. Sposobnost razmjene podataka kroz prošireno poduzeće također
je omogućila radikalno razdvajanje proizvodnje u visoko distribuirane mreže. Na primjer,
Li and Fung, dobavljač maloprodaje odjeće, upravlja mrežom od više od 7500 dobavljača,
od kojih se svaki fokusira na isporuku vrlo specifičnog dijela opskrbnog lanca.
73 Dobici će se vjerojatno pokazati iu produktivnosti rada i produktivnosti resursa.

Neki od najsnažnijih utjecaja velikih podataka primjenjuju se na čitave proizvodne

ekosustave. Kao što smo dokumentirali, veliki podaci igraju ključnu ulogu u
osiguravanju da ove mreže ekosustava dobro funkcioniraju i nastavljaju se razvijati.
Doista, mogli bi se početi pojavljivati novi podatkovni posrednici ili podatkovna
poduzeća. Mogli bi, primjerice, kapitalizirati ekonomsku vrijednost podataka koji opisuju
protok robe diljem svijeta.
PROIZVOĐAČI MORAJU BIJESTI ORGANIZACIJSKI,

KULTURNI IZAZOVI I IZAZOVI TALENATA ZA MAKSIMIZIRANJE
PREDNOSTI BIG DATA
Velik dio vrijednosti koju veliki podaci mogu stvoriti u proizvodnji zahtijeva pristup i
raznoliku upotrebu podataka iz više izvora u cijelom proširenom poduzeću. Dakle,
da bi se ispunio potencijal za stvaranje vrijednosti u ovom sektoru, od proizvodnih će
tvrtki biti potrebno ulaganje u IT kao i organizacijske promjene. Potrebna dodatna IT
ulaganja možda nisu beznačajna. Neke od poluga velikih podataka o kojima smo
raspravljali, uključujući ažuriranje PLM platforme koja može povezati različite IT sustave,
bit će skupe. Ipak, dugoročna isplativost trebala bi nadmašiti trošak. Ostala ulaganja
bit će potrebna za razvoj sučelja i protokola za učinkovito dijeljenje podataka u proširenom
poduzeću. Standardizacija sučelja bit će ključna i može zahtijevati partnerstva u cijeloj
industriji. Snažno podijeljene tvrtke, s više IT sustava i preklapajućim i/ili suvišnim
podacima u različitim operacijama i odjelima, očito su u nepovoljnijem položaju. Na
primjer, kako bi ostvarila prednosti dizajna prema vrijednosti, tvrtka mora imati besplatnu
razmjenu podataka između marketinga i prodaje, istraživanja i razvoja i proizvodnje. Dakle,
u mnogim će organizacijama postizanje uspjeha zahtijevati snažno vodstvo i kulturološki
pomak kako bi se uspostavili načini razmišljanja i ponašanja koji će probiti današnje
silose. Mnoge će organizacije morati poduzeti programe organizacijskih promjena kako bi
izvršile nužnu promjenu—grupe koje nikada nisu dijelile svoje podatke neće to početi
činiti samo zato što su IT sustavi na mjestu.
Mnoge poluge također zahtijevaju pristup podacima različitih igrača u lancu

vrijednosti. Za optimizaciju planiranja proizvodnje bit će potrebni podaci iz različitih
razina dobavljača. Za planiranje potražnje bit će potrebni podaci o kupcima od trgovaca.
Kako bi pristupili takvim skupovima podataka, proizvođači će morati razmisliti o
uspostavljanju pravih vrijednosnih prijedloga i poticaja. Mnogi trgovci, na primjer, čuvaju
podatke kupaca kao vlasničke, ali bilo je slučajeva uspješnog dijeljenja podataka. Značajan
primjer je model zaliha kojim upravlja dobavljač između nekih velikih trgovaca na malo i
tvrtki za pakiranje robe široke potrošnje, koji je u značajnoj mjeri uveo Wal-Mart, kao što
smo raspravljali u našoj studiji slučaja maloprodaje.
Proizvodne tvrtke također će morati izgraditi sposobnosti potrebne za upravljanje velikim

podacima. Unatoč činjenici da se sektor već dva desetljeća bavi velikim skupovima
podataka, sve veća količina podataka iz novih izvora duž opskrbnog lanca i s krajnjih
tržišta zahtijeva novu razinu pohrane i računalne snage te duboku analitičku stručnost
ako proizvođači žele prikupiti relevantne informacije i uvide.
Postoji manjak talenta s pravim iskustvom za upravljanje ovom razinom složenosti.
Proizvođači će trebati ne samo regrutirati nove talente, već i ukloniti organizacijske
prepreke koje danas onemogućuju takve pojedince da maksimalno doprinesu. Na primjer,
znamo za rafinerije nafte koje se još uvijek oslanjaju na upravitelja s proračunskim
tablicama za planiranje održavanja i nadogradnje opreme—posao koji se može postići
učinkovitije s algoritmima koji koriste podatke prikupljene izravno sa strojeva.
84
Konačno, tamo gdje velike podatkovne aplikacije dotiču potrošače i druge krajnje korisnike,
postoje problemi s privatnošću. Jedna od ideja koja najviše obećava korištenje je podataka
senzora proizvoda za stvaranje fino ciljanih usluga nakon prodaje ili dodatne prodaje. Ali
korištenje ove poluge bit će moguće samo ako se potrošači ne bune protiv toga da dobavljači
nadziru kako koriste njihove proizvode. Proizvođači se stoga moraju proaktivno pozabaviti
pitanjima privatnosti, u suradnji s kreatorima politike, i komunicirati s krajnjim korisnicima o
izborima i transparentnosti podataka.
Proizvođači imaju ogroman potencijal za generiranje vrijednosti korištenjem velikih

skupova podataka, integracijom podataka u cijelom proširenom poduzeću i primjenom
naprednih analitičkih tehnika za povećanje produktivnosti povećanjem učinkovitosti i
poboljšanjem kvalitete svojih proizvoda. Na tržištima u razvoju proizvođači mogu
početi graditi konkurentsku prednost koja nadilazi njihove (do sada) relativno niske
troškove rada. Na razvijenim tržištima proizvođači mogu koristiti velike podatke kako
bi smanjili troškove i pružili veću inovativnost u proizvodima i uslugama.
3e. Podaci o osobnoj lokaciji (globalno)
Svjedoci smo eksplozije u količini dostupnih informacija o tome gdje se ljudi nalaze u
svijetu. Tehnologije poput GPS-a omogućuju nam brzo lociranje uređaja malenog poput
mobilnog telefona unutar nekoliko desetaka metara, a vidimo kako se osobni podaci o
lokaciji koriste za stvaranje vala novih poduzeća i inovativnih poslovnih modela koji dotiču
živote ljudi širom zemaljske kugle. Ova će se revolucija nastaviti tijekom sljedećeg
desetljeća i nakon toga s prilikama koje ne možemo ni zamisliti. Kvaliteta, dostupnost i
količina osobnih podataka o lokaciji poboljšat će se i proširiti, dosežući u mnoge poslovne
sektore i stvarajući transformacijske financijske prilike daleko iznad onih kojima danas
svjedočimo.
Za razliku od drugih domena koje smo ispitali, novi skupovi osobnih podataka o lokaciji nisu
ograničeni na jedan sektor, već sijeku mnoge industrije, uključujući telekomunikacije,
maloprodaju i medije. Ova domena nudi potencijal za stvaranje velike nove vrijednosti u
sljedećih deset godina koju procjenjujemo na više od 100 milijardi dolara prihoda za
pružatelje usluga i čak 700 milijardi dolara vrijednosti za krajnje potrošače i poslovne
korisnike. Ostvarivanje ove vrijednosti zahtijevat će prave pokretače, uključujući dostatna
ulaganja u tehnologiju, infrastrukturu i osoblje, kao i odgovarajuće vladine mjere.
OBIM PODATAKA O OSOBNOJ LOKACIJI SE POVEĆAO
BRZIM RASTOM USVAJANJA MOBILNIH TELEFONA
U ovoj smo analizi ispitali osobne podatke o lokaciji koji točno određuju — unutar nekoliko
gradskih blokova — gdje se osoba (ili uređaj) nalazi u stvarnom vremenu, obično izraženo
u digitalnom kodu koji prikazuje lokaciju pojedinca na mreži razapetoj preko površine
Zemlje (vidi okvir 10, "Kako smo definirali opseg osobnih podataka o lokaciji?").
Rani izvor osobnih podataka o lokaciji bila su plaćanja kreditnim i debitnim karticama
pojedinaca, povezana s osobnim identifikacijskim podacima s kartica koje su uvučene
na prodajnim terminalima (POS) obično na fiksnim lokacijama. Slična veza bila je moguća
korištenjem transakcija izvršenih na bankomatima. U svijetu je 2008. bilo 90 do 100
milijardi takvih transakcija izvan mreže koje su se mogle povezati s POS uređajima. Zakon
provedbene istrage redovito koriste takve podatke za utvrđivanje fizičke lokacije.
Kako se broj ljudi koji koriste mobilne telefone povećao, uporaba signala mobilnih tornjeva
za triangulaciju lokacije takvih uređaja postala je sve češća.
Ova tehnologija ima potencijal identificirati lokaciju vlasnika gotovo 5 milijardi diljem
svijeta. Prodor pametnih telefona također je sve veći. U 2010. već je bilo u upotrebi oko
600 milijuna uređaja, a predviđa se da će njihov broj rasti oko 20 posto godišnje.
Pametni telefoni imaju GPS, tehnologiju koja triangulira lokaciju unutar otprilike 15 metara
pomoću konstelacije satelita u orbiti.
Mnogi pametni telefoni također imaju Wi-Fi umrežavanje, dodatni izvor podataka za
određivanje lokacije. Usluge kao što je Skyhook mapirale su fizičku lokaciju raznih Wi-Fi
mreža koje emitiraju svoj identitet (identifikator skupa usluga ili SSID) i stoga omogućuju
mobilnom uređaju da povezuje Wi-Fi mreže koje detektira s fizičkom lokacijom. Ove
tehnologije pametnih telefona čine osobne podatke o lokaciji preciznijima i daleko
dostupnijima, osobito programerima aplikacija za mobilne uređaje.
Osim toga, razvijaju se nove tehnologije koje određuju osobnu lokaciju unutar zgrada u
kojima su GPS signali notorno slabi. Shopkick je aplikacija za mobilni telefon koja trgovcima
omogućuje praćenje svojih kupaca od trenutka kada uđu u trgovinu hvatajući nečujne
zvukove koje emitiraju uređaji u trgovini na
86
mikrofon mobilnog telefona. Još jedan primjer takve inovacije je tvrtka Path Intelligence sa
sjedištem u Velikoj Britaniji, koja može pratiti pješački promet unutar trgovačkih centara ili
zabavnih parkova pasivnim praćenjem identifikacijskih signala koje šalju pojedinačni mobilni telefoni.
Okvir 10. Kako smo definirali opseg osobnih podataka o lokaciji?

Za potrebe ove analize uključujemo tehnologije koje lociraju pojedinca unutar nekoliko
raskrižja (tj. unutar nekoliko gradskih blokova u urbanom okruženju i možda izvan tih
parametara u manje gusto naseljenim područjima) i sve više s još finijom preciznošću.
Danas postoje tri primarna izvora ovih podataka: GPS čipovi u mobilnim uređajima kao što
su telefoni i osobni navigacijski sustavi; podaci triangulacije mobilnih tornjeva na mobilnim
uređajima; i podaci o osobnom plaćanju karticom povezani s POS terminalom. Ne
uključujemo podatke izvedene iz adresa internetskog protokola jer margina pogreške
uvelike varira ovisno o tome je li uređaj na koji je priključena IP adresa mobilni te o gustoći
i topologiji temeljne IP mreže. Osim toga, naša analiza izostavlja podatke o relativnim
udaljenostima između lokacija bez apsolutnih
koordinate, kao što su podaci izvedeni iz satova koji prate udaljenosti trčanja i raznih
senzora kretanja.
Također smo isključili podatke o lokaciji ne-ljudskih objekata kao što su paketi
koji se prate kao inventar ili kontejneri za otpremu koji su označeni GPS senzorima.
Praćenje lokacije objekata može omogućiti ogromnu ekonomsku vrijednost. Na
primjer, globalna lokacija robe visoke vrijednosti i/ili kvarljive robe dok je u otpremi, npr.
farmaceutskih proizvoda ili komponenti visoke tehnologije, podaci su od velike vrijednosti
i za dobavljače i za kupce tih proizvoda. Neke logističke tvrtke već nude mogućnost
pružanja ovih podataka svojim klijentima, kombinirajući lokaciju s drugim podacima sa
senzora na brodu paketa koji prevoze tu robu, npr. temperaturu ili fizičke šokove koje su
pretrpjeli tijekom prijevoza. Neke od prednosti praćenja lokacije objekata već su se
pokazale u našem istraživanju maloprodaje i proizvodnje. Za ovu smo studiju slučaja
proučavali primjene podataka o lokaciji o pojedincima kako bismo se usredotočili na skup
novih aplikacija i aplikacija u nastajanju te ograničili naše istraživanje na opseg kojim se
može upravljati.
Kombinacija navigacijskih uređaja, praćenja mobilnih tornjeva i pametnih telefona čini većinu
osobnih podataka o lokaciji danas. Navigacijski uređaji glavni su izvor količine podataka jer tako
često ažuriraju svoje lokacije. Mobilni tornjevi generiraju veliku količinu osobnih podataka o
lokaciji jednostavno zato što postoji toliko mnogo korisnika mobilnih telefona diljem svijeta. A
pametni telefoni su ogroman i brzo rastući izvor tih podataka jer većina korisnika koristi aplikacije
koje zahtijevaju praćenje njihove lokacije.
Naše istraživanje procjenjuje da je globalni skup generiranih osobnih podataka o lokaciji bio
najmanje 1 petabajt u 2009. i da taj skup raste za oko 20 posto godišnje (Prikaz 27).74 (Imajte na
umu da ne uključujemo potencijalnu količinu podataka iz triangulacija staničnih tornjeva.)75
Eksplozivan rast upotrebe pametnih telefona s GPS-om je
74 Petabajt je ekvivalent otprilike 20 milijuna ormarića s četiri ladice punih teksta.

75 Nismo uključili podatke o lokaciji izvedene iz triangulacije mobilnih tornjeva jer su lokacije
su relativno neprecizni. Uključivanje tih podataka povećalo bi našu procjenu veličine osobnih
podataka o lokaciji 400 puta, s obzirom na to da se signali najbližih mobilnih tornjeva određuju
svakih sedam sekundi.
glavni pokretač ove ekspanzije.76 U usporedbi s drugim sektorima, kao što je zdravstvo, koji
mjere veličinu ukupnih podataka u eksabajtima (1 eksabajt je 1000 puta PB), ukupna veličina
podataka o čistoj osobnoj lokaciji relativno je mala jer količina podataka potrebna za snimanje jedne
lokacije je samo nekoliko bajtova, dok je veličina svake slike ili videa u megabajtima. Međutim,
relativno mala količina podataka koju generira domena osobne lokacije sugerira da ova vrsta podataka
potencijalno nudi mnogo veću vrijednost po generiranom bajtu, kao što ćemo raspravljati.
Prikaz 27
Ukupni podaci o osobnoj lokaciji iznose više od 1 petabajta godišnje na globalnoj razini
Podaci o osobnoj lokaciji generirani globalno, 2009
Terabajti
1000–
400–2.500 3000+
5–20 0 <1–2
600 20 <1– 2 <1 <1–5 <1
Traga/ Pretraživanje Razno. Lokacija Praćenje Praćenje Osobno Ukupno
Navigacijske lokator s omogućenom usluge hitnog poziva1 Geografski kupaca plaćanje

Navigacijski uređaji ljudi
aplikacije na telefonima lokacijom temeljene uključivanja ciljani oglasi karticom
na lokaciji, pametnog telefona
npr. igre
1 Moderne usluge hitnih poziva, kao što je North American Enhanced 911, izvješćuju o lokaciji kada se uputi hitni poziv.
IZVOR: Press pretraga; stručni razgovori; strateška analitika; Analiza McKinsey Global Institute
Azija je vodeća regija za generiranje osobnih podataka o lokaciji jednostavno zato što se tamo koristi
toliko mnogo mobilnih telefona. Na primjer, Kina ima više mobilnih telefona u upotrebi nego bilo koja
druga zemlja s procijenjenih 800 milijuna uređaja u 2010.
Indija je na drugom mjestu u tom pogledu s više od 650 milijuna mobilnih telefona u upotrebi,
dok je Sjeverna Amerika na trećem mjestu sa svojih 300 milijuna mobilnih telefona u 2010. zasjenila.
Očekuje se da će rast upotrebe mobilne telefonije brzo rasti na tržištima u razvoju, a posebice
upotreba naprednih uređaja na tržištima u razvoju.77 U Kini, na primjer, očekujemo da će se
broj osnovnih telefona smanjiti na stopa od 13 posto godišnje između 2010. i 2015., no korištenje
uređaja s pametnim značajkama povećat će se za procijenjenih 5 posto godišnje tijekom tog razdoblja,
a korištenje naprednih telefona za nevjerojatnih 33 posto. Predviđamo da će se uglavnom slični
trendovi odvijati u Indiji (Prikaz 28).
76 Podaci o lokaciji koje generiraju pametni telefoni i njihove aplikacije rastu dvostruko više od
prosječne stope rasta za sve podatke o lokaciji (što također uključuje, na primjer,
navigacijske uređaje) zbog brzog rasta prihvaćanja pametnih telefona.
77 Yankee Group dijeli mobilne telefone u tri kategorije: osnovni telefoni, pametne značajke i napredni
operativni sustav (OS). Napredni operativni sustav (OS) najbliže je značenju pametnih telefona
koji se danas koriste u medijima. Pogledajte Globalnu mobilnu prognozu, Yankee Group, prosinac
2010.
88
Prikaz 28
Postoji značajan broj korisnika mobilnih telefona Osnovni, temeljni
na tržištima u razvoju, a napredni telefoni potaknut Pametna značajka
će rast Napredni operativni sustav (OS)
Baza instaliranih mobilnih telefona, 2010 Složena godišnja stopa rasta 2010–
Milijuni 15, %
Osnovna pametna značajka Napredna
Kina 209 524 67 800 -13 5 33
Indija 149 481 48 678 -3 10 31
Japan 61 49 110 -34 -4 7
Ostatak Azije 198 533 83 813 -12 3 17
Europa 110 746 180 1.036 -12 -4 16
Bliski istok,
Sjeverna Afrika
76 517 87 680 -23 3 22
Latinska Amerika 40 465 40 544 -19 1 21
Sjeverna Amerika 1 260 45 307 -54 -8 29
IZVOR: Yankee Group; Analiza McKinsey Global Institute
POSTOJE TRI GLAVNE KATEGORIJE KORIŠTENJA APLIKACIJA
PODACI O OSOBNOJ LOKACIJI
Identificirali smo tri glavne kategorije primjene osobnih podataka o lokaciji.

Aplikacije i usluge temeljene na lokaciji za pojedince kategorija su koja uključuje pametno
usmjeravanje, automobilsku telematiku i usluge lokacije temeljene na mobilnim telefonima.
Druga kategorija je organizacijska upotreba osobnih podataka o lokaciji pojedinca koja
uključuje geografsko ciljano oglašavanje, elektroničku naplatu cestarine, cijene osiguranja
i hitne reakcije. Treće je korištenje skupnih podataka o lokaciji na makrorazini koji uključuju
urbanističko planiranje i maloprodajnu poslovnu inteligenciju.
U ovom ćemo odjeljku opisati nekoliko primjera svake vrste primjene.

Međutim, ovo je tako dinamično područje s tako visokim stupnjem promjena i
inovacija da se naši primjeri ne bi trebali smatrati iscrpnima.
Aplikacije i usluge temeljene na lokaciji za pojedince 1. Pametno
usmjeravanje. Pametno usmjeravanje temeljeno na prometnim informacijama u stvarnom

vremenu jedna je od najčešće korištenih aplikacija osobnih podataka o lokaciji.78
Napredniji navigacijski sustavi mogu primati informacije o prometu u stvarnom
vremenu, uključujući nesreće, planirane radove na cesti i zagušena područja. Ovi
sustavi također mogu korisnicima dati ažurirane informacije o točkama interesa i
nadolazećim vremenskim uvjetima. Neki od ovih uređaja ne samo da vozačima mogu
dati preporuke kojim rutama treba ići da izbjegnu zastoje, već i poslati povratne
informacije o lokaciji i kretanju središnjem poslužitelju, omogućujući još točnije
mjerenje zagušenja.
78 Navigaciju koja koristi prometne podatke u stvarnom vremenu smatramo aplikacijom velikih podataka jer
zahtijeva analizu velikog skupa podataka o trenutnom prometnom zagušenju. “Tradicionalni” navigacijski
sustavi koji ne koriste podatke o prometu u stvarnom vremenu još uvijek su prilično česti i mogu
pružiti značajnu korist. Na primjer, vlasnički istraživački projekt NAVTEQ proveden u Njemačkoj
pokazao je da vozači koji koriste navigacijske uređaje voze kraće udaljenosti i provode manje vremena
u vožnji (uključujući poboljšanje učinkovitosti goriva za 12 posto).
Kako se penetracija pametnih telefona povećava, a besplatne navigacijske aplikacije uključuju

u te uređaje, korištenje pametnog rutiranja vjerojatno će rasti. Očekuje se da će do 2020.
godine više od 70 posto mobilnih telefona imati GPS mogućnost, što je porast u odnosu na 20
posto u 2010. Nadalje, broj automobila opremljenih GPS uređajima na kontrolnoj ploči nastavit
će rasti.
Sve u svemu, procjenjujemo da će potencijalna globalna vrijednost pametnog rutiranja u

obliku uštede vremena i goriva biti oko 500 milijardi dolara do 2020. To je ekvivalent uštedi
vozačima 20 milijardi sati na cesti, ili 10 do 15 sati svake godine za svaki putnik, i oko 150
milijardi dolara na potrošnju goriva. Ove se uštede prevode u procijenjeno smanjenje emisija
ugljičnog dioksida od 380 milijuna tona, ili više od 5 posto godišnje.79 Ove procjene
pretpostavljaju odgovarajuća ulaganja u dva glavna područja razvoja digitalnih karata i
dostupnosti informacija o prometu u stvarnom vremenu. Digitalni kartografski podaci danas su
dostupni u većini razvijenih zemalja i postaju sve uobičajeniji u zemljama u razvoju. Kako bi
pametno usmjeravanje bilo učinkovito, ove će karte morati biti ažurne, što je poseban izazov na
tržištima u razvoju gdje se cestovne mreže i infrastruktura neprestano mijenjaju.
Štoviše, za potpuno zauzimanje ove potencijalne vrijednosti bit će neophodan rast

potražnje kako bi se potaknulo potrebno ulaganje u tehnološku infrastrukturu, uključujući
hardver i prijenosne tornjeve koji su neophodni za omogućavanje pristupa prometnim
informacijama u stvarnom vremenu.
2. Automobilska telematika. U nadolazećim godinama, sve veći broj

automobili će biti opremljeni GPS-om i telematikom (tj. mogućnošću slanja i primanja
podataka) koji mogu omogućiti niz usluga osobne sigurnosti i nadzora. Jedan od primjera
koji je već na tržištu je General Motorsova usluga OnStar, koja prenosi podatke o lokaciji vozila
i dijagnostiku u stvarnom vremenu središnjem nadzornom mjestu. Sustavi kao što je ovaj—koji
su analogni daljinskom nadzoru zdravlja u sustavu zdravstvene skrbi—mogu upozoriti vozače
kada su im potrebni popravci ili nadogradnja softvera ili mogu locirati vozila u hitnim slučajevima
(npr. kada su zračni jastuci aktivirani ili je vozilo prijavljen kao ukraden).
3. Usluge mobilnog telefona temeljene na lokaciji. Također postoji niz drugih usluga temeljenih
na lokaciji (LBS) koje se brzo razvijaju i šire na mobilnim telefonima. Ove usluge uključuju
sigurnosne aplikacije za praćenje djece i drugih članova obitelji ili pronalaženje prijatelja.
Primjeri koji se već danas nalaze uključuju Foursquare (više od 8 milijuna korisnika od travnja
2011.) i Loopt (više od 5 milijuna korisnika u travnju 2011.). Loopt, osnovan 2006. godine u
Mountain Viewu u Kaliforniji, je aplikacija za pametne telefone koja se može preuzeti i koja
korisnicima omogućuje dijeljenje informacija o lokaciji u stvarnom vremenu, statusnih poruka i
geo-označenih fotografija sa zajednicom prijatelja. Detaljne karte koje su dostupne na svim
većim mrežama u SAD-u i iz nekoliko trgovina aplikacijama pokazuju gdje su prijatelji, što rade
i kako se naći s njima. Loopt generira prihod prvenstveno kroz geografski ciljane oglase i
promocije.
Postoje i mobilne usluge temeljene na lokaciji koje pronalaze zanimljiva mjesta i pružaju
dodatne informacije o, na primjer, najbližoj kemijskoj čistionici ili kineskom restoranu ili najboljim
lokacijama s kojih možete pozvati taksi u prenapučenim gradovima. U
budućih godina osobni podaci o lokaciji omogućit će mobilno igranje poput lova na čistače ili
vojnih simulacija temeljenih na lokacijama igrača (Prikaz 29).
79 Koristimo McKinseyjev vlasnički model kako bismo došli do ove procjene projiciranih globalnih emisija
iz cestovnog prometa u 2020.
90
Model prihoda za takve mobilne LBS aplikacije bit će mješavina besplatnih

usluga i aplikacija podržanih oglašavanjem i drugim prihodima, uključujući
sponzorirane veze iz restorana, barova i drugih zanimljivih mjesta. Neke mobilne
aplikacije sadržavat će ugrađeno oglašavanje ili će zahtijevati jednokratnu naknadu
za preuzimanje ili stalnu pretplatu. U kombinaciji, procjenjujemo da bi nova vrijednost
generirana takvim uslugama mogla biti 80 milijardi USD ili više u 2020. Dio ove
vrijednosti će se prikupiti kao prihod pružateljima mobilnih LBS usluga, ali potrošači
koji koriste usluge dobit će velik dio ukupne vrijednosti generirane ako istraživanje
potrošačkog viška koji generiraju online usluge općenito je vodič.80
Prikaz 29
Mobilne usluge temeljene na lokaciji (LBS) i aplikacije su se proširile

Prihod kroz
Mobilne LBS aplikacije nastavljaju se razmnožavati1 “Freemium” model
Model prihoda za ove mobitele

Lociranje ljudi (npr.
sigurnosno praćenje LBS aplikacije bit će mješavina
obitelji/djeteta,
Besplatne usluge/aplikacije
pronalaženje prijatelja)
podržane prihodima od
oglašavanja
Prijava/dijeljenje
– Sponzorske veze za
lokacije na pretraživanje omogućeno
aplikacijama mobilnom lokacijom (npr.
društvenih zajednica obližnje točke interesa) –
Oglašavanje ugrađeno u
mobilne aplikacije
Vodič po gradu/regiji,
Mobilne aplikacije koje zahtijevaju
pretraga usluga u
premije za preuzimanje ili pretplatu
susjedstvu
– Jednokratna naknada za preuzimanje
aplikacija s mobilnih tržišta –
Ponavljajuće naknade za pretplatu
Zabava s za usluge/sadržaj – Dodatni
troškovi, npr. kupnja virtualnih
omogućenom lokacijom,
npr. mobilno igranje, Geografski označena stavki u mobilnim igrama
fotografija
geo označena fotografija/putovanje
1 Navigacijske i druge aplikacije za neindividualnu upotrebu procijenjene su zasebno i nisu ovdje uključene.
IZVOR: Press pretraga; Analiza McKinsey Global Institute
Organizacijska uporaba osobnih podataka o lokaciji pojedinca

1. Geo-ciljano oglašavanje. Geografski ciljano mobilno oglašavanje jedan je od najčešćih načina
na koji organizacije mogu stvoriti vrijednost korištenjem osobnih podataka o lokaciji. Na
primjer, potrošači koji odluče primati geografski ciljane oglase mogu imati personalizirani
oglas za omiljenu trgovinu iskočiti na svom pametnom telefonu kada su blizu te trgovine. Ili
korisnik pametnog telefona koji se sastaje s prijateljima u baru ili restoranu može dobiti ponudu
kupona za piće ili hranu iz te ustanove. Ova bi tehnologija mogla usmjeravati korisnike do
najbližeg bankomata, pružati recenzije restorana na temelju lokacije i vremena te nuditi niz
posebnih ponuda za trgovine na temelju lokacije ili odredišta korisnika pametnog telefona. Ova
vrsta oglašavanja još je bila u povojima 2010. Međutim, nove geo-ciljane oglašivačke tvrtke
kao što je ShopAlerts izvješćuju o impresivnoj prodaji i rezultatima odziva (pogledajte Okvir 11,
"ShopAlerts: Geo-ciljani mobilni oglasi"). U usporedbi s tradicionalnijim oblicima oglašavanja
kao što su TV ili tisak, čini se da geo-ciljane kampanje imaju veću relevantnost za potrošača u
trenutku kada je vjerojatno da će se donijeti odluka o kupnji i stoga povećavaju potencijal za
stvarnu prodaju. Čini se da oglašivači sigurno vjeruju da je to tako i plaćaju veće cijene za ovu
uslugu u usporedbi s oglašavanjem bez geo-ciljanja.
80 Potrošači koji potiču digitalni pristup: ekonomska vrijednost usluga koje se temelje na online oglašavanju
za potrošače, McKinsey & Company za IAB Europe, rujan 2010.
Okvir 11. ShopAlerts: Geografski ciljani mobilni oglasi
ShopAlerts, koji je razvio PlaceCast iz San Francisca i New Yorka, proizvod je "push SMS"
zasnovan na lokaciji koji tvrtke uključujući Starbucks, North Face, Sonic, REI i American Eagle
Outfitters već koriste za privlačenje prometa u svoje trgovine. Oglašivači definiraju geografsku
granicu u kojoj se korisnicima koji su se uključili šalju push SMS tipično u obliku promocije ili
oglasa za posjet određenoj trgovini; općenito, korisnik ne bi primio više od tri takva upozorenja
tjedno. ShopAlerts tvrdi da ima 1 milijun korisnika širom svijeta. U Sjedinjenim Državama, tvrtka
kaže da može locirati više od 90 posto mobilnih telefona koji se koriste diljem zemlje. Tvrtka
izvještava da 79 posto ispitanih potrošača kaže da je vjerojatnije da će posjetiti trgovinu kada
prime relevantan SMS; 65 posto ispitanika reklo je da su kupili zbog poruke; a 73 posto je reklo da
će vjerojatno ili sigurno koristiti uslugu u budućnosti.
2. Elektronička naplata cestarine. Trenutna elektronička naplata cestarine zahtijeva specijalizaciju

tehnologija koja iziskuje značajne troškove, ali sve češći mobilni telefoni s GPS-om vjerojatno će
potaknuti razvoj aplikacije za naplatu cestarine koja bi mogla smanjiti ukupne troškove sustava.
Kao ilustracija, mobilni telefon bi mogao locirati vozilo i naplatnu kućicu, platiti cestarinu i naplatiti
je na telefonski račun korisnika, eliminirajući potrebu za posebnim transponderskim uređajima i
dodatnim plaćanjem računa
računi.
3. Cijene osiguranja. Kombinacija osobnih podataka o lokaciji i vozila

telematika ima potencijal ponuditi osiguravateljima točnije i detaljnije podatke o individualnom
ponašanju - na primjer, kako pojedini osiguranici voze svoje automobile. Takve informacije
omogućile bi osiguravateljima određivanje cijene rizika na temelju stvarnog ponašanja, a ne
na skupnim demografskim čimbenicima. Neki to tvrde
osiguranje temeljeno na ponašanju moglo bi čak smanjiti troškove odštetnih zahtjeva jer pojedinci
ponašaju se na manje rizičan način kada znaju da su nadzirani. Ovaj učinak treba dokazati, ali ono
što se čini sigurnim jest da tehnologije koje se brzo poboljšavaju temeljene na osobnim podacima o
lokaciji imaju potencijal pomoći osiguravateljima u razvoju drugih usluga za poticanje sigurnije vožnje.
Na primjer, osiguravatelji bi mogli početi nuditi upozorenja u stvarnom vremenu o prometnim i
vremenskim uvjetima (kao što smo vidjeli u slučaju pametnog rutiranja), visokorizičnim parkiralištima
i promjenama ograničenja brzine.
4. Hitni odgovor. Sve veća dostupnost osobnih podataka o lokaciji, promet u stvarnom vremenu i GPS
telematika jasno nude prostor za brže i učinkovitije vrijeme odgovora službenika za provođenje
zakona, vatrogasaca i osoblja hitne pomoći. Ove tehnologije omogućuju dispečerima hitnih službi
da brzo identificiraju lokaciju osobe koja prijavljuje hitan slučaj, osiguravaju da osoblje može
odgovoriti što je brže moguće (putem pametnog usmjeravanja) i nadziru vlastitu sigurnost u često
opasnim okruženjima.
Korištenje agregatnih podataka o lokaciji na makrorazini Dva
prilično različita područja donošenja odluka koja mogu imati koristi od analize podataka o osobnoj
lokaciji u agregatu su urbanističko planiranje i maloprodajna poslovna inteligencija, koje ovdje ističemo.
Međutim, uvjereni smo da će se pojaviti mnoge druge aplikacije i poslovni modeli kako se ove tehnologije
budu poboljšavale, a njihova upotreba sve veća.
1. Urbanističko planiranje. Urbanisti mogu imati značajne koristi od analize

osobni podaci o lokaciji. Odluke koje se mogu poboljšati analizom takvih podataka
92
uključuju izgradnju cesta i masovnog prijevoza, ublažavanje prometnih zagušenja i

planiranje razvoja visoke gustoće. Planeri urbanog prijevoza i razvoja sve će više imati
pristup velikoj količini informacija o vrućim točkama vršnog i izvan vršnog prometa,
obujmu i obrascima korištenja prijevoza i trendovima kupnje, na primjer—i u tom
procesu potencijalno smanjiti gužve i emisije zagađivača. Ulaskom u ovo bogatstvo
podataka, urbanisti će biti informiraniji kada budu donosili odluke o bilo čemu, od
postavljanja i redoslijeda semafora do vjerojatne potrebe za parkirnim mjestima. Odjel
za javni prijevoz Singapura već koristi desetogodišnje prognoze potražnje djelomično
temeljene na osobnim podacima o lokaciji za planiranje potreba prijevoza. Prometne
agencije u Nizozemskoj predviđaju gužve u prometu i pješacima koristeći osobne
podatke o lokaciji s mobilnih telefona.
2. Maloprodajna poslovna inteligencija. Trgovci mogu koristiti osobne podatke o lokaciji za razumijevanje
obrasci kupnje, prikupljanje informacija o gustoći pješačkog prometa i brzini
radi generiranja detaljnih uvida o tome gdje kupci usporavaju i ubrzavaju kao odgovor
na promocije i oglašavanje, a zatim povezivanje tih obrazaca s podacima o kupnji
proizvoda, demografskim podacima kupaca i povijesnim obrascima kupnje. Takva
detaljna inteligencija može pomoći u poboljšanju niza poslovnih odluka od rasporeda
u trgovini do prodaje (pogledajte okvir 12, "Kako funkcionira praćenje kretanja kupaca?").
Okvir 12. Kako funkcionira praćenje kretanja kupaca?

Budući da GPS signali često ne prodiru u zatvorene prostore, trgovci na malo mogu
koristiti druge elektroničke tehnologije za praćenje kupaca dok se kreću unutar
trgovina ili trgovačkih centara (Prikaz 30). Te tehnologije uključuju RFID oznake na
kolicima za kupnju, namjenske uređaje koje nose kupci, video kamere i nekoliko
inovativnih tehnologija koje koriste mobilne telefone. Svaka od ovih tehnika pruža
različitu razinu detalja o lokaciji. RFID oznake su jeftine i točne, ali često ne odražavaju
detaljna kretanja kupaca. Na primjer, oznaka se može pričvrstiti na kolica koja su
ostavljena u prolazu dok se potrošač kreće. Video prepoznavanje može biti izvrsno
za upravljanje protokom prometa, ali teško za korištenje za praćenje ponašanja
pojedinca. Nekoliko tehnologija, uključujući Shopkick i Path Intelligence (koje smo već
spomenuli) već su na tržištu.
Dokaz 30
Kako funkcionira praćenje lokacije?
Ulazni Izlaz
RFID oznaka
+ Mobilni telefoni
Video
Distribucija kupaca Protok prometa
Osobno
praćenje
IZVOR: Pretraga tiska i literature

3. Neki novi poslovni modeli. Kako dostupnost osobnih podataka o lokaciji postaje sve
češća i svijest o njihovoj vrijednosti sve raširenija, druga će se tržišta razviti i za
agregirane i za neobrađene podatke. Na primjer, Sense Networks komercijalizira
Macrosense, model tehnologije strojnog učenja koji agregira povijesne podatke i
podatke o lokaciji mobilnog telefona u stvarnom vremenu kako bi, na primjer,
identificirao najbolje uglove ulica s kojih možete zaustaviti taksi (pogledajte okvir 13,
„Sense mreže : Analiza agregiranih informacija o lokaciji”). Kao još jedan primjer,
grad Boston pokrenuo je aplikaciju pod nazivom Street Bump koja koristi podatke o
osobnoj lokaciji za otkrivanje rupa. Street Bump koristi tehnologiju već ugrađenu u
pametne telefone, uključujući GPS i akcelerometre, te bilježi lokaciju automobila i
veličinu rupa kroz koje prolazi. Grad je uputio javni izazov korisnicima da pronađu
najbolju metodologiju za mapiranje stanja na ulicama i da Street Bump budu što
korisniji.
Okvir 13. Sense Networks: Analiza agregiranih informacija o lokaciji
Sense Networks, sa sjedištem u New Yorku, osnovao je 2003. godine tim

računalnih znanstvenika s Massachusetts Institute of Technology i Sveučilišta
Columbia. Tvrtka koristi podatke o osobnoj lokaciji u stvarnom vremenu i povijesne
podatke za prediktivnu analitiku. Prva aplikacija Sense Networksa za potrošače bila
je CitySense, alat dizajniran da odgovori na pitanje: "Kamo svi idu sada?" CitySense
pokazuje ukupnu razinu aktivnosti u gradu, vruće točke i mjesta s neočekivano
visokom aktivnošću, sve u stvarnom vremenu. Alat se zatim povezuje na Yelp i
Google kako bi pokazao koja mjesta rade na tim lokacijama. CabSense, još jedna
aplikacija Sense Network objavljena početkom 2010., nudi korisnicima agregiranu
kartu generiranu analizom desetaka milijuna podatkovnih točaka koja rangira uglove
ulica prema broju taksija koji preuzimaju putnike svakog sata ili svakog dana u
tjednu.
VRIJEDNOST KOJU STVARAJU OSOBNI PODACI O LOKACIJI JE
ZNAČAJAN I RASTUĆI
Naša detaljna analiza glavnih primjena osobnih podataka o lokaciji danas iu bliskoj
budućnosti otkriva da, za deset godina, te aplikacije imaju potencijal stvoriti vrijednost
od 100 milijardi dolara ili više samo za pružatelje usluga. Ova dodatna vrijednost
vjerojatno će prvenstveno doći od prodaje navigacijskog hardvera i prihoda od LBS-a,
mobilnih LBS premija i geo-ciljanog oglašavanja.81 Poduzetnici će razviti mnoge od ovih
usluga i aplikacija, s obzirom na činjenicu da model trgovine aplikacija za mobilne
uređaje već nudi spremne prodajne i marketinške kanale, uvelike smanjujući prepreke
ulasku novih inovativnih igrača.
Vjerojatna vrijednost koju će prikupiti pružatelji usluga bit će manja u odnosu na

prednosti koje će korisnici – i pojedinci i tvrtke – uživati zbog sve većeg broja
aplikacija temeljenih na lokaciji. Vjerujemo da će do 2020. aplikacije za osobnu lokaciju
stvoriti vrijednost od čak 700 milijardi dolara za korisnike (Prikaz 31). Od toga će više od
70 posto biti potrošački višak dobiven uštedom vremena i goriva korištenjem GPS
navigacijskih sustava (uključujući one s prometnim informacijama u stvarnom vremenu)
i korištenjem mobilnih LBS aplikacija (razlika između spremnosti plaćanja i troškova
81 Uključili smo prodaju hardvera za navigaciju jer se ti uređaji koriste isključivo za

osobne navigacijske aplikacije. Broj bi bio puno veći da uključuje prodaju pametnih telefona, što
isključujemo jer se pametni telefoni koriste u mnoge svrhe koje ne zahtijevaju osobne podatke o
lokaciji.
94
aplikacija). Preostalih 30 posto ukupnog iznosa koji će pripasti kupcima bit će dodatna
vrijednost koju će dobiti tvrtke koje koriste poluge omogućene podacima o lokaciji, kao što
je povrat marketinških stručnjaka na geografsko ciljano mobilno oglašavanje.
Dokaz 31
Vrijednost glavnih poluga povećava se na više od 800 milijardi dolara do 2020. milijarde
dolara godišnje
Poluga Prihod prikupljen pružateljima Mjerljiva novčana vrijednost za krajnje kupce

krajnjeg korisnika usluga
GPS navigacija (uključujući pametno rutiranje na temelju prometa u

stvarnom vremenu) 39 500
Praćenje ljudi (društveno umrežavanje i sigurnost) Dijeljenje

Pojedinci lokacije na aplikacijama društvenih zajednica Vodič po gradu/regiji,
pretraga usluga u susjedstvu Zabava kao što je mobilno igranje na temelju 27 44–57 (prikaz, stručni).
mjesto
Daljinska sigurnost/nadzor osobnog automobila (npr. 5–10
OnStar)
Geografski ciljano mobilno oglašavanje1 30–40 (prikaz, stručni). 75–100 (prikaz, stručni).
Automatska naplata cestarine na temelju lokacije mobilnog telefona

2 4–10
organizacije
Optimizirano planiranje gradske prometne infrastrukture n/a 5
Maloprodajna poslovna inteligencija temeljena na ponašanju

kupaca povezanom s lokacijom (npr. optimiziranje izgleda trgovina na n/a n/a
temelju obrasca kretanja kupca)2
Ukupno 100–120 (prikaz, stručni). 600–700 (prikaz, stručni).
Promjena vrijednosti
od 8 do 15 milijardi dolara
1 Za dimenzioniranje vrijednosti geo-ciljanog mobilnog oglašavanja, pružatelji usluga definirani su kao oni koji prodaju oglasni inventar,
npr. pružatelji platformi za oglašavanje; kupci se definiraju kao trgovci koji kupuju oglasni inventar.
2 Pojedinačni trgovac na malo dobit će povećanje prihoda, što predstavlja promjenu vrijednosti, a ne stvaranje vrijednosti na makrorazini.
Vjerujemo da su naše procjene potencijalnog viška koji će prikupiti kupci konzervativne

jer ne uključuju dodatne izvore korisnosti kao što su poboljšanja u pogodnostima za
korisnike, transparentnosti i zabavi. Usluge omogućene osobnim podacima o lokaciji, kao
što su aplikacije za rangiranje korisnika (npr. Yelp), nude korisnicima sve ove prednosti.
Nepoznati putnici, na primjer, mogu brzo pronaći trgovine i restorane koji bi im se svidjeli.
Poznati stanari mogu locirati prijatelje, najpopularnije večernje izlaske i najkraću rutu
vožnje. Nadalje, naše procjene određuju potencijalni učinak samo nekoliko aplikacija;
očekujemo da će se i dalje pojavljivati inovativne nove upotrebe osobnih podataka o lokaciji i
poslovni modeli. Kreativnost i inovativnost pomaknut će potencijal vrijednosti prema gore u
odnosu na naše sadašnje procjene, a dugačak rep specijaliziranih aplikacija kombinirat će se
kako bi ponudio značajnu ukupnu dodatnu vrijednost.
Pojedinci i organizacije diljem svijeta dijelit će potencijalnu vrijednost osobnih podataka o

lokaciji - nigdje dramatičnije nego na tržištima u razvoju gdje se već vrlo velik broj mobilnih
telefona koji generiraju takve podatke tako brzo povećava.
POTREBNO JE SAVLADATI NIZ PREPREKA KAKO BI SE OSTVARIO

POTPUNA VRIJEDNOST PODATAKA O OSOBNOJ LOKACIJI
Stvaranje većeg dijela potencijalne vrijednosti koju omogućuju podaci o osobnoj

lokaciji ovisit će o rješavanju niza tehnoloških i drugih poslovnih problema i uklanjanju
institucionalnih i državnih prepreka. Neki od ovih problema i prepreka su poznati; drugi manje;
neki su nepopustljiviji od drugih. Izazovi
s kojima se suočavaju poslovni i kreatori politike uključuju pitanja privatnosti i sigurnosti,

tehnološka ulaganja i inovacije te upravljanje organizacijskim promjenama.
Kako se obujam i točnost podataka o osobnoj lokaciji povećava, tako će rasti i zabrinutost za
privatnost i sigurnost. Zakoni su općenito nejasni o tome koja skupina - od mobilnih operatera,
vlasnika platformi, programera aplikacija i proizvođača mobilnih telefona do stvarnih korisnika
- posjeduje pravo prikupljanja, prikupljanja, širenja i korištenja osobnih podataka o lokaciji u
komercijalne svrhe. Mnoga komercijalna poduzeća koja su izjavila da će štititi privatnost ovih
podataka mogla su ih koristiti relativno slobodno. Ali ima poziva građana koji žele znati da su
njihova privatnost i sigurnost osobnih podataka o lokaciji zaštićeni i koji smatraju da su opt-in/opt-
out ugovori nejasni. Okvir koji jasno opisuje dopušteno i zabranjeno korištenje tih podataka bio bi
koristan za sve dionike.
Čini se neizbježnim da će se tehnologija povezana s osobnim podacima o lokaciji nastaviti

poboljšavati kako potražnja na tržištu raste, a mobilni uređaji postaju sveprisutni diljem
svijeta. Naše projekcije vrijednosti koju će ti podaci stvoriti pretpostavljaju stalne tehnološke
inovacije (npr. Mooreov zakon koji povećava mogućnosti poluvodiča) i ulaganja u infrastrukturu (npr.
u nadograđene bazne stanice mobilnih telefona za veću propusnost) i široko prihvaćanje GPS-a
Mobilni uredaji. Iako se trenutna točnost civilnog GPS-a čini primjerenom za mnoge postojeće
aplikacije, druge će aplikacije zahtijevati detaljnije podatke o lokaciji, kao što su unutar zgrada.
A bit će i tehnoloških izazova. Na primjer, operateri koji razvijaju aplikacije morat će paziti na
mogućnost novih komplikacija i pogrešaka.
Nizozemska vlada, prikupljajući i analizirajući podatke o zagušenosti na autocesti na temelju
gustoće položaja mobilnih telefona, primijetila je da je određeni segment autoceste imao neobičnu
vršnu zagušenost koja se pojavljivala i naglo nestajala svaki sat.
Ispostavilo se da je autocesta blizu prigradske željeznice kojom prolazi vlak u vrijeme najveće
gužve.
Svi ovi aspekti domene osobnih podataka o lokaciji koja se razvija predstavljaju značajne izazove
za rukovoditelje i kreatore politike. Poslovni čelnici već bi trebali razmotriti potencijalne prednosti
iskorištavanja ovih podataka, posebno u područjima marketinga i poboljšanja operativne
učinkovitosti, te izgradnje poslovnih slučajeva oko današnjih uočljivih prilika. Ali također bi
trebali eksperimentirati s novim poslovnim modelima kako bi izvukli maksimalnu vrijednost.
Rukovoditelji bi trebali raditi u
zajedničkog interesa s kreatorima javne politike za izradu učinkovitih politika privatnosti,

sredstava za njihovo jasno priopćavanje javnosti i za poboljšanje sigurnosti informacija oko
osobnih podataka o lokaciji. Privatni i javni sektor također mogu surađivati na ubrzavanju
razvoja i usvajanja infrastrukture i uređaja koji imaju potencijal za generiranje dodatnih korisnih
osobnih podataka o lokaciji.
Za kreatore politike, prvi prioritet u ovoj domeni koja se brzo razvija je osigurati postojanje
odgovarajućih poticaja za inovacije, uključujući razvoj ažurnog okvira za pravila i prava
intelektualnog vlasništva, financiranje istraživanja i razvoja u potencijalnim prodornim područjima
i osiguravanje da infrastruktura, uključujući politiku spektra, optimalna.
96
Primjena osobnih podataka o lokaciji ima potencijal pružiti više od 800 milijardi dolara
ekonomske vrijednosti pojedinačnim potrošačima i organizacijama tijekom sljedećeg
desetljeća, u procesu kataliziranja razvoja širokog spektra inovativnih poduzeća u mnogim
sektorima. Samo pametne navigacijske aplikacije mogle bi globalnim potrošačima ponuditi
oko 500 milijardi dolara vrijednosti ušteđenog vremena i goriva do 2020.
Geo-ciljano oglašavanje pojavljuje se kao vrlo učinkovito marketinško sredstvo koje bi
do 2020. moglo predstavljati više od 5 posto ukupne globalne potrošnje na oglašavanje.
Rukovoditelji i kreatori politika trebaju raditi zajedno kako bi omogućili rast ove domene
podataka i oslobodili njezin puni potencijal.
4. Ključni nalazi koji se primjenjuju na

sve sektore
Korištenje velikih podataka nudi ogroman neiskorišten potencijal za stvaranje vrijednosti.

Organizacije u mnogim industrijskim sektorima i poslovnim funkcijama mogu iskoristiti velike podatke
kako bi poboljšale svoju raspodjelu i koordinaciju ljudskih i fizičkih resursa, smanjile gubitak, povećale
transparentnost i odgovornost te olakšale otkrivanje novih ideja i uvida. Uz pet domena koje smo
detaljno proučili, također smo pronašli mnoge druge primjere u drugim domenama, diljem
zemljopisnih područja, ogromnog potencijala za stvaranje vrijednosti korištenjem velikih podataka.
U ovom poglavlju sintetiziramo ono što smo naučili iz pet domena koje smo detaljno proučavali, kao
i naša zapažanja u drugim domenama.
BIG DATA STVARA VRIJEDNOST NA NEKOLIKO NAČINA
Identificirali smo pet široko primjenjivih načina za iskorištavanje velikih podataka koji
nude transformacijski potencijal za stvaranje vrijednosti i imaju implikacije na način na koji će
pojedinačne organizacije morati biti dizajnirane, organizirane i upravljane. Pitanja koja postavljaju
ovi nalazi uključuju: Kako će se korporativne marketinške funkcije i aktivnosti morati razvijati ako
je moguće eksperimentiranje velikih razmjera i kako će se poslovni procesi vjerojatno promijeniti?
Kako će tvrtke vrednovati i iskoristiti svoju imovinu (osobito podatkovnu imovinu) i može li njihov
pristup i analiza podataka zapravo stvoriti veću vrijednost od, recimo, robne marke? Kako veliki
podaci mogu poremetiti uspostavljene poslovne modele? Na primjer, neke industrijske dinamike
počivaju na činjenici da postoje informacijske asimetrije — kako bi se ta dinamika promijenila da
transparentnost oko podataka umjesto toga proizvodi informacijsku simetriju? Kako će se postojeće
tvrtke s naslijeđenim poslovnim modelima i infrastrukturom natjecati s novopridošlicama koje se
ne suočavaju s takvim ograničenjima? A kako će svijet izgledati kada se višak počne seliti s
dobavljača na kupce?
1. Stvaranje transparentnosti
Olakšavanje dostupnosti velikih podataka relevantnim dionicima na pravo vrijeme može stvoriti
ogromnu vrijednost. Uistinu, ovaj aspekt stvaranja vrijednosti preduvjet je za sve druge poluge i
najneposredniji je način da poduzeća i sektori koji su danas manje napredni u prihvaćanju velikih
podataka i njihovih poluga iskoriste taj potencijal. U mnogim slučajevima te mogućnosti postoje
tamo gdje postoji neusklađenost poticaja za stvaranje transparentnosti podataka, kao što je
nedostatak imperativa izvedbe. Na primjer, u javnom sektoru otkrili smo slučajeve u kojima je osoblje
odjela trošilo 20 posto svog vremena tražeći informacije od drugih državnih odjela koristeći
nedigitalna sredstva (npr. papirnate imenike i pozivajući ljude), a zatim su te informacije dobivale
putujući na druga mjesta i prikupljanje podataka na fizičkim medijima kao što su kompaktni diskovi.
Takav uzaludan trud uvelike je smanjen u organizacijama koje su iskoristile velike podatke za
digitalizaciju tih informacija, učinile ih dostupnima putem mreža i implementirale alate za
pretraživanje kako bi se relevantne informacije lakše pronašle.
Međutim, čak iu sektorima koji su prihvatili IT i velike podatke i gdje postoje značajni
poticaji za veću izvedbu, pronašli smo prostor za povećanje transparentnosti i dijeljenje
velikih podataka. U proizvodnji su mnoge tvrtke koristile velike podatke za poboljšanje učinka u
istraživanju i razvoju (npr. složene simulacije) ili u upravljanju
98
njihovih opskrbnih lanaca. Međutim, ove aplikacije često iskorištavaju samo one podatke koji
su sadržani unutar jedne funkcionalne grupe u tvrtki. Integriranje podataka iz istraživačkih i
razvojnih, inženjerskih i proizvodnih jedinica, potencijalno u nekoliko poduzeća, može omogućiti
istodobne inženjerske tehnike koje mogu uvelike smanjiti gubitak uzrokovan preradom dizajna i tako
ubrzati vrijeme do tržišta.
2. Omogućivanje eksperimentiranja za otkrivanje potreba, izlaganje varijabilnosti i poboljšanje

performansi Sposobnost organizacija da instrumentiraju—da implementiraju tehnologiju koja im
omogućuje prikupljanje podataka—i osjećaju da se svijet neprestano poboljšava. Sve više tvrtki
digitalizira i pohranjuje sve veću količinu vrlo detaljnih podataka o transakcijama. Sve se više senzora
ugrađuje u fizičke uređaje - od opreme za pokretne trake do automobila i mobilnih telefona - koji
mjere procese, upotrebu krajnjih proizvoda i ljudsko ponašanje. Pojedinačni potrošači također
stvaraju i dijele ogromnu količinu podataka putem bloganja, ažuriranja statusa i objavljivanja
fotografija i videa. Velik dio tih podataka sada se može prikupiti u stvarnom ili gotovo stvarnom
vremenu.
Imati pristup svim tim podacima i u nekim slučajevima mogućnost manipuliranja uvjetima pod
kojima su generirani omogućava vrlo drugačiji način donošenja odluka koji uključuje uvođenje
više znanosti u upravljanje—tj. primjenu klasičnih znanstvenih metoda u praksi upravljanja. 82
Konkretno, menadžeri sada mogu koristiti znanstveni proces kontroliranog eksperimentiranja koji
uključuje formuliranje specifičnih hipoteza, dizajniranje i provođenje eksperimenata (uključujući
kontrolne i terapijske skupine) za testiranje tih hipoteza, a zatim rigoroznu analizu kvantitativnih
rezultata prije donošenja odluke. Mnoge tvrtke donose odluke na vrlo ad hoc način - kako su neki
rekli, kroz "upravljanje HiPPO-a, mišljenja najplaćenijih osoba."83 Organizacija vođena podacima
donosi odluke na temelju empirijskih rezultata i prednosti takav pristup podacima pokazao je
akademsko istraživanje.84
Čelnici u mnogim sektorima već počinju koristiti kontrolirane eksperimente za donošenje boljih
odluka. Na primjer, zdravstveni sektor sada provodi komparativne studije učinkovitosti na
kliničkim podacima za cijelu populaciju kako bi identificirao i razumio izvore varijabilnosti u
liječenju i ishodima, identificirao protokole liječenja koji su najučinkovitiji i najučinkovitiji te
pomogao donositeljima odluka u stvaranju smjernica osmišljenih za osigurati da se odluke o
liječenju temelje na najboljoj znanosti. Trgovci, posebno oni koji posluju online, ali sve više i oni s
fizičkim trgovinama, prilagođavaju cijene i promocije u pokušaju da eksperimentiraju koja
kombinacija najbolje privlači promet i prodaju.
Nije uvijek moguće (možda iz etičkih razloga ili izvedivosti) postaviti kontrolirani eksperiment za
manipuliranje nezavisnom varijablom. Alternativa je traženje "prirodnih eksperimenata" za utvrđivanje
postojeće varijabilnosti u metrikama izvedbe. Razumijevanje pokretača ove prirodne varijabilnosti
može se koristiti kao smjernica
82 Janaki Akella, Timo Kubach, Markus Löffler i Uwe Schmid, Upravljanje temeljeno na podacima:
Bringing more science into management, McKinsey Technology Initiative Perspective, 2008.
83 Najranije spominjanje ove kratice dao je evanđelist Googleove analitike Avinash Kaushik. Pogledajte
Sedam koraka za stvaranje kulture odlučivanja vođene podacima, listopad 2006. (www.kaushik.net/
avinash/2006/10/seven-steps-to-creating-a-data-driven-decision-making culture.html).
84 Erik Brynjolfsson, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako
odlučivanje temeljeno na podacima utječe na izvedbu poduzeća?, travanj 2011., dostupno na SSRN
(ssrn.com/ abstract=1819486).
upravljačke poluge za poboljšanje tog učinka. U javnom sektoru pronašli smo velike agencije koje
su otkrile velike razlike u produktivnosti i točnosti rada na različitim mjestima obavljajući gotovo
identične zadatke. Jednostavno stavljanje ovih informacija na raspolaganje na svim web-lokacijama
potaknulo je lokacije koje su kasnile da značajno poboljšaju svoju izvedbu. Nikakve promjene u
naknadi nisu obećane; nakon što su ljudi shvatili da su loši, njihova natjecateljska priroda proradila
je i njihovo promatranje najboljih praksi na stranicama s najboljim rezultatima pomoglo im je promijeniti
njihovu izvedbu bez novčanih poticaja.
3. Segmentiranje populacije za prilagodbu radnji. Ciljanje usluga ili
marketinga radi zadovoljavanja individualnih potreba već je poznato tvrtkama okrenutim

prema potrošačima. Za njih je čvrsto utemeljena ideja segmentiranja i analiziranja svojih kupaca
kroz kombinacije atributa kao što su demografija, metrika kupnje kupaca te stavovi i ponašanje
pri kupnji.
Tvrtke poput osiguravajućih društava i izdavatelja kreditnih kartica koje se oslanjaju na
procjenu rizika također dugo koriste velike podatke za segmentiranje kupaca. Međutim, kako
se tehnologija poboljšava, mnoge su tvrtke mogle segmentirati i analizirati u gotovo stvarnom
vremenu. Čak iu javnom sektoru koji ima tendenciju tretirati sve birače na isti način, korištenje velikih
podataka za segmentiranje postaje sve popularnije. Na primjer, neke javne agencije za zapošljavanje
koristile su velike podatke kako bi prilagodile usluge osposobljavanja za posao za različite segmente
tražitelja posla, s ciljem da se osigura da se primjenjuju najučinkovitije i najučinkovitije intervencije
kako bi se različiti ljudi vratili na posao. Još jedan primjer iz javnog sektora su porezne agencije koje
segmentiraju porezne obveznike prema nizu čimbenika uključujući prihod, stopu kašnjenja u
prošlosti i kreditnu povijest kako bi identificirale povrate koji su najprikladniji za daljnje revizije.
4. Zamjena/podržavanje ljudskog odlučivanja automatiziranim algoritmima Sofisticirana

analitika može značajno poboljšati donošenje odluka, minimizirati rizike i otkriti vrijedne
uvide koji bi inače ostali skriveni. Big data pruža sirovinu potrebnu za razvoj algoritama ili za rad tih
algoritama. Porezne agencije s najboljom praksom, na primjer, koriste automatizirane mehanizme za
rizik koji koriste velike podatke za označavanje kandidata za daljnje ispitivanje. Algoritmi za velike
podatke u maloprodaji mogu optimizirati procese odlučivanja, omogućujući automatsko fino
podešavanje zaliha i određivanje cijena kao odgovor na prodaju u trgovini i na mreži u stvarnom
vremenu. Proizvodne tvrtke mogu automatski prilagoditi proizvodne linije kako bi optimizirale
učinkovitost, smanjile otpad i izbjegle opasne uvjete. U nekim slučajevima, tvrtke neće nužno
automatizirati odluke, ali će ih olakšati analizom skupova podataka koji su daleko veći od onih
skupova podataka kojima pojedinac može upravljati pomoću proračunske tablice. Neke organizacije
već donose učinkovitije odluke analizirajući čitave skupove podataka kupaca i zaposlenika ili čak
senzora ugrađenih u proizvode. Analitika temeljena na velikim podacima danas uključuje sustave
temeljene na pravilima, statističke analize i tehnike strojnog učenja kao što su neuronske mreže.
Ovo je područje koje se brzo mijenja i stalno se razvijaju novi oblici analitike temeljene na podacima.
(Pogledajte poglavlje “Tehnike i tehnologije velikih podataka.”)
5. Inoviranje novih poslovnih modela, proizvoda i usluga Big data omogućuje
poduzećima svih vrsta stvaranje novih proizvoda i usluga, poboljšanje postojećih i

osmišljavanje potpuno novih poslovnih modela. U zdravstvenoj skrbi, analizom kliničkih
podataka i podataka o ponašanju pacijenata stvoreni su programi preventivne skrbi usmjereni na
najprikladnije skupine pojedinaca. Castlight Health je tvrtka koja analizira velike podatke kako bi
pacijentima u velikim zdravstvenim planovima učinila dostupnim podatke o cijenama zdravstvene
zaštite koje inače ne vide. Ingenix u sektoru zdravstva i
100
Nielsen u maloprodaji specijaliziran je za prikupljanje i analizu različitih skupova podataka

za institucije. Također u maloprodaji, usluge usporedbe cijena u stvarnom vremenu
potrošačima daju transparentnost cijena do stupnja kakvog dosad nisu uživali i stvaraju
značajan višak za njih. Proizvođači koriste podatke dobivene od senzora ugrađenih u
proizvode kako bi stvorili inovativne ponude usluga nakon prodaje kao što je proaktivno
održavanje (preventivne mjere koje se provode prije nego što se kvar dogodi ili se uopće
primijeti) i kao temelj za razvoj sljedećih generacija proizvoda. Pojava podataka o lokaciji u
stvarnom vremenu stvorila je potpuno novi paket mobilnih usluga temeljenih na lokaciji, od
navigacijskih aplikacija do praćenja ljudi.
IAKO ĆE KORIŠTENJE VELIKIH PODATAKA VAŽNO ZA SVE SEKTORE,

NEKI SEKTORI SU SPREMNI ZA VEĆE DOBITKE
Koristeći indeks potencijala vrijednosti koji kombinira nekoliko kvantitativnih metrika,

usporedili smo povijesnu produktivnost sektora u Sjedinjenim Državama s potencijalom tih
sektora da zahvate vrijednost velikih podataka.85 Uočili smo da se obrasci razlikuju od sektora
do sektora (Prikaz 32). 86
Dokaz 32
Grozd A Grozd D
Neki su sektori pozicionirani za veće dobitke od upotrebe
Grozd B Grozd E
velikih podataka. Povijesni rast produktivnosti u Sjedinjenim
Grozd C
Državama, 2000. – 2008. % 24,0
Veličine mjehurića
označavaju relativne veličine BDP-a
23.5
23.0
22.5
Informacija
9.0
3.5 Administracija, podrška i Trgovina na veliko

3.0 gospodarenje otpadom Proizvodnja
2.5 Prijevoz i skladištenje
2.0 Financije i osiguranje
Profesionalne usluge Nekretnine i iznajmljivanje
1.5
1.0 Komunalije Pružatelji zdravstvenih usluga
0,5 Trgovina na malo

Vlada
0
Smještaj i hrana
Prirodni resursi
-0,5
Umjetnost i zabava
-1,0
-1.5 Upravljanje poduzećima
-2,0
Druge usluge Obrazovne usluge
-2.5
-3,0 Izgradnja
-3.5
Niska visoko
Indeks potencijalnih vrijednosti velikih podataka1
1 Pogledajte dodatak za detaljne definicije i metriku koja se koristi za indeks potencijala vrijednosti.
Globalno trgovani računalni i elektronički proizvodi i informacijski sektori (Klaster A) su

sektori koji su već zabilježili vrlo snažan rast produktivnosti i koji će značajno dobiti od
korištenja velikih podataka. Ovi sektori imaju pristup ogromnim skupovima podataka (npr.
internetske tvrtke prikupljaju goleme količine podataka o ponašanju na mreži) i tempu
85 Proučavali smo Sjedinjene Države posebno zbog relativne dostupnosti relevantnih podataka
oko brojeva i veličina pojedinih tvrtki. Primjenjivost ovih specifičnih nalaza u drugim zemljopisnim
područjima varirat će ovisno o sličnostima pojedinih sektora.
86 Indeks potencijalne vrijednosti sastoji se od pet metrika koje su osmišljene kao zamjene za
označavanje (1) količine podataka dostupnih za korištenje i analizu; (2) varijabilnost u izvedbi;
(3) broj dionika (kupaca i dobavljača) s kojima organizacija u prosjeku posluje; (4) intenzitet
transakcije; i (5) turbulencija svojstvena sektoru. Vjerujemo da su to karakteristike zbog kojih je
više ili manje vjerojatno da će sektor iskoristiti pet transformativnih prilika za velike podatke.
Za više detalja pogledajte dodatak.
inovativnost je vrlo visoka (npr. brzo uvođenje proizvoda u potrošačku elektroniku). Čak iu bliskoj
budućnosti vidimo značajan prostor za dobivanje veće vrijednosti velikih podataka.
Dva uslužna sektora (klaster B) — financije i osiguranje i državna uprava — u poziciji

su da imaju velike koristi od velikih podataka sve dok se mogu prevladati prepreke za njihovu
upotrebu. Ovi su sektori intenzivni i za transakcije i za kupce, što sugerira da mogu povećati
svoju primjenu poluga koje uključuju segmentaciju i automatizirane algoritme. Obojica također
imaju visoke stupnjeve varijabilnosti u svojoj izvedbi, što sugerira da bi mogli koristiti podatke i
eksperimentiranje za poboljšanje izvedbe.
Nekoliko sektora (klaster C), uključujući graditeljstvo, obrazovne usluge te umjetnost i zabavu,
zabilježilo je negativan rast produktivnosti, što vjerojatno ukazuje na to da se ti sektori
suočavaju sa jakim sistemskim preprekama povećanju produktivnosti.
Ipak, ako se te prepreke mogu prevladati, mislimo da veliki podaci mogu omogućiti povećanje
produktivnosti čak iu ovim sektorima. Primjeri gdje postoji potencijal uključuju mjerenje varijacija
u učinku nastavnika u poboljšanju akademskog uspjeha učenika – dodana vrijednost za
nastavnike – što može biti učinkovit
alat za pomoć u povećanju produktivnosti u obrazovanju.
Među preostalim sektorima, sektori kojima se trguje na globalnoj razini (uglavnom klaster
D) (npr. proizvodnja, trgovina na veliko) obično su doživjeli veći povijesni rast produktivnosti,
dok lokalne usluge (uglavnom klaster E) (npr. maloprodaja, pružatelji zdravstvenih usluga,
smještaj i hrana) ) ostvarili niži rast. Mnogi od tih sektora mogu izvući značajnu vrijednost iz
velikih podataka, iako će to ovisiti o opsegu u kojem su prepreke prevladane. Sektori koji mogu
imati umjereniji potencijal od upotrebe velikih podataka, kao što su građevinarstvo i
administrativne usluge, obično nemaju karakteristike koje bi mogle iskorištavanje velikih podataka
učiniti izazovnijim nego u drugim sektorima. Oni imaju manje podataka od drugih sektora i manje
dionicima, a također su manje transakcijski intenzivni.
Naš indeks pokazuje da od sektora koje smo detaljno proučavali, dva, zdravstvo i proizvodnja,
imaju samo skroman potencijal od korištenja velikih podataka. To je zato što indeks mjeri nekoliko
kriterija na razini pojedinog poduzeća (npr. količina podataka po poduzeću kao zamjena za broj
kupaca po poduzeću). U Sjedinjenim Državama, na primjer, obje ove industrije su jako fragmentirane
- imaju mnogo više tvrtki ili igrača nego drugi sektori. S obzirom na to da su podaci obično
fragmentirani duž granica poduzeća ili organizacije, to implicira da će prilike za velike podatke biti
ograničene u tim sektorima. Unatoč tome, čak iu tim industrijama, igrači velikih razmjera imaju
mogućnost prikupiti dovoljno podataka da izvuku značajnu vrijednost (vidi poglavlje 3a o zdravstvenoj
skrbi za primjere). Nadalje, moguće je, iako obično izazovnije, da mnoge pojedinačne tvrtke
udružuju, dijele ili trguju podacima, ponekad putem trećih strana, kako bi uhvatile vrijednost iz
velikih podataka (vidi, posebice, poglavlje 3d o proizvodnji, gdje globalno distribuirani opskrbni lanci
mogu se optimizirati dijeljenjem velikih podataka). Konsolidacija u industriji također može donijeti
korisne učinke razmjera u agregaciji i analizi podataka.
Dok će svi sektori morati prevladati prepreke kako bi uhvatili vrijednost od korištenja velikih
podataka, prepreke su strukturno veće za neke nego za druge (Prikaz 33). Na primjer, vlada se
može suočiti s većim preprekama zbog izazova oko dostupnosti podataka i načina razmišljanja
vođenog podacima. Obrazovanje se suočava sa sličnim izazovima, uz relativan nedostatak ulaganja
u IT. Štoviše, intenzitet konkurencije u tim je sektorima relativno nizak u usporedbi s onim
sektorima u kojima tržišne snage djeluju slobodnije.
U sektorima koji su više vođeni tržištem, imperativ korištenja podataka pojačan je izravnijim
vezama s ekonomskom vrijednošću za uključene tvrtke i korisnike. Sektori kao što su
102
financije i osiguranje, proizvodnja i profesionalne usluge mogu imati relativno niže razine
prepreka koje treba prevladati upravo iz suprotnih razloga.
Prikaz 33

(najlakši za uhvatiti) 2.
Donji kvintil
kvintil
3. kvintil
Ukupni
indeks
Cate lakoće Način razmišljanja Podaci
gorije Sektori snimanja1 Talenat IT intenzitet vođen podacima dostupnost
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Trgovina na malo

otpadom i sanacije

Usluge
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
BIG DATA NUDI VRLO VELIK POTENCIJAL ZA STVARANJE VRIJEDNOSTI

GLOBALNO, ALI NEKE GEOGRAFIJE MOGU PRVO DOBITI
Naših pet studija slučaja obuhvatilo je i razvijena gospodarstva i gospodarstva u nastajanju, a naši
nalazi sugeriraju da upotreba velikih podataka može donijeti značajnu vrijednost diljem zemljopisnih područja.
Pronašli smo vrlo značajan potencijal za stvaranje vrijednosti na razvijenim tržištima primjenom
poluga velikih podataka u zdravstvu i maloprodaji. Međutim, ako uzmemo uštedu vremena za
vozače koja se može postići korištenjem navigacijskih alata u domeni osobnih podataka o lokaciji,
nalazimo da je 20 do 40 posto globalnog potencijala na tržištima u razvoju.
Različita gospodarstva i regije pokazuju vrlo različite karakteristike od količine podataka koje
generiraju do zrelosti svoje ICT infrastrukture. To ukazuje na to da bi neka geografska područja
mogla biti spremna ostvariti vrijednost brže od drugih.
Pristup velikim podacima ključni je preduvjet za bilježenje vrijednosti. Danas Sjeverna Amerika
i Europa čine većinu novih pohranjenih podataka (Prikaz 34). To sugerira da će, barem u kratkom
roku, veliki dio globalnog potencijala za stvaranje vrijednosti korištenjem velikih podataka biti u
najrazvijenijim gospodarstvima. Iako to može biti točno u cjelini, pojedinačne tvrtke na tržištima
u razvoju mogle bi uživati u pristupu velikim podacima koji bi im mogli omogućiti da ostvare
značajnu vrijednost. Osim toga, organizacije na tržištima u razvoju mogle bi pohranjivati i
analizirati svoje podatke u podatkovnim centrima koji se nalaze na razvijenim tržištima.
Sve dok postoje pravi uvjeti, postoji značajan potencijal za iskorištavanje velikih
podataka u gospodarstvima u razvoju. Uzmite u obzir činjenicu da je Azija već vodeća
regija za generiranje osobnih podataka o lokaciji jednostavno zato što se toliko
mobilnih telefona koristi. Više mobilnih telefona—procijenjenih 800 milijuna uređaja
u 2010.—u upotrebi je u Kini nego u bilo kojoj drugoj zemlji (vidi Prilog 28). Nadalje,
iako neke organizacije na tržištima u nastajanju zaostaju za svojim kolegama na
razvijenom tržištu u pogledu IT sredstava, to bi se zapravo moglo pokazati kao prednost.
Organizacije u gospodarstvima u razvoju mogle bi preskočiti najnoviju tehnologiju,
zaobilazeći naslijeđene sustave s kojima se moraju boriti mnoge njihove kolege u
naprednim gospodarstvima.
Dokaz 34
Količina novih pohranjenih podataka razlikuje se ovisno o zemljopisnom području
Novi podaci pohranjeni1 po geografiji, 2010

Petabajti
>3500
>2000
Sjeverno >250
Amerika Europa
Kina
>400
Japan
>200
Bliski istok i >50
Afrika Indija
>50 >300
latinski Ostatak APAC-a
Amerika
1 Novi pohranjeni podaci definirani kao količina raspoložive pohrane koja se koristi u određenoj godini; vidi dodatak za više o definiciji i
pretpostavke.
IZVOR: IDC izvješća o skladištenju; Analiza McKinsey Global Institute
BIT ĆE NEDOSTATAK ORGANIZACIJA ZA TALENTE
POTREBNO JE ISKORISTITI VELIKE PODATKE
Manjak ljudi s vještinama potrebnim za iskorištavanje uvida koje generiraju veliki

skupovi podataka jedno je od najvažnijih ograničenja sposobnosti organizacije da
iskoristi potencijal velikih podataka. Vodeće tvrtke već izvješćuju o izazovima u
zapošljavanju ove vrste talenata. Izvještava se da je Googleov glavni ekonomist Hal
Varian rekao da će “seksi posao sljedećih deset godina biti statističari.”87
Naše istraživanje identificira tri ključne vrste talenta potrebne za dobivanje

vrijednosti velikih podataka: duboki analitički talent—ljudi s tehničkim vještinama u
statistici i strojnom učenju, na primjer, koji su sposobni analizirati velike količine
podataka kako bi došli do poslovnih uvida; menadžeri i analitičari koji razumiju
podatke i koji imaju vještine da budu učinkoviti potrošači uvida u velike podatke – tj.
sposobni su postaviti prava pitanja za analizu, tumačiti i osporiti rezultate te donositi
odgovarajuće odluke; i pomoćno tehnološko osoblje koje razvija, implementira i
održava hardverske i softverske alate kao što su baze podataka i analitički programi
potrebni za korištenje velikih podataka. Očekujemo da će ponuda talenata u svim
ovim kategorijama biti značajno ograničenje sposobnosti organizacija oko
87 Steve Lohr, “Za današnjeg diplomanta, samo jedna riječ: statistika,” New York Times, 5. kolovoza 2009.
104
svijeta za prikupljanje vrijednosti iz velikih podataka, s najakutnijim potrebama u prvoj i drugoj

kategoriji.88 S obzirom na količinu lako dostupnih podataka o talentima, za testiranje ove hipoteze
upotrijebili smo američko tržište rada.89
Američko tržište rada povijesno je imalo visoku razinu diplomanata s diplomama u takozvanim
STEM područjima: znanosti, tehnologiji, inženjerstvu i matematici.
Međutim, posljednjih je godina ponuda takvih diplomanata bila usporena u vrijeme kada je
potražnja za njima rasla. Na primjer, na vrhuncu posljednje ekonomske ekspanzije u SAD-u,
zaposlenost za zanimanja povezana s matematikom porasla je za gotovo 4 posto, a njihove realne
plaće porasle su za 1 posto; u to se vrijeme nacionalna zaposlenost povećala za samo 1,5 posto, a
realne plaće porasle su za samo 0,6 posto.90 Tijekom tog razdoblja, broj naprednih diploma dodijeljenih
u matematici, statistici i inženjerstvu smanjio se za oko 2 posto. U budućnosti će potreba za talentom
koji se može nositi s velikim podacima zapravo biti mnogo specifičnija od pukih diplomanata STEM-a.
Iz tog smo razloga proveli detaljnu analizu uspoređujući potencijalnu potražnju za prve dvije
kategorije talenata za velike podatke – duboki analitički talent i menadžere i analitičare koji
razumiju podatke – s predviđenom ponudom u skladu s trenutnim trendovima.
U slučaju dubokog analitičkog talenta, upotrijebili smo podatke Američkog ureda za statistiku
rada (BLS) o trenutnim zanimanjima kako bismo analizirali ponudu talenata u američkoj radnoj snazi.
Podaci su iz 2008. godine, posljednje godine za koju su dostupni potpuni podaci. Koristili smo
postojeće BLS modele za projiciranje ponude dubokog analitičkog talenta u 2018., pod pretpostavkom
da se trenutni trendovi održe.
Zatim smo upotrijebili dva odvojena analitička modela kako bismo triangulirali perspektivu
potencijalne potražnje za dubokim analitičkim talentom, uz pretpostavku da će tvrtke u cijelom
gospodarstvu u potpunosti usvojiti tehnike velikih podataka do 2018. Prvi od ova dva modela
temeljili smo na prilagodbi BLS modela za objašnjavaju različite stupnjeve rasta dubokog analitičkog
talenta na temelju intenziteta podataka različitih tvrtki. Drugi smo model temeljili na potrebnim
brojevima dubokih analitičkih talenata u različitim industrijama prema veličini tvrtke.
Procjenjujemo da je ponuda dubokih analitičkih talenata u Sjedinjenim Državama 2008. bila oko
150.000 radnih mjesta. Ako uzmemo u obzir trenutne trendove novih diplomanata s dubokom
analitičkom obukom (npr. ljudi koji pohađaju diplomske tečajeve statistike ili strojnog učenja,
subspecijalnost računalnih znanosti ili studenti koji pohađaju takve tečajeve osmišljene za njihovu
posljednju godinu dodiplomskog obrazovanja) i imigracije, ovaj ukupan broj raste na oko 300.000.
Međutim, u svijetu velikih podataka, očekujemo da bi potražnja za dubokim analitičkim talentom
mogla dosegnuti 440.000 do 490.000 pozicija u 2018. – to je jaz u talentima samo u ovoj kategoriji od
140.000 do 190.000 pozicija. Ukratko, Sjedinjenim Državama trebat će dodatna ponuda ove klase
talenata od 50 do 60 posto (Prikaz 35). Razvijanje dubokih analitičkih vještina zahtijeva intrinzične
sposobnosti u matematici za početak, a zatim su potrebne godine obuke. Rješavanje problema
nedostatka talenata neće se dogoditi preko noći, a potraga za dubokim analitičkim talentom koja je
već započela može se samo intenzivirati.
88 Također nismo dali prioritet analizi pratećeg IT talenta jer su drugi istraživači
su opsežno istraživali i raspravljali o ovom pitanju.
89 Općenito, pronašli smo detaljne podatke o zanimanjima o kategorijama stručnih radnika
relativno malo izvan Sjedinjenih Država. Pogledajte poglavlje “Implikacije za donositelje politika” za
preporuku prikupljanja detaljnijih podataka o ovim kategorijama.
90 Standardna klasifikacija zanimanja (SOC) 15: Računalna i matematička zanimanja prema definiciji
američkog Ureda za statistiku rada.
Dokaz 35
U Sjedinjenim Državama diplomira najveći broj ljudi s dubokom
analitičkom obukom
Broj diplomanata s dubokom analitičkom obukom u 20081
Ukupno
Tisuću Diplomiranih na 100 ljudi
Ujedinjene države 24.73 8.11

Kina 17.41 1.31
Indija 13.27 1.12
Rusija 12.30 sati 8.66
Brazil 10.09 5.32
Poljska 8.78 23.03
Ujedinjeno Kraljevstvo 8.34 13.58
Francuska 7.77 12.47
Rumunjska 4.97 23.12
Italija 4.90 8.25
Japan 3,40 2,66
Njemačka 3,32 4,05
purica 1.84 2.64

Nizozemska 1.25 7.58
Španjolska 1.23 2.71
Češka Republika 0,95 9.12

Bugarska 0,92 12.15
Švicarska 0,76 9.93
Portugal 0,75 7.04
Belgija 0,71 6.66
Grčka 0,66 5.97
Danska 0,61 11.21
Slovačka 0,50 9.25
Norveška 0,41 8.61
Litva 0,37 11.16
Austrija 0,37 4.47
Švedska 0,29 3.16
Latvija 0,27 12.01
Mađarska 0,21 2.06
Ostalo2 0,55 4.86
1 Ovi podaci broje nove diplomante, tj. tijek dubokog analitičkog talenta, koje definiramo kao osobe s naprednom obukom u
statistiku i/ili strojno učenje i koji provode analizu podataka.
2 Ostalo uključuje Finsku, Estoniju, Hrvatsku, Sloveniju, Island, Cipar, Makedoniju i Maltu.
IZVOR: Eurostat; Statistika Rusije; Ministarstvo obrazovanja Japana; Indija sub; NASSCOM Strategic Review 2005; Kina
Statistički godišnjak; Kineske vijesti o obrazovanju; MMF-ova baza podataka o svjetskoj ekonomskoj perspektivi
Iako smo ovu analizu proveli u Sjedinjenim Državama, vjerujemo da će nedostatak

dubokog analitičkog talenta biti globalni fenomen. Međutim, postoje značajne varijacije, kako
u bruto smislu tako iu smislu po glavi stanovnika, u broju diplomiranih studenata s ovim
vještinama koje proizvode različite zemlje. Zemlje s višom proizvodnjom dubokih analitičkih
talenata po glavi stanovnika potencijalno bi mogle biti privlačni izvori ovih vještina za druga
geografska područja bilo putem imigracije ili putem tvrtki koje se preseljavaju u inostranstvo
kako bi zadovoljile svoje potrebe (prilozi 36 i 37).
U slučaju menadžera i analitičara koji razumiju podatke u svijetu velikih podataka, razina obuke
i matematičkih sposobnosti mnogo je niža od one potrebne za duboki analitički talent.
Ljudi u tim ulogama jednostavno trebaju dovoljno konceptualnog znanja i kvantitativnih vještina
kako bi mogli uokviriti i interpretirati analize na učinkovit način. Moguće je razviti takve vještine
kroz jedan tečaj statistike i eksperimentalnog dizajna. Međutim, menadžeri i analitičari bit će
potrebni u svakom sektoru. Primijenili smo metodologiju sličnu onoj koja se koristi za analizu
dubokog analitičkog talenta kako bismo razumjeli potencijalni jaz između projicirane potražnje
i ponude. Procjenjujemo da će do 2018. u Sjedinjenim Državama 4 milijuna radnih mjesta
zahtijevati ove vrste vještina u svijetu velikih podataka. Međutim, ako zbrojimo broj ljudi s ovim
vještinama i novih diplomanata koji će ući na tržište (prema trenutačnim trendovima),
dosegnut ćemo ukupno samo 2,5 milijuna ljudi u Sjedinjenim Državama u 2018. Dakle, postoji
potencijalni manjak od 1,5 milijuna menadžera i analitičara koji poznaju podatke. Ovo nije
praznina koja bi se vjerojatno mogla popuniti samo promjenom uvjeta za diplomski studij
106
i čekanje da ljudi diplomiraju s poboljšanim vještinama ili uvozom talenta (iako bi to

mogle biti važne radnje koje treba poduzeti). Dakle, prekvalifikacije postojeće radne snage će biti
potrebno.
Dokaz 36
Kina bi mogla smanjiti jaz za Sjedinjenim Državama, današnjim vodećim

dobavljačem dubokog analitičkog talenta
Prvih deset u ponudi dubokog analitičkog talenta Složena
godišnja stopa
Tisuću ljudi
rasta, 2004–08, %
25 Ujedinjene države 3.9
20
Kina 10.4
15 Indija1
1.5
Rusija
Brazil 6.2
10 Poljska 12.8
Ujedinjeno Kraljevstvo 2.5

Francuska2 -14.4
5 Rumunjska 32.9
Italija 18.9
Japan -5.3
0
2004 05 06 07 08
1 Indija je bila treća u 2008. s 13 270 ljudi s dubokim analitičkim vještinama, ali Indija nema vremensku seriju za te podatke.
2 Za Francusku, složena godišnja stopa rasta odnosi se na 2005. i 2008. zbog dostupnosti podataka.
IZVOR: Eurostat; nacionalne statističke agencije; Ministarstvo obrazovanja Japana; Indija sub; NASSCOM; Kineska statistika
Godišnjak; Kineske obrazovne vijesti, travanj 2005.; Svjetski ekonomski izgledi MMF -a; Analiza McKinsey Global Institute
Dokaz 37
Izborne jedinice velikih podataka Pojedinci/organizacije koji koriste podatke1 Pružatelji tehnologije
Aktivnost velikih podataka/lanac vrijednosti Neizravni korisnici Državni regulatori
Državni regulatori
Konzumirajte podatke i
Generirajte podatke Zbirni podaci Analizirajte podatke
izvucite vrijednost
Individualni proizvođači podataka/ Pojedinci koji prikupljaju podatke Pojedinci koji analiziraju Individualni korisnici podataka
izvori podatke
Proizvođači podataka SME2 / MSP2 koji prikupljaju podatke MSP2 koji analiziraju podatke SME2 korisnici podataka
izvori
Proizvođači/izvori podataka Velika poduzeća koja Velika poduzeća koja Veliki korisnici podataka u poduzećima
velikih poduzeća prikupljaju podatke analiziraju podatke
Pružatelji tehnologije za Agregatori podataka Pružatelji usluga analize/usluga Neizravni korisnici

generiranje podataka (npr. senzori, trećih strana (npr. usporedbe trećih strana (npr. usporedbe
hardver) cijena, Mint, Sense Network) cijena, Mint, LBS, izdavači oglasa i
posrednici)
Pružatelji pohrane (uključujući usluge)
Pružatelji softvera/usluga u poslovnoj inteligenciji, pretraživanje
1 Pojedinci/organizacije koje generiraju, prikupljaju, analiziraju ili koriste podatke.

2 Mala i srednja poduzeća.

NEKOLIKO PROBLEMA MORAT ĆE SE RIJEŠITI KAKO BI SE SNIMILO
PUN POTENCIJAL BIG DATA
Politike podataka
Kako se sve veća količina podataka digitalizira i putuje preko organizacijskih
granica, postoji niz pitanja politike koja će postati sve važnija, uključujući, ali ne
ograničavajući se na privatnost, sigurnost, intelektualno vlasništvo, pa čak i odgovornost.91
O pojedincima se zna više nego ikad, uključujući osjetljive podatke kao što su
zdravstveni i financijski podaci, a mnogi će građani zahtijevati da tvrtke i njihove vlade
zaštite njihovu privatnost. Osobni podaci kao što su zdravstveni i financijski podaci
često su oni koji mogu ponuditi najznačajnije ljudske dobrobiti, poput pomoći u
određivanju pravog medicinskog tretmana ili najprikladnijeg financijskog proizvoda.
Međutim, potrošači te kategorije podataka također smatraju najosjetljivijima. Pojedinci,
tvrtke i vlade morat će razmisliti o kompromisima između privatnosti i korisnosti.
Već vidimo da sigurnost podataka postaje sve gorući problem sada kada su podaci
ključni faktor proizvodnje i konkurentna imovina. Jedno je istraživanje pokazalo da se
broj ugroženih zapisa povećao za 30 posto svake godine između 2005. i 2009. u
Sjedinjenim Državama.92 Drugo istraživanje pokazalo je da sigurnosni kompromisi
koštaju više od 200 dolara po zapisu u naporima za otkrivanje, obavještavanje i
popravke, kao i klijente izgubljeno.93 Takve sigurnosne povrede utječu na niz sektora
uključujući financijske institucije, maloprodaju, hotele, pa čak i nacionalnu obranu.
Sve veća ekonomska važnost velikih podataka također pokreće brojna pravna
pitanja, posebno u kombinaciji s činjenicom da su podaci bitno drugačiji od mnogih
drugih sredstava. Podaci se mogu savršeno kopirati i jednostavno kombinirati s
drugim podacima, a isti podatak može koristiti više osoba istovremeno. Dakle,
intelektualno vlasništvo će postati još važnije razmatranje za kreatore politike, koji
će postaviti pravila koja određuju zakonska prava povezana s vlasništvom i
korištenjem podataka, te što predstavlja "poštenu upotrebu" podataka. Odgovornost
– kao što je tko je odgovoran kada netočni podaci dovedu do negativnih posljedica –
još je jedno pitanje koje će vjerojatno doći u prvi plan.
Tehnologija i tehnike Današnji

naslijeđeni sustavi i nekompatibilni standardi i formati danas često sprječavaju
integraciju podataka i sofisticiraniju analitiku koja stvara vrijednost iz velikih
podataka. Organizacije će morati primijeniti nove tehnologije i tehnike kako se budu
razvijale kako bi prevladale ovu prepreku. U konačnici, korištenje velikih digitalnih
skupova podataka zahtijevat će sastavljanje tehnološkog skupa od pohrane i računalstva
do analitičkih i softverskih aplikacija za vizualizaciju. Specifični tehnološki zahtjevi i
prioriteti razlikovat će se ovisno o polugama velikih podataka koje treba implementirati i
zrelosti podataka institucije, što dovodi do vrlo različitih razina troškova ulaganja.
Nekim tvrtkama nedostaje tehnologija za digitalno hvatanje podataka (npr. neke manje
zdravstvene ustanove u SAD-u) ili za izdvajanje, transformiranje i učitavanje velikih
skupova podataka iz drugih izvora. Ostale će organizacije morati dopuniti svoje postojeće
resurse za pohranu ili računalstvo. Mnogi hoće
91 Privatnost i sigurnost podataka važna su i sveprisutna pitanja koja se proučavaju

i o njima se nadugo raspravljalo drugdje, ali nisu bili glavni fokus istraživanja u ovom izvješću.
92 Trezor koji curi: Pet godina povrede podataka, Digital Forensics Association, srpanj 2010.
93 Četvrta godišnja američka studija troškova povrede podataka, Ponemon Institute, siječanj 2009.
108
potreba za implementacijom naprednih analitičkih i vizualizacijskih softverskih alata. U mnogim

slučajevima morat će se uzeti u obzir naslijeđeni sustavi i nekompatibilni standardi i formati.
Primjeri uključuju spajanje različitih skupova podataka kao što možemo vidjeti u tvrtkama za
financijske usluge koje žele kombinirati podatke o online financijskim transakcijama, ponašanje
klijenata u poslovnicama, podatke od partnera kao što su osiguravajuća društva i povijest kupnje u
maloprodaji. Također, mnoge poluge zahtijevaju ogromnu količinu podataka (npr. spajanje zapisa
pacijenata kod više pružatelja usluga), što može postaviti jedinstvene zahtjeve pred tehnološke
infrastrukture. Kako bi se osigurao okvir pod kojim će se razvijati i upravljati mnogim međusobno
povezanim tehnološkim komponentama potrebnim za uspješno izvršavanje velikih podatkovnih
poluga, svaka će organizacija morati izraditi i provesti robusnu podatkovnu strategiju poduzeća.
Organizacijske promjene i talent
Organizacijski čelnici moraju shvatiti da veliki podaci mogu otključati vrijednost—i kako ih iskoristiti
u tu svrhu. Od vitalne je važnosti da organizacije nauče kako iskoristiti velike podatke ako već ne
znaju kako to učiniti—jer će mnogi njihovi konkurenti sigurno koristiti velike podatke kako bi ostvarili
konkurentsku prednost. Kao što smo primijetili, mnoge organizacije nemaju niti kvalificirano osoblje
koje im je potrebno za rudarenje velikih podataka radi uvida, niti strukture i poticaje potrebne za
korištenje velikih podataka za donošenje utemeljenijih odluka i djelovanje u skladu s njima.
Pristup podacima
Pristup podacima morat će se proširiti kako bi se iskoristio puni potencijal za stvaranje vrijednosti.
Tvrtke će sve više morati dobiti pristup izvorima podataka trećih strana i integrirati vanjske
informacije sa svojima kako bi uhvatile puni potencijal velikih podataka. U mnogim slučajevima tek
treba uspostaviti učinkovita tržišta za trgovanje ili dijeljenje podataka.
Na primjer, ne postoje učinkovita tržišta za dijeljenje agregatnih obrazaca kretanja izvedenih iz
mobilnih telefona—potencijalno vrijednih trgovcima na malo koji pokušavaju razumjeti ponašanje
potrošača. U drugim slučajevima, poticaji su neusklađeni tako da zainteresirane strane žele
zadržati informacije za sebe. U zdravstvenoj zaštiti, na primjer, pružatelji će morati uložiti velika
sredstva za velike podatke kako bi stvorili, agregirali i analizirali digitalne kliničke podatke iz medicinske
dokumentacije, koji mogu otkriti informacije koje će platitelji koristiti u svoju korist u ugovornim
pregovorima (npr. platitelji usmjeravaju pacijente daleko od pružatelja usluga s visokom cijenom, ali
prosječnom izvedbom). Kako bi se u potpunosti uhvatila vrijednost koju mogu omogućiti veliki podaci,
morat će se prevladati prepreke u pristupu podacima.
Struktura industrije
Relativna lakoća – ili težina – hvatanja vrijednosti iz velikih podataka ponekad će ovisiti o
strukturi određenog sektora ili industrije. Sektori s relativnim nedostatkom konkurentskog intenziteta
i transparentnosti izvedbe te industrije s visoko koncentriranim fondom dobiti vjerojatno će sporo u
potpunosti iskoristiti prednosti velikih podataka.
Javni sektor, na primjer, ima tendenciju ograničenog konkurentskog pritiska, što ograničava
učinkovitost i produktivnost i postavlja veću prepreku za dobivanje vrijednosti od korištenja velikih
podataka. Zdravstvu u SAD-u nedostaje ne samo transparentnost u pogledu troškova i kvalitete
liječenja, već i struktura industrije u kojoj platitelji imaju koristi od upotrebe kliničkih podataka (npr. od
manje isplata za nepotrebno liječenje), ali nauštrb pružatelji usluga (npr. manje medicinskih aktivnosti
za naplatu) od kojih bi morali dobiti te kliničke podatke. Kao što ovi primjeri sugeriraju, čelnici
organizacija i kreatori politika moraju razmotriti kako bi se industrijske strukture mogle razvijati u svijetu
velikih podataka ako žele odrediti kako optimizirati stvaranje vrijednosti u tvrtkama, sektorima i
gospodarstvima u cjelini.
Naše istraživanje sugerira da postoji niz načina na koje veliki podaci mogu stvoriti
vrijednost koju tvrtke i organizacije, uključujući vlade, mogu primijeniti u različitim sektorima.
Ali da bi se to postiglo uz maksimalnu učinkovitost, svi ti igrači će zahtijevati da prevladaju
niz prepreka i da se pozabave ključnim pitanjima koja su od dubokog interesa javnosti,
posebice privatnosti i sigurnosti. U sljedeća dva poglavlja raspravljat ćemo o tome što tvrtke,
organizacije i kreatori politika mogu učiniti kako bi olakšali put prema potpunom hvatanju
vrijednosti koju veliki podaci mogu stvoriti.
5. Implikacije za voditelje organizacije
Kako veliki podaci i njihove poluge postaju sve vrednija imovina, njihovo inteligentno
iskorištavanje bit će ključno za poduzeća da se učinkovito natječu. Već vidimo organizacije
koje razumiju i prihvaćaju korištenje velikih podataka kako se povlače ispred svojih kolega u
opipljivim mjerama korporativnog učinka. Korištenje velikih podataka postat će ključna osnova
konkurencije među sektorima, stoga je neophodno da organizacijski čelnici počnu uključivati velike
podatke u svoje poslovne planove.
Iako će se posebne prilike za iskorištavanje velikih podataka za stvaranje vrijednosti razlikovati

po sektorima, kao što smo pokazali u našim studijama slučaja domene, čelnici organizacija mogu
početi identificirati i procjenjivati prilike uz pet međusektorskih tema koje smo identificirali. Osim
toga, postoji skup uobičajenih čimbenika kojima bi se svaki rukovoditelj trebao pozabaviti kako bi
otključao moć velikih podataka. Organizacije ne samo da će trebati osigurati da imaju dovoljno
vještina u analitici pozadinskih ureda, već i upravljati tranzicijom prema pravom menadžerskom
talentu na prvoj crti koji će biti sposoban provoditi strategiju temeljenu na uvidima koje analitičari
izvlače iz velikih podataka.
1. IMOVINA PODATAKA O INVENTU: VLASNIČKA, JAVNA I KUPLJENA
Budući da podaci postaju ključna konkurentska imovina, čelnici moraju razumjeti imovinu koju
posjeduju ili kojoj mogu imati pristup. Organizacije bi trebale provesti inventar vlastitih vlasničkih
podataka, te također sustavno katalogizirati druge podatke kojima bi potencijalno mogle dobiti
pristup, uključujući javno dostupne podatke (npr. državne podatke, druge podatke koji se
objavljuju u javnoj domeni) i podatke koji mogu kupiti (npr. od agregatora podataka ili drugih
igrača u lancu vrijednosti podataka).
Doista, kako bi se omogućile transformativne prilike, tvrtke će sve više morati dobiti pristup
izvorima podataka trećih strana, integrirajući takve informacije sa svojima. U nekim će slučajevima
organizacije moći kupiti pristup podacima. U drugim slučajevima, izvori podataka trećih strana
možda nisu razmišljali o njihovom dijeljenju.
Organizacije će morati promišljeno razmotriti i predstaviti uvjerljivu vrijednosnu ponudu za
te treće strane da im dijele ili prodaju podatke ili odrediti drugi skup poticaja (npr. regulatorne
mjere) kako bi se osigurao pristup podacima. Često će se morati riješiti skup tehnoloških izazova
(npr. standardiziranje podataka, implementacija izvora podataka) kako bi se osigurao dosljedan,
pouzdan i pravovremen pristup vanjskim podacima.
Na primjer, mnoge su tvrtke nedavno otkrile vrijednost podataka s društvenih medija.

Telekomunikacijske tvrtke otkrile su da su neke informacije s društvenih mreža korisne u
predviđanju odljeva korisnika. Otkrili su da je vjerojatnije da će korisnici koji poznaju druge koji su
prestali koristiti određeni telekom vjerojatnije to sami učiniti, pa su ti korisnici koji će vjerojatno
odustati ciljani za programe zadržavanja. Druge tvrtke okrenute potrošačima otkrile su da mogu
učiti o stavovima kupaca, trendovima kupnje i ukusu iz osjećaja izraženih na internetu, što im
omogućuje pravovremene promjene u marketingu i napredovanje promjena u planiranju proizvoda.
112
2. IDENTIFICIRAJTE POTENCIJALNE PRILIKE I PRIJETNJE ZA STVARANJE VRIJEDNOSTI
Opisali smo pet međusektorskih kategorija stvaranja vrijednosti korištenjem velikih podataka koji
se mogu primijeniti na svaku funkciju. Organizacije bi trebale započeti proces identifikacije i
prioritizacije ovih prilika; voditelji poslovnih linija i funkcija trebali bi pokrenuti procese u svojim
područjima odgovornosti. Vrijedno je napomenuti da će prepoznavanje prilika i potencijalnih izvora
vrijednih podataka (vidi prethodni odjeljak), posebno vanjskih izvora podataka, često biti iterativni, a
ne sekvencijalni proces.
Kako bi potvrdile ove prilike za velike podatke, vodeće organizacije često su otkrile da
usvajanje procesa svrhovitog eksperimentiranja (metaprimjena poluge eksperimentiranja s
velikim podacima) može biti najmoćniji put prema tome da se postane organizacija koja u
potpunosti koristi velike podatke, a ne određivanje cjelovitog plana za poduzeće prije bilo kakve
implementacije. Odabir nekoliko područja visokog potencijala u kojima će se eksperimentirati s
velikim podacima, npr. s digitalnim marketingom, a zatim brzo povećanje uspjeha može biti
učinkovit način za početak transformacije.
U našem istraživanju otkrili smo da stvaranje značajne nove vrijednosti ne zahtijeva nužno
izravno preskakanje na složene analitičke poluge velikih podataka. U mnogim slučajevima,
poluge usmjerene prvenstveno na dostupnost podataka ili primjenu osnovne analitike mogu
stvoriti značajnu vrijednost čak i prije nego što organizacija usvoji naprednije poluge.
Vidimo to u zdravstvu, gdje stvaranje transparentnosti i primjena osnovnih poluga može generirati
samo oko 40 posto potencijala stvaranja vrijednosti. Doista, nalazimo da većina organizacija slijedi
put kojim se s vremenom izgrađuju sposobnosti.
Naše je istraživanje identificiralo četiri razine zrelosti ili sofisticiranosti za kategorizaciju radnji koje
se mogu poduzeti. Najosnovnije je digitalizacija i strukturiranje podataka, što je zapravo korak prije
korištenja velikih podataka. Sastoji se od koraka koji osiguravaju da su podaci generirani, strukturirani
i organizirani na takav način da ih krajnji korisnici mogu koristiti izravno ili za daljnju analizu. Ove
tehnike uključuju "pročišćavanje" podataka kako bi se uklonile pogreške i osigurala kvaliteta
podataka, stavljanje podataka u standardne obrasce i dodavanje metapodataka koji opisuju podatke
koji se prikupljaju. Druga razina sofisticiranosti zahtijeva dostupnost podataka, npr. putem mreža,
što je usklađeno s prvom od pet kategorija poluga velikih podataka o kojima smo ranije raspravljali.
To može biti snažan pokretač vrijednosti sam po sebi, a također može biti važan prvi korak u
integraciji skupova podataka za stvaranje smislenijeg poslovnog uvida. Treća razina sofisticiranosti
je primjena osnovne analitike, koja u biti pokriva niz metodologija, kao što su usporedbe osnovnih
podataka i relativno standardizirane kvantitativne analize, npr. one koje ne zahtijevaju prilagođene
analize koje trebaju dizajnirati ljudi s dubokim analitičkim vještinama. Četvrta i najviša razina je
primjena napredne analitike, kao što su automatizirani algoritmi i analiza podataka u stvarnom
vremenu koji često mogu stvoriti radikalne nove poslovne uvide i modele. Omogućuju nove razine
eksperimentiranja kako bi se razvili optimalni pristupi ciljanju kupaca i operacija te otvaraju nove
prilike za velike podatke s trećim stranama. Iskorištavanje velikih podataka na ovoj razini često
zahtijeva stručnost dubokog analitičkog talenta.
Osim ispitivanja potencijala na temelju razine sposobnosti unutar organizacije, voditelji

također mogu ispitati različite mogućnosti kroz objektiv tipova podataka identificiranih
tijekom popisa podataka. Vjerojatno će postojati niz prilika povezanih s hvatanjem vrijednosti iz
vlasničkih skupova podataka koje organizacija već ima, osobito kroz dodatne analize. Za
na primjer, pružatelj zdravstvenih usluga mogao bi otkriti da može analizirati skup podataka o
kliničkim ishodima kako bi bolje identificirao izvore medicinskih pogrešaka. Druga kategorija
mogućnosti dolazi od dodavanja novih skupova podataka koji se mogu uhvatiti ili nabaviti (javni i
kupljeni) ovim analizama. Ovi skupovi podataka često će uključivati nestandardne tipove podataka,
jer su to podaci koji se obično ne koriste unutar organizacije. Na primjer, osiguravajuće društvo
moglo bi otkriti da mu dodavanje podataka daljinskog istraživanja (slike sa satelita) može pomoći
da bolje procijeni rizike nekretnina. Treći niz prilika dolazi iz razmatranja novog poslovanja i poslovnih
modela koji su temeljno izgrađeni na velikim podacima, a ne temeljeni nužno na istim vrstama
analiza koje podržavaju postojeće poslovanje.
Na primjer, pružatelj usluga plaćanja mogao bi otkriti da je stvorio novi posao prodajom uvida
potrošačima na temelju tokova podataka koje generira (tzv. "iskorišteni podaci") tijekom obrade
plaćanja.
Organizacije bi također trebale paziti na potencijalne poremećaje koje veliki podaci mogu potaknuti.
U kontekstu lanca vrijednosti velikih podataka (prikaz 39), agregacija i analiza postaju sve vrijedniji
pa generatori podataka dodaju te mogućnosti kako bi potpunije ostvarili potencijalnu vrijednost, kao
i za obranu od novih sudionika koji se usredotočuju isključivo na agregaciju i analizu. Na primjer,
trgovac velikim podacima kao što je Tesco igra duž cijelog lanca vrijednosti kako bi ostvario najveći
potencijal. Svoj program vjernosti koristi za prikupljanje podataka o kupnji kupaca, koje zatim analizira
kako bi donio razne odluke, uključujući mikrosegmentaciju svojih kupaca radi optimizacije miksa
proizvoda, cijena i promocija. Još jedan primjer napredne integracije u lancu vrijednosti podataka su
veliki obveznici zdravstvenih usluga, od kojih neki ulaze u posao prikupljanja i analize kliničkih
podataka s podacima o zahtjevima, kako bi pružili podatkovne usluge klijentima kao što su
farmaceutske tvrtke. Opet, prelazak na agregaciju i analizu može biti obrambeni potez za sprječavanje
novih sudionika. U nekim sektorima, agregatori podataka trećih strana, koji sami ne generiraju
podatke, pružaju uslugu s dodanom vrijednošću povrh agregiranih podataka u korist kupaca. U
financijskim uslugama, na primjer, internetska tvrtka Mint (koju je kupio Intuit) skuplja financijske
podatke o pojedincima i pruža usluge s dodanom vrijednošću (npr. alate za financijsko planiranje),
iako sama ne generira financijske podatke. Mint i drugi koji koriste ovaj poslovni model mogu
predstavljati prijetnju tradicionalnim financijskim institucijama posjedovanjem odnosa s klijentima
kroz njihov sveobuhvatniji pogled na cjelokupni financijski položaj potrošača.
Organizacije bi također trebale paziti na pojavu međusektorskih domena, kao što su osobni
podaci o lokaciji, gdje se inovacije događaju vrlo brzo. Često imaju vrlo fragmentirane lance
vrijednosti podataka, s mnogim dionicima koji igraju različite uloge, a svi pokušavaju osmisliti
poslovne modele koji će maksimizirati njihov udio u fondu dobiti.
Doista, potreba za razmjerom podataka i IT infrastrukturom može postati ključni pokretač prema
konsolidaciji, što može biti i prilika i prijetnja, u sektorima u kojima su igrači ispod razmjera brojni.
Prostor za pružatelje zdravstvenih usluga dobar je primjer gdje je ostalo mnogo relativno malih
liječničkih ordinacija. Kako prelaze u digitalno doba elektroničkih medicinskih zapisa i pokušavaju
izvući korist iz podataka, moglo bi im se isplatiti spojiti s drugima kako bi povećali opseg.
Povećani pristup podacima, omogućen oblakom, također može poremetiti poslovne i

operativne modele. Mnogi primjeri distribuiranog zajedničkog stvaranja uključuju suradnju s
vanjskim partnerima i kupcima za obavljanje mnogih korporativnih funkcija, od istraživanja i
razvoja (npr. razvoj softvera otvorenog koda) do marketinga (npr. online natjecanje u oglašavanju)
i korisničke službe (npr. online zajednice korisničke podrške) , koje su zaposlenici tradicionalno
obavljali interno.
114
Dokaz 38
MGI je sastavio toplinsku kartu Gornji kvintil 4. kvintil

(najveći potencijal)
potencijala vrijednosti korištenja velikih Donji kvintil (najniži
2. kvintil 3.
podataka u različitim sektorima potencijal)
kvintil Nema dostupnih podataka
Indeks Intenzitet
ukupnog Količina Varijabilnost kupaca i
Sektori potencijala podataka u izvedbi dobavljača Intenzitet
kategorija vrijednosti1 po poduzeću transakcije Turbulencija
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Trgovina na malo

otpadom i sanacije

Usluge
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
3. IZGRADITE INTERNE SPOSOBNOSTI ZA STVARANJE ORGANIZACIJE

UPRAVLJENE PODACIMA
Organizacije će trebati imati prave ljude i procese za dobivanje vrijednosti od korištenja velikih
podataka. Što se tiče ljudi, istraživanje MGI-ja pokazuje da su ključni skupovi talenata koji će biti u
sve manjoj ponudi duboki analitički talent za provođenje analiza velikih podataka; menadžeri i
analitičari koji znaju kako zatražiti i konzumirati velike analize podataka; i pomoćno tehnološko
osoblje za implementaciju velikih podataka. Fokusiramo se na prve dvije kategorije u ovom odjeljku
i bavimo se trećom u sljedećem odjeljku o implementaciji podatkovne strategije poduzeća.
Tvrtke s velikim podacima iz najbolje prakse izgradile su dovoljan opseg u središnjoj skupini
dubokih analitičkih talenata, na koje se ostatak njihove organizacije može osloniti. S obzirom na
potencijalnu konkurenciju za ovaj talent, organizacije moraju agresivno regrutirati duboke analitičke
talente. To može uključivati pronalaženje talenata iz drugih područja ili nabavu nekih analitičkih
usluga od dobavljača. Jedna važna stvar koju treba napomenuti je da su rana zapošljavanja kritična
jer su oni ti koji grade timove. Teško je pronaći ljude koji su voljni zaposliti svoje zamjene, stoga je
rano zapošljavanje najsposobnijih ljudi najbolji način za izgradnju vrlo učinkovitog tima. Jedna
tvrtka za financijske usluge cijenjena zbog svoje upotrebe podataka i eksperimentiranja, na primjer,
identificirala je mrežu ciljanih institucija koje su poznate po tome što pokazuju vrhunski analitički
talent i koje su u neposrednoj blizini sjedišta. Tvrtka je razvila odnos s tim institucijama tako da ne
samo da ima istaknutu prisutnost tijekom sezone zapošljavanja, već ih koristi i kao puteve za
kontinuiranu obuku, gdje tvrtka šalje zaposlenike s dubokom analitikom da se napune i nauče nove
tehnike.
Voditelji će također morati smisliti kako organizirati ovaj kadar dubokog analitičkog
talenta tako da, kada formiraju internu zajednicu ili centar izvrsnosti, budu učinkovito
povezani s ostatkom organizacije i mogu dobro surađivati s poslovnim vođama.
Nadalje, zadržavanje i motiviranje ovog vrijednog talentiranog kadra zahtijevat će, na
način sličan slučaju drugih stručnjaka visoke razine znanja, novčane i, što je još važnije,
intrinzične poticaje kao što su zanimljivi problemi koje treba riješiti.94
Ali posjedovanje osnovnog skupa dubokog analitičkog talenta nije dovoljno za

transformaciju organizacije, pogotovo ako ključni poslovni čelnici i analitičari ne
znaju kako iskoristiti ovu sposobnost velikih podataka. Svi poslovni čelnici u organizaciji
morat će razviti temeljno razumijevanje analitičkih tehnika kako bi postali učinkoviti korisnici
ovih vrsta analiza. Organizacije mogu modificirati svoje kriterije za zapošljavanje kako bi
uzele u obzir ovaj zahtjev, ali što je još važnije, morat će razviti programe obuke kako bi
povećale sposobnosti svoje trenutne uprave i analitičara. Osnovni statistički program ili niz
predavanja iz analize podataka na lokalnom koledžu ili sveučilištu, na primjer, mogli bi
stvoriti tim visoko motiviranih menadžera i analitičara koji bi mogli započeti ovu
transformaciju. Capital One, tvrtka za financijske usluge, stvorila je interni institut za obuku,
Sveučilište Capital One, koje nudi profesionalni program za testiranje i dizajn eksperimenta,
na primjer. S odgovarajućim mogućnostima na mjestu, organizacije moraju uskladiti poticaje,
strukture i tijekove rada tako da zaposlenici na svim razinama iskoriste uvide proizašle iz
velikih podataka. Britanski trgovac na malo Tesco, na primjer, razvio je snažan način
razmišljanja vođen podacima od najvišeg vodstva do prve linije. Integrirao je
obavještavanje o korisnicima u svoje operacije na svim razinama iz različitih strategija velikih
podataka usmjerenih na potrošače.
U Famous Footwearu, prodavaču cipela, izvršni tim se sastaje s voditeljem testiranja
svaka dva tjedna kako bi razgovarali o rezultatima i planirali programe prikupljanja
podataka i evaluacije. Na Amazon.com je rečeno da je Jeff Bezos otpustio grupu web
dizajnera koji su promijenili web stranicu tvrtke bez provođenja eksperimenata kako bi se
utvrdili učinci na ponašanje kupaca. U svim tim tvrtkama veliki podaci i njihove najmoćnije
poluge sastavni su dio dijaloga menadžmenta i kulture organizacije.
4. RAZVITI INFORMACIJSKU STRATEGIJU PODUZEĆA ZA IMPLEMENTACIJU

TEHNOLOGIJE
Kako bi se pripremile za svijet velikih podataka, organizacije bi trebale razviti integriranu

podatkovnu strategiju za cijelo poduzeće. Podatkovne modele, arhitekture i atribute
rješenja potrebno je razmatrati holistički. Uzimajući podatke o klijentima kao primjer,
čest problem je da diskretne poslovne jedinice, u silosima, razviju vlastite podatkovne
strategije bez planiranja dijeljenja ili prikupljanja podataka u cijeloj organizaciji. Kao rezultat
toga, organizacije često otkrivaju da nemaju čak ni zajedničku definiciju svojih kupaca i
atributa koji se primjenjuju na različite linije poslovanja. Takve se razlike mogu pojaviti čak
i unutar iste poslovne jedinice. Nedostatak pogleda usmjerenog na kupca ozbiljno ograničava
sposobnost organizacije da koristi bilo koju moćnu polugu velikih podataka za stvaranje
nove vrijednosti. Učinkovita podatkovna strategija poduzeća mora uključivati interoperabilne
podatkovne modele, transakcijsku podatkovnu arhitekturu, integracijsku arhitekturu,
analitičku arhitekturu, sigurnost i usklađenost te usluge prve linije.
Mnoge će organizacije zahtijevati dodatna ulaganja u IT hardver, softver i usluge za

snimanje, pohranjivanje, organiziranje i analizu velikih skupova podataka. Nivo
94 Peter F. Drucker, Izazovi menadžmenta za 21. stoljeće (New York, NY: Harper
Posao, 1999).
116
ulaganja značajno će varirati ovisno o trenutnom stanju IT sposobnosti i zrelosti

tvrtke. IT čelnici morat će procijeniti i identificirati sve nedostatke u tehnologiji koju
njihova tvrtka ima na raspolaganju za učinkovito hvatanje, pohranjivanje, prikupljanje,
komuniciranje i analizu podataka. Morat će surađivati s poslovnim čelnicima
organizacije kako bi razvili poslovne slučajeve za nova ulaganja i potom odredili prioritete
te potrošnje.
Unatoč potrebi za sveobuhvatnom podatkovnom strategijom poduzeća, često može biti

korisno započeti implementaciju na vrlo ciljanim projektima kako bi se naučilo što
funkcionira i kako bi se započelo s razvojem sposobnosti (pogledajte našu preporuku o
eksperimentiranju u gornjem odjeljku "Identificirajte potencijalne prilike za stvaranje
vrijednosti" ). Na primjer, Kaiser Permanente u Kaliforniji u početku se koncentrirao na
jedan IT projekt isključivo za pacijente s dugotrajnim bolestima stvaranjem specifičnih
registara bolesti i rješenja za upravljanje pločama, umjesto sveobuhvatnog IT rješenja
koje se bavi nizom problema. To je dovelo do puno bržeg vremena za utjecaj.
5. RIJEŠITE PITANJA POLITIKE PODATAKA
Rješavanje pitanja privatnosti i sigurnosti postat će najvažnije jer sve više

podataka putuje preko granica u različite svrhe. Privatnost, posebno, ne zahtijeva
samo pozornost na usklađenost sa zakonima i propisima, već je također temeljna za
odnose povjerenja organizacije s klijentima, poslovnim partnerima, zaposlenicima i
drugim dionicima. Svakako, organizacije će trebati politike koje su u skladu sa
zakonima o privatnosti i svim državnim propisima o privatnosti.
Ali u razvoju politike privatnosti, organizacije će morati promišljeno razmotriti kakvu
vrstu pravnih sporazuma i, što je još važnije, očekivanja povjerenja, žele uspostaviti
sa svojim dionicima. Morat će jasno komunicirati svoje politike sa svojim dionicima,
posebno klijentima, jer postaju sve pametniji i zabrinutiji o tome što se o njima zna i kako
se te informacije potencijalno mogu koristiti.
Kao dio podatkovne strategije poduzeća, organizacije će morati jasno definirati i

implementirati strategiju rizika poduzeća koja uključuje sve njihove IT funkcije. Ova
strategija mora uključivati temeljitu procjenu rizika poduzeća koja procjenjuje sve, od
vjerojatnosti fizičke provale, do vjerojatnosti da hakeri prodru u glavno računalo, ali
možda najvažnije, rizike ljudi s ovlaštenim pristupom koji koriste taj pristup u svrhe
koji su u suprotnosti s ciljevima organizacije. Postoji niz IT rješenja (npr. VPN-ovi,
intranet vatrozidi, nadzor prijetnji) koja mogu pomoći u upravljanju privatnošću
podataka i sigurnosnim rizicima.
Voditelji organizacija također će se morati boriti s pravnim pitanjima koja se odnose

na njihov stav o intelektualnom vlasništvu za podatke, kako će razmišljati o odgovornosti,
itd. To su teme koje jasno zahtijevaju specijaliziranog pravnog savjetnika, ali uz pristup
koji uzima u obzir višestruka razmatranja, uključujući strategiju, odnose s kupcima,
partnerima i zaposlenicima te tehnologiju.
Natjecanje i hvatanje vrijednosti korištenjem velikih podataka zahtijevat će od lidera da se pozabave

specifičnim preprekama u pogledu talenta, tehnologije, privatnosti i sigurnosti, organizacijske kulture
i poticaja za pristup podacima. Hitno je potrebno da čelnici organizacija počnu identificirati ili
pročistiti ulogu velikih podataka u svojim poslovnim planovima i počnu postavljati čimbenike za
postizanje vrijednosti.
6. Implikacije za kreatore politike
Vrijednosni potencijal koji podupire korištenje velikih podataka neće se ostvariti ako vlada i
kreatori politika, uz voditelje pojedinačnih organizacija, ne shvate i odgovore na niz prepreka
i čimbenika koje smo identificirali. Naše je istraživanje pokazalo da veliki podaci nisu samo
snažan pokretač konkurencije i rasta za pojedinačne tvrtke, već da, u cjelini, također mogu
pomaknuti iglu produktivnosti, inovativnosti i konkurentnosti za čitave sektore i gospodarstva u
razvijenim i svjetovi u razvoju.
Kreatori politike koji razmišljaju unaprijed držat će korak s razvojem velikih podataka i
pronaći pravovremena rješenja za prepreke koje danas stoje na putu da se uhvati njihova
puna vrijednost. Možda će biti potrebna akcija i na nacionalnoj i na međunarodnoj razini
ako kreatori politika žele pomoći organizacijama da maksimalno iskoriste priliku velikih podataka.
Baš kao što vidimo rane dokaze da tvrtke vješte u korištenju velikih podataka vode ispred
svoje konkurencije, korištenje velikih podataka moglo bi igrati značajnu ulogu u konkurentnosti
zemlje.
Kreatori politika moraju razmotriti izbore koje bi trebali donijeti kako bi pomogli
pojedinim tvrtkama u svojim gospodarstvima da izvuku vrijednost iz korištenja velikih
podataka. Glavna područja u kojima politika može igrati ulogu su izgradnja ljudskog
kapitala (npr. poboljšanje ponude diplomanata koji poznaju velike podatke i ublažavanje
imigracijskih ograničenja); usklađivanje poticaja za osiguranje pristupa podacima; rješavanje
pitanja privatnosti i sigurnosti; uspostavljanje okvira intelektualnog vlasništva; prevladavanje
tehnoloških prepreka podacima; te promicanje infrastrukture informacijske i komunikacijske
tehnologije. Tvorci vladinih politika u mnogim gospodarstvima već se bave ili barem raspravljaju o
ovim područjima. Ovo je zadatak kojim se moraju početi baviti vrlo hitno. Bez odgovarajućih
pravila, zakona, smjernica i poticaja, gospodarstva koja su manje napredna u tim područjima
riskirat će da se nađu u nepovoljnijem položaju u odnosu na one koji cijene dinamiku i potencijal
velikih podataka.
1. IZGRADITE LJUDSKI KAPITAL ZA VELIKE PODATKE
Vlade mogu djelovati na razne načine kako bi pomogle povećati ponudu talenata
potrebnih za iskorištavanje velikih podataka. Prvo, vlade mogu pokrenuti obrazovne
inicijative kako bi povećale broj diplomanata s pravim vještinama. U Sjedinjenim
Državama, na primjer, postoji pritisak na saveznoj, državnoj i lokalnoj razini da se podupre
više obrazovanja iz znanosti, tehnologije, inženjerstva i matematike (STEM). Većina drugih
vlada OECD-a također prepoznaje potrebu za većim brojem diplomanata STEM koji su povijesno
nedovoljno zastupljeni u tim područjima, uključujući žene. Međutim, potrebe za dubokim
analitičkim talentom specifičnije su čak i od ovoga — bit će potrebno više diplomanata s
naprednom obukom u statistici i strojnom učenju (poddisciplina računalne znanosti). Drugi način
na koji vlade mogu povećati ponudu talenata je smanjenje prepreka za pristup tim bazenima u
drugim regijama, tj. radom na daljinu ili imigracijom kvalificiranih radnika.
118
Izazov razvoja velikog broja organizacijskih vođa i analitičara u poslovnom, državnom i društvenom
sektoru koji imaju osnovno razumijevanje analitičkih tehnika daleko je većeg opsega. U najmanju ruku,
novi stručni radnici koji su već u procesu obrazovanja na putu ka radnoj snazi trebali bi se obrazovati o
ovim temama; obvezni kolegij iz statistike/znanosti odlučivanja, s modulom o eksperimentalnom dizajnu,
trebao bi postati dio nastavnog plana i programa u područjima kao što su poslovna administracija i druge
upravljačke discipline. Ali čekanje cijele nove generacije diplomanata bit će nedovoljno. Vlada bi mogla
stvoriti poticaje za obuku postojećih menadžera i analitičara u ovim tehnikama.
Također smo otkrili u našem istraživanju da detaljni nacionalni podaci o radnoj snazi o
Stručne radnike, prema kategoriji zanimanja i industriji, bilo je teško pronaći izvan Sjedinjenih
Država (uključujući uloge koje zahtijevaju duboke analitičke vještine, kao i uloge menadžmenta i
analitičara, između ostalog). Nekoliko zemalja moglo je pružiti vrlo detaljne podatke o zanimanjima
povezanim s proizvodnjom (npr. „kovanje plemenitih metala”), ali su imale vrlo široke kategorije za radnike
znanja (npr. „bankari”).
Na temelju načela da "ne možete upravljati onim što ne možete mjeriti", kreatori politika u tim
zemljama mogli bi uputiti svoje agencije za statistiku rada da počnu prikupljati detaljnije podatke o
zapošljavanju u kategorijama stručnih radnika (idealno, u standardnim kategorijama koje bi omogućuju
usporedbe među zemljama). Ti bi podaci bolje informirali njihove odluke o tome kako razviti ljudski
kapital, tj. radnike znanja općenito, a posebno za pozicije povezane s velikim podacima.
2. USKLAĐITE POTICAJE ZA PROMICANJE RAZMJENE PODATAKA ZA

VEĆE DOBRO
Jedan od najvažnijih pokretača stvaranja vrijednosti iz velikih podataka je kombiniranje podataka iz

više izvora. Ali u mnogim slučajevima tržišta za podatke još nisu razvijena ili postoje tržišni
nedostaci za dijeljenje ili trgovanje podacima.

Vlade mogu igrati važnu ulogu u stvaranju uvjeta za funkcioniranje učinkovitih tržišta, uključujući
postavljanje pravila u vezi s intelektualnim vlasništvom, arbitražom sporova i tako dalje. Na primjer, zahtjev
za stvaranjem razmjene zdravstvenih informacija u sektoru zdravstvene skrbi u SAD-u osmišljen je kako bi
se osiguralo da se pročišćeni klinički podaci mogu dijeliti među pružateljima usluga kako bi sustav mogao
u potpunosti iskoristiti podatke o komparativnoj učinkovitosti liječenja.
Tamo gdje postoje tržišni neuspjesi, kao što je nedostatak poticaja iz osobnog interesa za određenu
skupinu dionika da svoje podatke učini dostupnima, kreatori politike možda će morati primijeniti
polugu regulacije kako bi osigurali dijeljenje podataka. Na primjer, postoji ogromna nevoljkost
objavljivanju podataka koji otkrivaju pogreške (npr. pogreške liječnika ili pilota) zbog reputacijskog
rizika koji to predstavlja za pružatelje usluga.95 Ali vlada ima jasan interes osigurati da se ti podaci dijele
jer to čini jedan od ključnih čimbenika za smanjenje rizika u cijelom sustavu od takvih grešaka.
Obavezno prikupljanje i objavljivanje takvih podataka moglo bi postati potrebno. Na primjer, vlade
mogu zahtijevati od javnih poduzeća da dostave financijske podatke u standardiziranom elektroničkom
obliku. Nakon nedavne globalne financijske krize, mnoge vlade već zauzimaju stajalište da je potrebno
značajno poboljšanje transparentnosti financijskog izvještavanja kako bi se ublažili sistemski rizici za
financijski sustav.
95 Na primjer, pilotima zrakoplova možda se nužno ne sviđa činjenica da glas i podaci u kokpitu
snimači mogu otkriti greške koje naprave tijekom leta, no objavljivanje podataka s tih uređaja
agencijama za sigurnost nakon nesreće je obavezno kako bi se poboljšala sigurnost cjelokupnog
sustava.
U javnom sektoru, gdje nedostatak konkurentskog pritiska ograničava

učinkovitost i produktivnost, transparentnost može biti moćan alat. Otvorenost i
dijeljenje velikih podataka mogu biti ključna poluga i pokretač poboljšane izvedbe.
Kreatori politika sve češće zahtijevaju od vladinih agencija da intenziviraju svoje
mjerenje aktivnosti i programa, a zatim te informacije prikažu na načine koji su lako
dostupni javnosti. Ovo agencijama ne daje samo alate za bolje upravljanje, već i javnosti
daje način da agencije pozove na odgovornost i ocijeni njihov učinak na mjerljiv način.
Taj pritisak javnosti može djelovati kao značajan poticaj agencijama da poboljšaju
učinak, smanje troškove i povećaju produktivnost.
3. RAZVIJETE POLITIKE KOJE UPRAVLJAJU INTERESE TVRTKI KOJE ŽELE STVARATI

VRIJEDNOST IZ PODATAKA I GRAĐANA KOJI ŽELE ZAŠTITITI SVOJU PRIVATNOST I
SIGURNOST
Iako se ogromna vrijednost, uključujući potrošački višak, može otključati

korištenjem velikih podataka, ostaje činjenica da su mnogi građani sumnjičavi prema
korištenju izrazito osobnih podataka. Građani će i dalje željeti da njihova prava na
privatnost budu jasno artikulirana, a tvrtke moraju znati — i moći predvidjeti bilo kakve
promjene — koje podatke smiju, a koje ne mogu koristiti. U nekim bi se slučajevima mogla
razviti tržišta osobnih podataka, ali u drugim slučajevima tradicionalni tržišni
mehanizmi možda neće biti dovoljni za razvoj praksi koje štite privatnost i sigurnost.
U budućnosti će učinkovit dizajn i provedba zakona o privatnosti biti ključni ne samo

za zaštitu korisnika, već i za osiguranje da će vrijednost njihovog pristanka na dijeljenje
podataka daleko nadmašiti potencijalne rizike. Jedan od izazova za kreatore politike bit
će držati korak s razvojem velikih podataka, poput onih koji uključuju podatke o osobnoj
lokaciji koji se brzo razvijaju. Naravno, vlade, neprofitne organizacije i privatni sektor
morat će razviti obrazovne programe kako bi javnost mogla u potpunosti razumjeti koliko
je osobnih podataka dostupno, gdje i kako se koriste te jesu li pojedinci voljni dopustiti
tu upotrebu.
Većina razvijenih zemalja već ima agencije koje su odgovorne za izradu i provedbu
smjernica i zakona koji se tiču komercijalne i privatnosti osobnih podataka općenito.
U Sjedinjenim Američkim Državama, Savezna komisija za trgovinu, na primjer, koristi
svoja načela poštene prakse informiranja kao smjernicu za rješavanje pitanja
sigurnosti i privatnosti. Na istom tragu, OECD je izdao smjernice o zaštiti privatnosti i
prekograničnom protoku osobnih podataka, dok Europska unija ima svoju Direktivu o
zaštiti podataka. Sve te smjernice i zakoni sadrže slične elemente prijave i zaštite.
Njemačka ima saveznog povjerenika koji aktivno nadzire industriju radi usklađenosti
sa zaštitom podataka. Južnokorejski Zakon o zaštiti podataka provode dvije zasebne
vladine agencije.
Usporedno s time, tvrtke i vlade će gotovo sigurno željeti snažne zakone koji
zabranjuju hakiranje i druge sigurnosne invazije kako bi zaštitili vlastite operacije
koliko god je to moguće, te će željeti učinkovitu provedbu tih zakona. Zaštita kritične
IT infrastrukture važna je i kako bi se osiguralo da organizacije mogu sigurno pristupiti
podacima i koristiti ih, te kako bi se zaštitila nacionalna sigurnost, jer kibernetički
napadi postaju sve sofisticiraniji i hrabriji. Na primjer, kibernetički napadi na dijelove
financijske infrastrukture zemlje (npr. postrojenja za obradu kreditnih kartica) mogu
rezultirati objavljivanjem osjetljivih osobnih podataka o milijunima pojedinaca i gubitkom
povjerenja u elektronička tržišta.
120
4. USPOSTAVITI UČINKOVITE OKVIRE ZA INTELEKTUALNO VLASNIŠTVO KAKO

BI SE OSIGURALI INOVACIJE
Nedvojbeno ćemo nastaviti vidjeti mnoge inovacije koje se pojavljuju duž lanca vrijednosti podataka u
doba velikih podataka. Pojavit će se inovativna tehnologija za bolje generiranje i bilježenje podataka.
Napredak u pohrani i analitici nastavit će se jer organizacije sve više trebaju pohranjivati sve veću
količinu podataka, pristupati im i analizirati ih, ponekad u gotovo stvarnom vremenu. Ove inovacije
zahtijevaju učinkovit sustav intelektualnog vlasništva, koji će osigurati poticaje za stvaranje vrijednih
podataka i omogućiti učinkovito dijeljenje i integraciju različitih skupova podataka. Postojat će sve veća
potražnja za djelotvornijim i učinkovitijim načinima utvrđivanja prava intelektualnog vlasništva (npr.
autorskih prava i patenata) i rješavanja sporova.
5. RIJEŠITE TEHNOLOŠKE BARIJERE I UBRZAJTE ISTRAŽIVANJE I RAZVOJ U CILJANIM

PODRUČJIMA
Kreatori politika mogu odigrati ulogu u pomaganju u prevladavanju tehnoloških problema

povezanih s korištenjem velikih podataka, od olakšavanja razvoja standarda i smjernica u vezi s IT
alatima ili skupovima podataka, do poticanja istraživanja i razvoja u kritičnim područjima gdje danas
postoje nedostaci.
Standardi koji pokrivaju IT alate ili određene vrste podataka ključni su kako bi se podaci mogli dijeliti
kako bi se stvorila potrebna ljestvica kako bi se omogućila vrsta analitike koja stvara vrijednost.
Ovi standardi mogu proizaći iz industrijskih tijela za postavljanje standarda, ali vlada može igrati ulogu
koja im omogućuje. Na primjer, u areni zdravstvene skrbi u SAD-u, Standardi i kriteriji certifikacije za
elektroničku zdravstvenu evidenciju (EHR) koje će izdati Ured nacionalnog koordinatora za informacijsku
tehnologiju u zdravstvu identificirat će standarde potrebne za certifikaciju tehnologija EHR-a tako da
medicinski stručnjaci a bolnice su uvjerene da sustav koji usvoje može raditi prema potrebi.
Kreatori politika također mogu ubrzati istraživanje velikih podataka. Vlada može izravno
sponzorirati osnovna istraživanja. Na primjer, američka Nacionalna zaklada za znanost financira
programe u računalnoj znanosti i matematici, dok je EU uspostavila Okvirni program za istraživanje,
osmišljen kao glavni instrument za koordinaciju i raspodjelu sredstava za istraživanje u područjima
znanosti i tehnologije u Europi.
Vlade također mogu razmotriti kako primijeniti poticaje, npr. porezne izdatke ili drugu financijsku
potporu, kako bi pomogle u prevladavanju tehnoloških prepreka za korištenje velikih podataka.
Ponekad postoji neusklađenost između toga tko mora uložiti u tehnologiju i tko će dobiti koristi
od tog ulaganja. Na primjer, u zdravstvenoj skrbi u SAD-u pružatelji su primarni ulagači u
tehnologiju elektroničkih medicinskih zapisa, ali koristi koje se osjećaju u obliku optimizirane
zdravstvene skrbi nesrazmjerno idu platiteljima i pacijentima. Američki Zakon o oporavku i
ponovnom ulaganju iz 2009. osigurao je oko 20 milijardi dolara pružateljima usluga zdravstvene zaštite
i njihovim sektorima podrške za ulaganje u sustave elektroničkih zapisa i razmjenu zdravstvenih
informacija kako bi se stvorio opseg kliničkih podataka potrebnih za rad mnogih poluga velikih podataka
u zdravstvu.
6. OSIGURATI ULAGANJA U TEMELJNU INFRASTRUKTURU INFORMACIJSKE I KOMUNIKACIJSKE

TEHNOLOGIJE
Da bi organizacije mogle iskoristiti velike skupove podataka, osnovna infrastruktura mora

postojati od električnih mreža koje pokreću informacijsku tehnologiju do komunikacijskih
mreža koje omogućuju prijenos podataka. Sudeći prema pristupima koje promatramo u
različitim zemljama, spektar mogućih političkih intervencija za poticanje izgradnje i
održavanja infrastrukture može značajno varirati.
Mnoge su zemlje stvorile posebne poticaje i inicijative usmjerene na širenje infrastrukture.

Na primjer, vlada SAD-a uvela je niz novčanih poticaja za poticanje izgradnje širokopojasne
infrastrukture (npr. ruralni širokopojasni projekt) i implementaciju elektroničkih
medicinskih zapisa. Američka vlada također je predložila dalekosežni nacionalni program
bežičnog razvoja koji uključuje dobrovoljnu dražbu poticaja za oslobađanje spektra kao
i preraspodjelu bežičnog spektra, s ciljem pokrivanja 98 posto zemlje 4G pristupom velike
brzine. Druge vlade također poduzimaju mjere za poticanje konkurencije na infrastrukturnim
tržištima kako bi smanjile troškove za krajnje korisnike i proširile pristup. Južna Koreja,
na primjer, daje subvencije za širokopojasnu pretplatu za određene skupine (npr. osobe
s niskim primanjima), ali, poput Japana i nekih europskih zemalja, izričito zahtijeva od
pružatelja usluga širokopojasnog pristupa koji posjeduju mrežu da dijele objekte uz
naknadu.
U godinama koje dolaze kreatori politike trebali bi infrastrukturu učiniti eksplicitnim dijelom svog
pristupa velikim podacima.
Kreatori politika mogu odigrati ključnu ulogu u omogućavanju kako bi osigurali da

organizacije maksimalno iskoriste potencijal velikih podataka u ključnim područjima
talenta, istraživanja i razvoja i infrastrukture, kao i za poticanje inovacija u ovoj dinamičnoj
areni. Neke od političkih radnji koje mogu i trebaju poduzeti uključivat će praktične poteze
koji zahtijevaju napor, ali nisu kontroverzni. Složeniji zadatak bit će osigurati da
zakonodavstvo postigne pravu ravnotežu između oslobađanja organizacija da koriste
podatke u značajnoj mjeri koja im je potrebna kako bi iskoristile njihov puni potencijal i
smirivanja strahova u javnosti o ugrožavanju privatnosti i osobne sigurnosti. To je
ravnoteža koja zahtijeva pažljivo razmatranje i koju kreatori politika ne bi trebali bježati
od rješavanja.
dodatak
Izrada indeksa na temelju potencijala

vrijednosti i lakoće hvatanja
Iz naše analize velikih podataka u pet domena došli smo do osjećaja koje karakteristike
ukazuju na veći ili niži potencijal vrijednosti od upotrebe velikih podataka za hvatanje vrijednosti
od njihove upotrebe, kao i veće ili niže prepreke u ostvarivanju te vrijednosti u različitim sektorima .
Koristeći te uvide, izradili smo dva indeksa: (1) indeks vrijednosnog potencijala i (2) indeks lakoće
hvatanja. Svaki od ovih indeksa sadrži više kriterija koji nam daju relativan osjećaj koji bi sektori
mogli biti spremni za veće dobitke i koji bi se sektori suočili s najtežim preprekama. Ne tvrdimo da
ovi indeksi daju potpunu sliku, ali vjerujemo da daju dobar uvid u potencijalnu dostupnu vrijednost i
lakoću ili nemogućnost njezina bilježenja u svim sektorima.
INDEKS VRIJEDNOSNOG POTENCIJALA
Pet kriterija koje koristimo u ovom indeksu služe kao zamjena za to koliko dobro sektor može
imati koristi od jedne od pet transformativnih prilika o kojima smo govorili u ovom izvješću
(Dokaz A1):
1. Količina podataka po tvrtki. Što je veća količina podataka po tvrtki, to je više

ukazuje da će tvrtka vjerojatno moći imati koristi od povećanja transparentnosti u pogledu
podataka. Koristili smo pohranu dostupnu po tvrtki kao zamjenu. Na temelju naše analize
mapiranja podataka procijenili smo raspoloživu pohranu podataka, u bajtovima, u 2009. u svakom
sektoru u Sjedinjenim Državama. Potom smo to podijelili s brojem tvrtki s više od 1000 zaposlenih
(kako bismo izbjegli iskrivljavanje brojki zbog velikog broja malih poduzeća i individualnih vlasnika).
2. Varijabilnost u izvedbi. Što je veća varijabilnost, to više ukazuje da poduzeće može imati koristi
od upotrebe podataka i eksperimentiranja za otkrivanje varijabilnosti i poboljšanje učinka.
Koristili smo varijabilnost EBITDA-e (dobit prije deprecijacije i amortizacije poreza na kamate) kao
proxy. Unutar svakog sektora, uzeli smo EBITDA velikih kompanija (s više od 500 milijuna dolara
prodaje) od 2002. do 2007. i identificirali 10. i 90. percentil EBITDA. Razlika između najboljih i
najlošijih izvođača postala je varijabilnost koju smo mjerili.
3. Intenzitet kupaca i dobavljača. Što više kupaca i dobavljača tvrtka ima, veći je njezin
potencijal za primjenu segmentacije za prilagođavanje smjerova djelovanja.
Koristili smo broj zaposlenih na prvoj liniji (definiranih kao onih koji komuniciraju s kupcima ili
dobavljačima) po tvrtki kao proxy. Koristili smo se podacima američkog Zavoda za statistiku rada
kako bismo identificirali broj zaposlenih na prvoj liniji (glavna zanimanja uključuju šifre
standardne klasifikacije zanimanja 41 kao što su prodajni službenici i agenti i 43 kao što su
administrativni radnici) u posljednjoj dostupnoj godini. Zatim smo podijelili s brojem tvrtki s više
od 1000 zaposlenih
4. Intenzitet transakcije. Što je veći intenzitet transakcija, veća je vjerojatnost da će sektor imati
koristi od upotrebe automatiziranih algoritama za povećanje ili zamjenu
124
ljudsko odlučivanje. Koristili smo količinu procesorske snage prosječne tvrtke u sektoru kao
proxy. Kako bismo došli do relativnog osjećaja procesorske snage, koristili smo podatke o
kapitalnom kapitalu za osobna računala i glavna računala prema sektoru iz Ureda za ekonomsku
analizu SAD-a i podijelili ih s brojem tvrtki s više od 1000 zaposlenika u svakom sektoru.
5. Turbulencija. Turbulencije, ili koliko često lideri i zaostali u sektoru mijenjaju mjesto, zamjena
je za količinu inovativnih poremećaja na koje je sektor osjetljiv. Pretpostavljamo da što je
turbulencija veća, to je veća vjerojatnost da će sektor imati koristi od upotrebe velikih podataka
za inovacije poslovnih modela, proizvoda i usluga. Unutar svakog sektora izračunali smo postotak
prometa—broj novih tvrtki koje su se smjestile među 20 najboljih u 2011. u usporedbi s 2006.,
podijeljen s 20.
Nakon što smo kvantificirali svaki kriterij (proxy), svakom smo sektoru dali ocjenu od jedan do pet
na temelju kvintila u koji spada za svaki kriterij. Ukupni indeks potencijalne vrijednosti prosjek je
rezultata po pet kriterija.
Dokaz A1
MGI je sastavio toplinsku kartu Gornji kvintil 4. kvintil
potencijala vrijednosti korištenja velikih (najveći potencijal) 2.

Donji kvintil
kvintil
podataka u različitim sektorima (najniži potencijal)
3. kvintil Nema dostupnih podataka
Indeks Intenzitet
ukupnog Količina Variabili kupaca i
Sektori potencijala podataka ty u izvedbi dobavljača Intenzitet
kategorija vrijednosti1 po poduzeću transakcije Turbulencija
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Trgovina na malo

otpadom i sanacije
Usluge
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije
INDEKS LAKOĆE SNIMANJA
Ovaj se indeks sastoji od četiri kriterija, od kojih je svaki usklađen s ključnom preprekom za korištenje
velikih podataka koju smo identificirali (Prilog A2):
1. Talent. Što tvrtka ima veći analitički talent, to je u boljoj poziciji da ostvari vrijednost velikih
podataka. Podijelili smo broj dubokih analitičkih talenata u 2008. s brojem tvrtki s više od 1000
zaposlenika u svakom sektoru.
2. IT intenzitet. Što sektor u prosjeku ima više IT imovine, manje su tehnološke prepreke koje treba
prevladati. Izračunali smo IT zalihe koristeći podatke iz američkog Ureda za ekonomsku analizu i
podijelili taj ukupan broj s brojem tvrtki s više od 1000 zaposlenika u svakom sektoru.
3. Način razmišljanja vođen podacima. To pokazuje koliko je organizacija spremna koristiti velike
podatke za stvaranje vrijednosti. Iskoristili smo rezultate najnovije ankete koju je o IT strategiji
proveo McKinseyjev Ured za poslovnu tehnologiju, koja je voditelje pitala u kojoj mjeri njihove
organizacije donose odluke na temelju iskustva i mišljenja ili na temelju podataka.
4. Dostupnost podataka. Koristimo relativni broj baza podataka povezanih sa svakim sektorom u
vlasničkom korpusu podataka kao proxy za to koliko su podaci dostupni u sektoru.
Opet, nakon što smo kvantificirali svaki kriterij (proxy), svakom smo sektoru dali ocjenu od jedan
do pet na temelju kvintila u koji spada za svaki kriterij. Ukupni indeks lakoće hvatanja prosjek je
rezultata po četiri kriterija.
Dokaz A2

(najlakši za snimanje)
Donji kvintil
2. kvintil 3.
kvintil
Ukupni
indeks
Sektori lakoće Način razmišljanja
kategorija snimanja1 Talenat IT intenzitet vođen podacima Dostupnost podataka
Proizvodnja
Izgradnja
Prirodni resursi
Roba
Trgovina na veliko
Informacija
Trgovina na malo

otpadom i sanacije

Usluge
Vlada
Obrazovne usluge
Uređeno
ijavno
Komunalije

126
Metodologija karte podataka
Nekoliko istraživačkih skupina proučavalo je količinu podataka koje poduzeća i pojedinci generiraju,
pohranjuju i koriste u studijama koje su koristile različite definicije i opsege (Prikaz A3). Međutim, do sada
nema dostupnih uvida o varijacijama među sektorima. Iz tog razloga poduzeli smo kratku vježbu
modeliranja kako bismo procijenili količinu podataka generiranih i pohranjenih u različitim sektorima, i na
agregiranoj osnovi i na osnovi po tvrtki.
Za procjenu količine generiranih i pohranjenih podataka u agregatu, naš se model oslanja na četiri ključna
ulaza i pretpostavke:
1. Otpremljeni godišnji skladišni kapaciteti po sektorima. Koristili smo industrijska izvješća IDC-a i
Gartnera koja daju ukupan broj bajtova otpremljenih svake godine na vanjskim diskovima, uključujući
mreže područja pohrane (SAN), mrežno pripojenu pohranu (NAS) i izravno pripojenu pohranu (DAS).
Ovi su podaci dostupni po sektorima i odabranim zemljopisnim područjima.
2. Prosječni zamjenski ciklus skladištenja. Koristili smo McKinsey procjenu za

prosječni ciklus zamjene skladištenja. To nam je omogućilo procjenu ukupne raspoložive
(kumulativne) pohrane u određenoj godini.
3. Stopa iskorištenja. Koristili smo McKinseyjevu procjenu prosječnog postotka

prostora za pohranu koji se koristi u određenoj točki. To nam je omogućilo procjenu količine
korištenog inkrementalnog podatkovnog kapaciteta (koji se u našem izvješću naziva i "novi
pohranjeni podaci") u danoj godini.
4. Stopa umnožavanja. Iz sigurnosnih i drugih razloga, svaki je podatak često
pohranjeni više puta (npr. za sigurnosnu kopiju, snimljeni u različitim sustavima za razne upotrebe).
Stručnjaci McKinseyja dali su nam prosječnu procjenu koja nam je omogućila da procijenimo količinu
"jedinstvenih" podataka generiranih i pohranjenih u određenoj godini.
Primijenili smo sličan pristup za procjenu količine podataka koje generiraju i pohranjuju potrošači. U ovom
smo slučaju uključili ključne uređaje koji pohranjuju sadržaj koji su izvorno generirali korisnici, naime solid-
state disk i pogone tvrdog diska u osobnim računalima, prijenosnim računalima i određenoj elektronici. Nismo
uključili potrošačke uređaje i komponente za pohranu kao što su DVD-ovi, CD-ovi i digitalni videorekorderi
koji uglavnom sadrže sadržaj koji korisnici nisu generirali (npr. generirale medijske tvrtke).
Naše su procjene u skladu s rezultatima prethodnih istraživanja. Naša procjena od 7,4 egzabajta
novih pohranjenih podataka najviše se može usporediti s 25 egzabajta kapaciteta pohrane podataka
koji su procijenili Hilbert i López za tvrde diskove poslužitelja i glavnog računala.
Proširili smo našu analizu na razinu po tvrtki u Sjedinjenim Državama, gdje su podaci o broju tvrtki
najlakše dostupni. Uzeli smo procijenjene raspoložive kapacitete za pohranu, kao i nove pohranjene
podatke, za različite sektore u Sjedinjenim Državama i podijelili s brojem tvrtki (s više od 1000 zaposlenih)
u odgovarajućim sektorima. Podaci o broju tvrtki došli su iz američkog Ureda za statistiku rada i
Dun & Bradstreet. Odlučili smo uključiti samo tvrtke barem srednje veličine—tj. one s više od 1000
zaposlenika.
Dokaz A3
Kako se MGI-jeva procjena veličine velikih podataka uspoređuje s prethodnim

vanjskim procjenama
Što je izmjereno Količina podataka Godina procjene
7,4 x 1018 bajtova Za 2010. godinu

Novi podaci pohranjeni u vanjskim poduzećima
MGI pristup temeljen na
pohranjivanje diska u godinu dana (uključuje replike)
pohrani
Novi podaci koje potrošači pohranjuju u godinu dana 6,8 x 1018 bajtova
Snimljeni godišnji digitalni podaci (uključuje sve ~800 x 1018 bajtova Za 2009. godinu
IDC/EMC1 digitalni
Svemir generirane, pohranjene ili ne) Uključuje više od
60 vrsta uređaja Nije uključena potrošnja informacija
od strane korisnika putem TV-a, videoigara1
Uključuje digitalne i analogne podatke za TV, radio, 3,6 x 1021 bajta (ukupna Za 2008. godinu
UCSD
telefon, ispis, računalo, komp. igre, filmovi, snimljena potrošnja samo u SAD-u)
glazba itd.
Izmjereni podaci iz perspektive potrošnje2
Kapaciteti za specifične tehnologije Za 2007. godinu

Hilbert, López
– Tvrdi diskovi poslužitelja i glavnog računala 24,5 x 1018 bajtova
– Ostali tvrdi diskovi 6,49 x 1018 bajtova
– Digitalna traka 32,5 x 1018 bajtova 123
– PC tvrdi disk x 1018 bajtova 276 x
Ukupni kapacitet digitalne pohrane 1018 bajtova
1 Uključuje kartice s čipom, diskete, fotoaparate, video igre, mobitele, memorijske kartice, media playere, CD-ove, DVD-ove, Blue Ray diskove,
Tvrdi diskovi računala i poslužitelja.
2 Potrošnja je definirana kao podatak svaki put kada ga korisnik koristi.

IZVOR: IDC bijele knjige o digitalnom svemiru, sponzoriran od strane EMC-a; Bohn i Short, koliko informacija? 2009: Izvješće o
American Consumers, siječanj 2010.; Hilbert i López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i izračunavanje informacija,” Science,
veljača 2011.; Analiza McKinsey Global Institute
Procjena potencijala vrijednosti u zdravstvu (Sjedinjene Američke Države)
U našoj analizi velikih podataka u američkom zdravstvu usredotočili smo se na poluge ili
inicijative u kojima su veliki skupovi podataka nužan preduvjet za stvaranje vrijednosti — ali
često sami po sebi nisu dovoljni za stvaranje bilo kakve vrijednosti. Priznajemo da, u većini
slučajeva, ostvarenje vrijednosti zahtijeva značajne strukturne promjene uključujući
zakonodavne prilagodbe, nove poticaje i sheme naknade, kao i prevladavanje prepreka kao
što je briga o privatnosti.
Dugoročni potencijal definiramo kao vrijednost koja se može uhvatiti u razdoblju od

deset godina u scenariju koji pretpostavlja da su napravljene dovoljne strukturne
promjene. Neke od poluga mogu se preklapati s drugim inicijativama zdravstvene
informacijske tehnologije i predloženim reformama zdravstvene skrbi iako smo izričito
isključili vrijednost koja proizlazi iz čiste implementacije IT-a. Na primjer, nismo uključili
vrijeme koje liječnici i medicinske sestre uštede korištenjem elektroničkih medicinskih
zapisa i time mogu izbjeći rukopisno pisanje dijagrama te pohranjivanje i dohvaćanje kartona
na papiru. U isto vrijeme, uključili smo uštede od smanjenja pretjeranog liječenja (i premalog
liječenja) u slučajevima kada je analiza kliničkih podataka sadržanih u elektroničkim medicinskim
zapisima mogla odrediti optimalnu medicinsku skrb.
Kako bismo procijenili potencijal vrijednosti svake od poluga s omogućenim velikim podacima
koje smo identificirali, upotrijebili smo prilagođeni pristup temeljen na ključnim pokretačima.
Ti pokretači obično uključuju (1) osnovne brojeve, kao što je broj bolnica, pacijenata, kliničkih
ispitivanja ili trošak po osnovnom broju za koje smo koristili podatke iz zadnje dostupne
godine; i (2) raščlamba utjecaja između, na primjer, smanjenja troškova i produljenja
vremena izlaska na tržište. U procjeni potencijalnog utjecaja velikih podataka koristili smo
američke i međunarodne studije slučaja s prijavljenim brojevima utjecaja gdje god je to bilo
moguće. U preostalih nekoliko slučajeva oslanjali smo se na razgovore stručnjaka. Znamo da
se nekoliko čimbenika treba spojiti kako bi se stvorila vrijednost; unatoč tome, dodijelili smo
punu vrijednost identificiranih poluga velikim podacima jer ih nije moguće raščlaniti
128
utjecaj među faktorima koji doprinose. Odabrali smo, međutim, studije slučaja ili stručne
procjene, na kojima temeljimo brojke utjecaja, na način koji minimizira svako dvostruko
računanje utjecaja na velikim podacima.
Odgovarajuće smo skalirali brojke utjecaja iz pojedinačnih studija slučaja kako bismo utvrdili
učinak na razini sektora ili cijelog sustava, a potom i na nacionalne izdatke za zdravstvenu
skrb. Pretpostavili smo neke temeljne komplementarne transformacije kao što su stope
usvajanja tehnologija koje omogućuju u cijeloj zemlji (npr. oko 90 posto usvajanja bolničkih
elektroničkih medicinskih zapisa) i strukturne promjene (npr. potencijalna konsolidacija
pružatelja usluga ili formiranje odgovornih organizacija za skrb).
Iako naše procjene potencijalne vrijednosti objavljene velikim podacima pretpostavljaju
neke temeljne komplementarne promjene, naše procjene ostaju unutar raspona procjena
koje su napravili istraživači u akademskoj zajednici, think tankovima i vladi (Prilog A4).
Kako bismo izračunali utjecaj poluga s omogućenim velikim podacima na produktivnost,

pretpostavili smo da će većina mjerljivog učinka biti na smanjenju inputa. Držali smo rezultate
konstantnima—tj. uz pretpostavku iste razine kvalitete zdravstvene skrbi. Znamo da će ova
pretpostavka podcijeniti utjecaj jer će mnoge naše poluge s omogućenim velikim podacima
vjerojatno poboljšati kvalitetu zdravlja tako što će, na primjer, osigurati da novi lijekovi brže
dođu na tržište i da pacijenti dobiju optimalno liječenje.
Usredotočujući se na kvantificiranje učinka ušteda učinkovitosti na produktivnost, zatim

smo dodali ukupni potencijal svih poluga, isključujući one u kojima uštede možda nemaju
nikakav utjecaj na ukupnu nacionalnu potrošnju za zdravstvo. Zatim smo projicirali te ukupne
uštede unaprijed i podijelili taj ukupni iznos s budućom projiciranom potrošnjom za
zdravstvenu skrb. Godišnja stopa je naša procjena učinka velikih podataka na produktivnost u zdravstvu.
Dokaz A4
CER i CDS identificirani su kao ključne poluge i mogu se vrednovati na temelju

različitih implementacija i vremenskih okvira
Procijenjeni godišnji učinak poluge, milijarde dolara
Komparativno istraživanje učinkovitosti (CER) za procjenu dobrobiti lijekova, definiranje optimalnog

puta liječenja i korištenje kao temelja za odluke o naknadi troškova/pokriću
CBO: Utjecaj povećanja financiranja za Commonwealth Fund, 2007.: AHIP/PwC, 2009: Walker et al., Health Affairs, 2005: Razina
CER u kratkom roku CER za dizajn naknade osiguranja dugoročno 4 implementacije HIEI
0 80
1 37 46 77
20 79
NICE smanjenje varijabilnosti primijenjeno na izdatke za izvanbolničke, bolničke i lijekove u SAD-u, srednje
4 13 do dugoročne
NICE smanjenje
varijabilnosti primijenjeno na
troškove lijekova, srednje do dugoročno
Sustav podrške kliničkom odlučivanju (CDS) koji se temelji na elektroničkim medicinskim zapisima uključujući
računalni unos naloga liječnika (CPOE) za poboljšanje učinkovitosti i kvalitete i smanjenje dupliciranja
Johnston et al., J. Healthcare Information
CBO: smanjenje administrativnih troškova i negativnih Management, 2004: Smanjenje ADE-a, bolja
događaja na savezni proračun, kratkoročno 0 usklađenost sa smjernicama 80
3.4 7.5 44
17 31
Referentne vrijednosti za smanjenje slučajeva nesavjesnog liječenja, ADE-
a, nikad događaja, smanjeno umnožavanje testova i postupaka
IZVOR: Kongresni ured za proračun; PwC Health Industries; Walker et al., “Vrijednost razmjene informacija o zdravstvenoj skrbi i interoperabilnosti”, Health
Affairs, 2005.; Johnston, Pan i Walker, “Vrijednost CPOE u ambulantnim uvjetima,”
Journal of Healthcare Information Management, 2004
Procjena vrijednosnog potencijala u javnoj upravi

(Europska unija)
Kako bismo procijenili vrijednosni potencijal poluga velikih podataka u europskoj upravi javnog
sektora, oslonili smo se na državne operativne i proračunske podatke (na agregatnoj razini i
na razini odjela) i McKinseyjevu internu stručnost u javnom sektoru te smo u našoj analizi
primijenili mikro-makro pristup.
Prvo smo identificirali poluge velikih podataka i kvantificirali njihov potencijal za stvaranje
vrijednosti fokusirajući se na dvije specifične agencije – poreznu i radnu – koje su prototipski
primjeri administrativnih funkcija. Procijenili smo potencijalni učinak oslanjajući se na
najbolju praksu iz cijelog svijeta. Zatim smo ekstrapolirali utjecaj identificiranih poluga na
cijelu vladu zemlje identificirajući druge adresabilne pododjele i primjenom potencijalnog
poboljšanja pronađenog u našoj analizi na razini agencije na adresabilni dio, prilagođen
prema relevantnosti. Konačno, povećali smo naše procjene na razini zemlje na sva
gospodarstva OECD-a u Europi.
Pronašli smo tri kategorije koristi od korištenja velikih podataka u upravi javnog
sektora:
1. Uštede operativne učinkovitosti. Primijenili smo postotak potencijala

uštede operativnih troškova prema procijenjenim adresabilnim rashodima europske
vlade OECD-a (bez transfera).
2. Smanjenje troškova prijevara i pogrešaka. Primijenili smo postotak potencijalnog

smanjenja prijevare na procijenjena adresabilna plaćanja transfera vlade europskog OECD-
a množenjem postotka transfernih plaćanja. Procijenjeno adresno prijenosno plaćanje
uzelo je u obzir postotak prijenosnog plaćanja koje ima nezanemarljiv iznos prijevare i
pogreške te procijenjeni postotak troška prijevare i pogrešaka.
3. Povećanje ubiranja poreznih prihoda. Primijenili smo postotak mogućeg smanjenja poreznog
jaza na procijenjeni porezni jaz europske države OECD-a.
Za potrebe naše analize upotrijebili smo posljednju godinu dosljednih podataka o državnoj
potrošnji i prihodima od poreza iz OECD-a.
Zatim smo preveli monetarni potencijal u procjene produktivnosti. Produktivnost

definiramo kao količinu proizvedenog outputa u odnosu na razinu inputa potrebnih za
proizvodnju tog outputa. Poboljšana produktivnost dolazi i od smanjenja inputa (s obzirom
na fiksnu razinu outputa) i povećanja kvalitete ili kvantitete outputa (s obzirom na fiksnu
razinu inputa).
Produktivnost javnog sektora teško je mjeriti iz dva glavna razloga. Prvo, mnogi sektori nemaju
mjerljive rezultate (npr. nacionalna sigurnost). Drugo, čak i u sektorima u kojima su učinci očiti,
mjerenje je od ograničene korisnosti bez procjene dodaju li ti učinci vrijednost građanima i
kako se ta vrijednost mijenja tijekom vremena.
Od 1969. do 1994. američki Zavod za radnu statistiku eksperimentirao je s mjerama

produktivnosti za ključne vladine funkcije, ali je prekinuo taj pokušaj zbog smanjenja proračuna.
U Ujedinjenom Kraljevstvu, Ured za nacionalnu statistiku odgovorio je na Atkinsonov pregled
2003. godine osnivanjem Centra za mjerenje
130
Državna aktivnost koja je počela proizvoditi indeks produktivnosti za neke dijelove vlade.
U nedostatku utvrđenih metodologija za mjerenje produktivnosti javnog sektora,

aproksimirali smo rezultate prilagođene kvaliteti korištenjem poreznih prihoda i ukupnih
inputa korištenjem ukupnog proračuna/potrošnje. U našem modelu porezni prihod bio je
jedini poboljšani ishod, a pretpostavili smo da ostali ishodi kao što je broj ljudi vraćenih na
posao nisu pogođeni.
U našoj metodologiji, godišnji rast produktivnosti zbroj je godišnjeg postotka povećanja

poreznih prihoda i godišnjeg postotka smanjenja ukupnog državnog proračuna. Iako je ovo
gruba metodologija, vjerujemo da su naše procjene razumne budući da su unutar istog raspona
drugih usporedivih procjena (Prilog A5).
Dokaz A5
Procjene produktivnosti: Uprava javnog sektora
Godišnji rast produktivnosti %
Analize
Porezna agencija 0.7
"mikro u
makro" iz dubokog
ronjenja
Agencija za rad 0.3
Uprava javnog sektora 0,5
Usporedbe s Potencijal učinkovitosti javnog

0,5 0.9 1.4
drugim podatkovnim sektora SAD-a1
točkama
Usvajanje IT/mrežnih usluga u centru
1.2
za zapošljavanje Plus2
IT doprinos privatnom sektoru3

1.7
1 Dohrmann i Mendoca, “Poticanje državne produktivnosti,” McKinsey Quarterly.

2 P. Dunleavy, Innovating Out of a Recession, seminar, London School of Economics, London, lipanj 2009.
3 Oliner i Sichel “Informacijska tehnologija i produktivnost: gdje smo sada i kamo idemo,” Federal Reserve Bank of Atlanta Economic
Review, 2002. IZVOR: Analiza McKinsey Global Institutea
Procjena potencijalne vrijednosti u maloprodaji (Sjedinjene Američke Države)
Kako bismo došli do procjena vrijednosti koju stvaraju veliki podaci za maloprodajne
tvrtke, koju smo zatim proširili na procjenu ukupne vrijednosti za cijeli sektor, koristili smo
se kombinacijom studija slučaja klijenata, akademskog i industrijskog istraživanja te intervjua
sa stručnjacima.
Počevši od naše procjene potencijalne vrijednosti stvorene na razini pojedinačnih tvrtki, koristili
smo model koji ovisi o četiri ključna pokretača (Prilog A6).
1. Arhetipovi strukture troškova podsektora, koji nam daju različite skupove troškova kao
postotak prodaje. Koristili smo podatke Ureda za popis stanovništva SAD-a i analizu McKinseyja.
2. Procjene utjecaja po pojedinim polugama, izražene kao postotak smanjenja

na skupu troškova ili postotku povećanja količine ili cijene (Prilog A7). Koristili smo opsežne
intervjue sa stručnjacima McKinseyja na temelju njihovih iskustava klijenata, kao i objavljene
studije slučaja.
Dokaz A6
Maloprodaja: dijagram modela koji prikazuje utjecaj poluga
Unosi Međuizračuni Izlazi
Arhetipovi Promjenjive osjetljivosti % prihoda

strukture troškova podsektora Podsektor
Poluga
Pretpostavke o Maksimalni utjecaj poluge

% op. margina
udaru maks. % okretaja poluge na izlazne varijable Podsektor
x Poluga
x % uštede troškova
Rezultati relevantnosti
Podsektor
poluge podsektora
Podsektor Poluga
Poluga
Podaci o prodaji podsektora

$ Ušteda troškova
Podsektor
x Poluga
Dokaz A7
Utjecaj poluga na produktivnost rada
Kategorija Poluga za velike podatke Utjecaj na produktivnost
Poboljšana unakrsna prodaja ~100% otkazivanje prve narudžbe
Marketing temeljen na lokaciji ~100% otkazivanje prve narudžbe
Analiza ponašanja u trgovini ~100% otkazivanje prve narudžbe

Marketing Prodaja: Pretpostavimo da se sve glavne
Mikrosegmentacija kupaca ~100% otkazivanje prve narudžbe poluge dugoročno ponište (npr. poboljšani
~100% otkazivanje prve narudžbe marketing neće stvoriti značajnu neto

Analiza sentimenta
prodaju na razini industrije)
Poboljšano višekanalno iskustvo ~100% otkazivanje prve narudžbe
Optimizacija asortimana ~100% otkazivanje prve narudžbe

Trgovački
Optimizacija cijena ~100% otkazivanje prve narudžbe
dising
Optimizacija plasmana ~100% otkazivanje prve narudžbe
Transparentnost izvedbe Uzmite smanjenje radnog vremena zaposlenika Sati zaposlenika: Neke će poluge smanjiti
Operacije
sate zaposlenja
Optimizacija radnih resursa Uzmite smanjenje radnog vremena zaposlenika
Poboljšano upravljanje zalihama Uzmite kao uštedu troškova

Lanac Operativna marža: Poluge će poboljšati
opskrbe Optimizacija distribucije Uzmite kao uštedu troškova marže kroz niže troškove
Informiranje u pregovorima s dobavljačima Uzmite u obzir uštedu troškova
Novi autobus.1 Usluge usporedbe cijena Smanjenje cijene ne dovodi do učinka
Potrošači mogu koristiti svoju ušteđevinu za kupnju dodatnih

maloprodajnih dobara/usluga ili je mogu potrošiti u drugim industrijama
1 Utjecaj tržišta temeljenih na webu teško je kvantificirati i mi smo to isključili iz naših izračuna.
3. Toplinska mapa relevantnosti poluge na razini podsektora koja nam govori o relativnoj relevantnosti
poluge u određenom podsektoru. Poluge imaju različit potencijal za različite

podsektore bilo zato što imaju različite stupnjeve relevantnosti ili zato što će
podsektori već raditi s različitim stupnjevima zrelosti velikih podataka.
132
4. Prodaja podsektora koja nam omogućuje da izračunamo ne samo postotak utjecaja na

marže, ali u apsolutnim dolarima. Koristili smo kombinaciju procjena američkog Ureda za
ekonomsku analizu, američkog Ureda za popis stanovništva i Moody'sa.
Naša analiza na razini tvrtke govori nam o potencijalnom utjecaju pojedinog trgovca na malo koji
prihvaća poluge velikih podataka, u odnosu na konkurente koji to ne čine.
Kako bismo proširili našu analizu na razini poduzeća na razinu cijelog sektora, konzervativno smo
izračunali potencijalne dobitke produktivnosti koristeći one poluge specifične za operacije i
opskrbne lance, na primjer, koje smanjuju troškove. To je zato što vjerujemo da bilo kakvo povećanje
nominalne prodaje koje ostvare pojedinačna poduzeća vjerojatno neće pribrojiti dobitku ukupne
nominalne prodaje u cijelom maloprodajnom sektoru, s obzirom na to da je ukupna maloprodajna
potrošnja potrošača prvenstveno pod utjecajem ukupnog gospodarskog rasta. Slažemo se da to znači
da će naša procjena vjerojatno biti konzervativna. Unatoč tome, naše procjene povećanja produktivnosti
od 1 do 2 posto pod pretpostavkom da su povučene sve poluge učinkovitosti i 0,5 do 1 posto isključujući
utjecaj poluge izvora (što pretpostavlja da nema neto učinka kada dobavljači također povlače istu
polugu) usporedive su s niz utjecaja IT-a na produktivnost nepoljoprivrednih sektora općenito (Prikaz A8).
Dokaz A8
Slijeđenje ovog pristupa dovodi do značajnih godišnjih stopa rasta

produktivnosti rada zbog implementacije poluga velikih podataka
Poboljšanja produktivnosti rada s velikim podacima u američkoj maloprodajnoj industriji tijekom sljedećih 10 godina
Složena godišnja stopa rasta, %
Sve smanjenje troškova Pretpostavlja da sve poluge za smanjenje troškova

1,0–2,0
poluge velikih podataka postanu industrijski standard
Pretpostavlja da druge industrije

Sve poluge također usvajaju poluge "velikih
0,5–1,0
troškova osim nabave podataka" (tj. poluga "izvora" za maloprodaju
kompenzira se polugom "cijena" za dobavljače)
Sveukupno poboljšanje produktivnosti

IT poboljšanje iz
1,0–2,0 jer od IT-a u 90-ima za cijelo gospodarstvo
1990-ih
iznosio je ~1–2 posto
IZVOR: Jorgensen, Dale, Ho i Stiroh, “Retrospektivni pogled na ponovno oživljavanje rasta produktivnosti u SAD-u,” Journal of
Gospodarske perspektive, 2008.; Analiza McKinsey Global Institute
Procjena potencijalne vrijednosti u podacima o osobnoj lokaciji

(globalno)
Za ovu smo se studiju slučaja oslonili na McKinseyevo makroekonomsko i industrijsko iskustvo,

vanjska akademska istraživanja i tržišne prognoze, kao i opsežna otkrića u dostupnoj
literaturi. Promatrajući lanac vrijednosti aplikacija koje se temelje na lokaciji, ispitali smo i
količinu generiranih podataka i potencijal za stvaranje vrijednosti.
Procijenili smo količinu osobnih podataka o lokaciji generiranih u svakoj kategoriji aplikacije
ili izvornog uređaja iu različitim geografskim regijama koristeći instaliranu bazu uređaja,
ponašanje pri korištenju i učestalost generiranja podataka.
Kako bismo procijenili potencijalnu vrijednost koju podaci mogu generirati, pomno
smo ispitali glavne primjene osobnih podataka o lokaciji i procijenili ekonomsku vrijednost
svake aplikacije za krajnje korisnike - pojedinačne potrošače, poduzeća i vladine
organizacije. Iako smo odredili veličinu svake identificirane primjene ili poluge, znamo da
će naša ukupna potencijalna procjena vrijednosti biti konzervativna, s obzirom na to da
će se u budućnosti pojaviti nove primjene ili poluge koje danas ne možemo predvidjeti.
Temeljni model i inputi korišteni za mjerenje ekonomske vrijednosti razlikovali su se

za svaku aplikaciju. Uzmite osobne navigacijske aplikacije kao ilustraciju našeg pristupa.
Mjerili smo potencijalnu ekonomsku vrijednost kroz metriku ušteđenog vremena i smanjene
potrošnje goriva zbog korištenja klasične navigacije i “pametne” navigacije s omogućenim
prometom. Unosi su uključivali rezultate eksperimenata u zapadnoeuropskim gradovima,
ekstrapolirane globalno na temelju stopa usvajanja GPS-a, ponašanja u vožnji i indeksa
zagušenja izračunatog pomoću gustoće naseljenosti i vozila na dostupnoj cestovnoj
infrastrukturi u svim regijama (Prilog A9).
Dokaz A9
Uveli smo regionalni indeks zagušenja koji se temelji na gustoći

naseljenosti grada/područja i gustoći vozila
Ulazni parametri Pokazatelj izlaza
Gustoća naseljenosti grada/ Indeks regionalne zagušenosti

područja
Afrika
Oceanija
Kanada
Regionalna gustoća vozila (km vozila/autoceste)

Kina
64
48
31 Zapadna Europa
25 21
12 14 13
Istočna Europa
NAS Zapadni istočni Japan Kina Indija latinski Ostali
Europa Europa Amerika Azija
Indija
45
San Francisco
Razina zagušenja u odnosu 40 Los Angeles Japan
na gustoću naseljenosti 35
Chicago
New York
30
Latinska Amerika
25 Cincinnati
20 Milwaukee
15 Ostatak Azije
10
5 Wichita
Ujedinjene države
0
0 100 200 300 400 500 600 700 800 900 1000
IZVOR: Eurostat; Popis stanovništva SAD-a; www.world-gazetteer.com; Svjetska banka; Analiza McKinsey Global Institute
134
Metodologija analize ponude i potražnje analitičkog

talenta
Prvenstveno smo se usredotočili na analizu projekcija ponude i potražnje analitičkih talenata
u Sjedinjenim Državama zbog dostupnosti podataka o radu i obrazovanju na preciznoj razini.
Analizirali smo situaciju s opskrbom na globalnoj razini u odabranim područjima gdje su podaci
o obrazovanju lako dostupni. U ovom dodatku prvo ćemo objasniti analizu SAD-a, a zatim
globalnu analizu.
analiza SAD-a
Prvo smo analizirali jaz u ponudi i potražnji za tri vrste talenata za velike podatke u 2018.:
1. Duboki analitički talent—ljudi s naprednim obrazovanjem iz statistike i

strojno učenje koje može analizirati velike količine podataka kako bi došlo do
poslovnih uvida.
2. Menadžeri koji razumiju podatke i analitičari koji imaju vještine da budu učinkoviti potrošači
uvida u velike podatke—tj. da postave prava pitanja za analizu, tumače i izazovu rezultate i
donesu odgovarajuće odluke.
3. Podrška tehnološkom osoblju koje razvija, implementira i održava

hardverski i softverski alati potrebni za korištenje velikih podataka uključujući baze podataka
i analitičke programe (Prilog A10).
Dokaz A10
Talent za velike podatke grupiran je u duboku analitiku, znanje o velikim

podacima i prateću tehnologiju
Duboka analitičnost Poznavanje velikih podataka Tehnologija podrške
Definicije Osobe koje su napredno Ljudi koji imaju osnovno Ljudi koji rade kao
trenirale statistiku i/ili strojno znanje o statistici i/ili administratori baza podataka i
učenje i provode analizu strojnom učenju i definiraju programeri
podataka ključna pitanja na koja
podaci mogu odgovoriti
Aktuari Poslovno i funkcionalno Računalni i informatički
Zanimanja1
Matematičari menadžeri znanstvenici Računalni
Analitičari operacijskih Proračunski, kreditni programeri Inženjeri
istraživanja i financijski analitičari računalnog softvera za aplikacije
Statističari Matematički Inženjeri Biološki Računalni softver
tehničari Matematički znanstvenici
znanstvenici Industrijski Analitičari istraživanja tržišta inženjeri za sistemski
inženjeri Epidemiolozi Istraživači anketa softver Analitičari
Ekonomisti Industrijsko-organizacijski računalnih sustava
psiholozi Sociolozi Administratori baza
podataka
Ova zanimanja obuhvaćaju 61 zanimanje u

SOC u 170 industrija prema definiciji Sjevera
Američki sustav klasifikacije industrije (NAICS)
1 Zanimanja su definirana Standardnim kodeksom zanimanja (SOC) Ureda za statistiku rada SAD-a i koriste se kao zamjena za
vrste talenata u radnoj snazi.
U nastavku ćemo opisati našu metodologiju za projiciranje ponude i potražnje za dubokim

analitičkim talentom, iako smo također primijenili sličnu metodologiju na druge dvije kategorije.
Zasebno smo procijenili ponudu i potražnju za dubokim analitičkim talentom. U objema
procjenama, međutim, kao baza služe podaci o zaposlenosti iz 2008., posljednje godine za koju
su bili dostupni cjeloviti podaci za analizu. Pretpostavljamo da se tržište rada raščistilo 2008.
(tj. podaci o zaposlenosti za 2008. predstavljaju i ponudu i potražnju rada).
Osobe s dubokim analitičkim talentom definiramo kao one s naprednom obukom u statistici
i/ili strojnom učenju. Kako bismo procijenili bazu ove kategorije nadarenosti za 2008.,
upotrijebili smo podatke Zavoda za statistiku rada SAD-a o radnom zapošljavanju za 2008.,
uz pretpostavku da je zanimanje odgovarajući prikaz nadarenosti. Koristeći sustav standardne
klasifikacije zanimanja (SOC kod) (SOC kod je u zagradama), zanimanja koja smo odabrali za
predstavljanje dubokog analitičkog talenta su aktuari (15-2011), matematičari (15-2021),
analitičari operativnih istraživanja (15-2031) , statističari (15-2041), matematički tehničari
(15-2091), matematičari svi ostali (15-2099), industrijski inženjeri (17-2112), epidemiolozi
(19-1041) i ekonomisti (19-3011). Za svaku od ovih kategorija zanimanja procijenili smo
postotak ljudi koji bi imali potrebne duboke analitičke vještine.
Procijenili smo ponudu dubokog analitičkog talenta u 2018. koristeći bazu iz 2008. plus
sveučilišne diplomante s relevantnim vještinama, plus imigracija, minus odljev. Vještine
koje su relevantne za duboki analitički talent među diplomantima definiramo kao smjerove i
stupnjeve koji su u skladu sa SOC zanimanjima. Koristeći detaljnu statistiku o diplomantima
sveučilišta u SAD-u, odabrali smo procijenjene omjere diplomanata s diplomama prvostupnika
i magisterija te doktorata u sljedećim smjerovima koji imaju relevantne duboke analitičke
vještine: računalne i informacijske znanosti, matematika i statistika, inženjerstvo, fizičke
znanosti i znanstvena tehnologija, biološke i biomedicinske znanosti, društvene znanosti i
poslovanje.
Koristili smo dva odvojena pristupa za procjenu potražnje za dubokim analitičkim

talentom u 2018. Rezultati ova dva pristupa su dosljedni. Naš prvi i detaljniji pristup
temeljili smo na trenutnom modelu koji koristi BLS. Potražnja za dubokim analitičkim
talentom u 2018. potaknuta je rastom industrija koje zapošljavaju te ljude i udjelom ovog
talenta zaposlenog u tim industrijama, procijenjenim postotkom svakog zanimanja unutar
sektora koji služe u dubokim analitičkim kapacitetima.
Kako bismo pojednostavili naš model, definiramo industrije pomoću

Sjevernoameričkog sustava klasifikacije industrija i grupiramo ih u niske, srednje i visoke
intenzitete podataka prema njihovom kapitalu za pohranu podataka po tvrtki s 1000 ili više zaposlenika.
Koristimo ovaj pristup jer pretpostavljamo da će se potražnja industrije za dubokim
analitičkim talentom značajno razlikovati ovisno o tome koliko podataka industrija stvara i
pohranjuje. Na primjer, financije, sektor s velikim intenzitetom podataka, vjerojatno će imati
veći rast potražnje za dubokim analitičkim talentom.
U svijetu u kojem organizacije diljem gospodarstva aktivno koriste sve poluge velikih
podataka, naš prvi model pretpostavlja da će svi sektori povećati svoju potražnju za
dubokim analitičkim talentom najbržom stopom koju projicira BLS do 2018. u svojoj grupi
industrija prema intenzitet podataka. Na primjer, u skupini s visokim intenzitetom podataka,
predviđa se da će internetske usluge imati najveći rast dubokog analitičkog talenta do
2018.; stoga modeliramo druge sektore u skupini s velikim podatkovnim intenzitetom da
dožive istu stopu rasta kao i internetske usluge.
Drugi model koji smo upotrijebili je model potražnje temeljen na poduzećima, koji
pretpostavlja da se potražnja za dubokim analitičkim talentom razlikuje prema trima
glavnim industrijskim skupinama: financijskim i osiguravateljskim industrijama (FIG);
online (pružatelji internetskih usluga, portali za web pretraživanje, obrada podataka i
usluge stanovanja); i sve ostale industrije. Ova pretpostavka odražava naše intervjue s
vodećima u industriji koji su sugerirali da će FIG i online industrije zahtijevati znatno
više dubokog analitičkog talenta po tvrtki od onih u drugim industrijama. Procjenjujemo
broj ljudi s ovim vještinama potrebnim u svakoj industrijskoj grupi na temelju broja tvrtki
136
u svakoj klasi veličine zaposlenja i očekivani broj dubokih analitičkih talenata potrebnih po tvrtki (razlikuje
se prema klasi veličine zaposlenja). Brojevi tvrtki po djelatnostima procjenjuju se pomoću Statistike poslovanja
SAD-a (SUSB), popisa stanovništva SAD-a i Dun & Bradstreeta.
Globalna analiza
Procijenili smo broj diplomanata s dubokim analitičkim talentom u Sjedinjenim Državama na
međunarodnoj obuci u drugim zemljama koristeći podatke Euromonitora o diplomantima po smjeru po stupnju,
kao i podatke iz lokalnih statističkih ureda gdje podaci Euromonitora nisu dostupni. Primjenjujemo omjere
diplomiranih studenata u SAD-u kako bismo održali dosljednost s procjenom u SAD-u.
Ključni izvori podataka
Opis podataka Izvori podataka
Zapošljavanje po zanimanju Američki ured za statistiku rada (BLS)
Projekcija zapošljavanja po zanimanju Američki ured za statistiku rada (BLS)
Broj javnih i privatnih poduzeća prema veličini Statistika američkih poduzeća (SUSB)
zaposlenosti
Brojevi javnih poduzeća s 1000+ zaposlenika Dun & Bradstreet (D&B)
po djelatnostima
Neto temeljni kapital prema vrsti Američki ured za ekonomsku analizu (BEA)
Broj diplomiranih studenata u Nacionalni centar za statistiku obrazovanja,

Ujedinjene države Podatkovni centar IPEDS
Broj diplomiranih studenata na globalnoj razini Euromonitor

Bibliografija
Abele, Eberhard, Tobias Meyer, Ulrich Näher, Gernot Strube i Richard Sykes, ur., Globalna
proizvodnja: priručnik za strategiju i provedbu (Berlin: Springer, 2008.).
ABI istraživanje, Barometar potrošačke tehnologije: Mobile, 2010.
Agrawal, R., T. Imielinski i A. Swami, “Rudarska pravila povezivanja između skupova stavki
u velikim bazama podataka,” SIGMOD konferencija 1993: 207–216.
Akella, Janaki, Timo Kubach, Markus Löffler i Uwe Schmid, Data-driven management:
Bringing more science into management, McKinsey Technology Initiative Perspective,
2008.
Američki planovi zdravstvenog osiguranja, Tehnički dopis: Procjene potencijalnog

smanjenja troškova zdravstvene skrbi iz AHIP-ovih prijedloga pristupačnosti, lipanj 2008.
Ayes, Ian, Super crunchers: Zašto je razmišljanje brojevima novi način da budete
pametni (New York: Bantam Books, 2007.).
Baily, Martin N., Karen Croxson, Thomas Dohrmann i Lenny Mendonca, Imperativ
produktivnosti javnog sektora, McKinsey & Company, ožujak 2011.
Baker, Stephen, The numerati (New York: Houghton Mifflin, 2008.).
Barber, Michael, Alastair Levy i Lenny Mendoca, Globalni trendovi koji utječu na javni
sektor, McKinsey white paper, veljača 2008.
Baumgarten, Jason i Michael Chui, "E-uprava 2.0", McKinsey Quarterly, srpanj 2009.
Benham, Lee, "Učinak oglašavanja na cijenu naočala", Journal of Law and Economics 15(2),
listopad 1972.: 337–352.
Besley, Timothy i Maitreesh Ghatak, “Statusni poticaji,” American Economic Review 98(2),
2008: 206–211.
Bohn, Roger i James Short, Koliko informacija? 2009: Izvješće o američkim potrošačima,
Sveučilište Kalifornije, San Diego, Globalni informacijski industrijski centar, siječanj 2010.
Bohn, Roger, James Short i Chaitanya Baru, Koliko informacija? 2010.: Izvješće o
informacijama poslužitelja poduzeća, Sveučilište Kalifornije, San Diego, Globalni
informacijski industrijski centar, siječanj 2011.
Bollier, David, Obećanje i opasnost velikih podataka, Institut Aspen, 2010.
Bracht, U. i T. Masurat, “Digitalna tvornica između vizije i stvarnosti”,

Računala u industriji 56(4), svibanj 2005.
138
Briscoe, Bob, Andrew Odlyzko i Benjamin Tilly, Metcalfeov zakon je pogrešan, IEEE Spectrum,
srpanj 2006.
Brown, Robert G. i John M. Caddick, Tvornica je virtualna... ušteda je stvarna, rad predstavljen na
simpoziju RTO AVT, 2003.
Brynjolfsson, Erik i Adam Saunders, Ožičeni za inovacije: Kako informacijska tehnologija

preoblikuje gospodarstvo (Cambridge, MA: MIT Press, 2009.).
Brynjolfsson, Erik, Lorin M. Hitt i Heekyung Hellen Kim, Snaga u brojevima: Kako odlučivanje
temeljeno na podacima utječe na izvedbu poduzeća?, 22. travnja 2011., dostupno na SSRN
(ssrn.com/abstract=1819486).
Bughin, Jacques i Michael Chui. "Uspon umreženog poduzeća: Web 2.0 nalazi svoj dan isplate",
Bughin, Jacques, Michael Chui i James Manyika. “Oblaci, veliki podaci i pametna imovina: Deset
trendova omogućenih tehnologijom koje treba promatrati,” McKinsey Quarterly, kolovoz 2010.
Centri za Medicare i Medicaid usluge, Nacionalne projekcije izdataka za zdravstvo 2009.

– 2019., rujan 2010.
Chui, Michael, Markus Löffler i Roger Roberts, "Internet stvari", McKinsey Quarterly, ožujak 2010.
Chui, Michael, Andy Miller i Roger Roberts, “Šest načina da Web 2.0 funkcionira”,
McKinsey Quarterly, veljača 2009.
Kongresni ured za proračun, proračunske opcije, svezak I: Zdravstvena skrb, prosinac 2008.
Cortes, Corinna i Vladimir Vapnik, “Support-vector networks,” Machine Learning 20(3), rujan 1995.
Danker, Tony, Thomas Dohrmann, Nancy Killefer i Lenny Mendonca, "Kako američka vlada može
odgovoriti na svoj izazov produktivnosti?" McKinsey Quarterly, srpanj 2006.
Davenport, Thomas H. i Jeanne G. Harris, Analitika na djelu: pametnije odluke, bolji rezultati
(Cambridge, MA: Harvard Business Press, 2010.).
Davenport, Thomas H. i Jeanne G. Harris, Natjecanje u analitici: Nova znanost o pobjeđivanju

(Cambridge, MA: Harvard Business Press, 2007.).
Davis, Jerel C., Laura Furstenthal, Amar A. Desai, Troy Norris, Saumya Sutaria, Edd Fleming i Philip
Ma, “Mikroekonomija personalizirane medicine: Današnji izazov i sutrašnje obećanje”, Nature
Reviews Drug Discovery 8, 279–286 , travanj 2009.
Dean, Jeffrey i Sanjay Ghemawat, MapReduce: Pojednostavljena obrada podataka na velikim

klasterima, Šesti simpozij o dizajnu i implementaciji operacijskog sustava, San Francisco, CA,
prosinac 2004.
“Razbijanje tri vodeće pogrešne percepcije o IT-u u zdravstvu,” Health International

2010., broj 10.
(UK) Department of Health, Upotreba lijekova protiv raka odobrena od strane NICE-revizija
Nacionalnog direktora za rak, rujan 2006.
(SAD) Ministarstvo zdravstva i socijalnih usluga, Zdravstvo, Sjedinjene Američke Države,

2009.: Poseban prilog o medicinskoj tehnologiji, 2009.
(SAD) Ministarstvo zdravstva i socijalnih usluga, Zdravstvo, Sjedinjene Američke Države, 2010.:
Poseban prilog o smrti i umiranju, 2010.
Digital Forensics Association, The leaking vault: Five years of data breaches, srpanj 2010.
Dohrmann, Thomas i Lenny Mendonca, “Poticanje državne produktivnosti,”

McKinsey Quarterly, studeni 2004.
Dohrmann, Thomas i Gary Pinshaw, Put do poboljšane usklađenosti, McKinsey bijela knjiga, rujan
2009.
Drucker, Peter F., Izazovi menadžmenta 21. stoljeća (New York: Harper Business, 1999.).
Dunleavy, P., Innovating out of a recession, seminar, London School of Economics, London, 22.
lipnja 2009.
Željne oči (eagereyes.org/).
Eslami, Saied, Nicollette F. De Keizer i Ameen Abu-Hanna, "Utjecaj kompjuteriziranog unosa

narudžbi liječnika za lijekove kod hospitaliziranih pacijenata: sustavni pregled", International Journal
of Medical Informatics, 2008.
Europska komisija, Digitalizacija javnih usluga u Europi: Provođenje ambicije u djelo, prosinac
2010.
Europska komisija, “The 2009 aging report: Underlying assumptions and projection
methodologies,” European Economy 7, 2008.
Farrell, Diana, Martha Laboissiere i Jaeson Rosenfeld, “Procjena globalnog tržišta rada u
nastajanju”, McKinsey Quarterly, lipanj 2005.
Tekući podaci (flowingdata.com/).
Gantz, John F., Christopher Chute, Alex Manfrediz, Stephen Minton, David Reinsel, Wolfgang
Schlichting i Anna Toncheva, “The diverse and expanding digital universe,” IDC white paper,
sponzoriran od strane EMC-a, ožujak 2008.
Gantz, John F. i David Reinsel, "Kako se ekonomija smanjuje, digitalni svemir se širi", bijela knjiga
IDC-a, sponzoriran od strane EMC-a, svibanj 2009.
Gantz, John F. i David Reinsel, “Desetljeće digitalnog svemira – jeste li spremni?”

IDC iView, sponzoriran od strane EMC-a, svibanj 2010.
Gantz, John F., David Reinsel, Christopher Chute, Wolfgang Schlichting, John McArthur,
Stephen Minton, Irida Xheneti, Anna Toncheva i Alex Manfrediz, “The expanding digital universe,”
IDC white paper, sponzoriran od strane EMC-a, ožujak 2007.
140
Ghemawat, Sanjay, Howard Gobioff i Shun-Tak Leung, Googleov sustav datoteka, 19. ACM
simpozij o načelima operativnih sustava, Lake George, NY, listopad 2003.
GigaOM o strukturi velikih podataka (gigaom.com/topic/structure-big-data).
Gleick, James, Informacije: povijest. Teorija. Poplava (New York: Pantheon Books, 2011.).
Goldfarb, Avi i Catherine Tucker, Zabrane oglašavanja i zamjenjivost online i offline

oglašavanja, 4. svibnja 2010., dostupno na SSRN (ssrn.com/ abstract=1600221).
Hajek, P., I. Havel i M. Chytil, “GUHA metoda automatskog određivanja hipoteza,”

Computing 1(4), 1966.; 293–308 (prikaz, stručni).
Harding, JA, M. Shahbaz, S. Srinivas i A. Kusiak, "Rudarenje podataka u proizvodnji: Pregled", Journal
of Manufacturing Science and Engineering, 2006.
Hilbert, Martin i Priscila López, “Svjetski tehnološki kapacitet za pohranu, komunikaciju i

izračunavanje informacija,” Science, 10. veljače 2011.
Hillestad, Richard, et al., „Mogu li sustavi elektroničkih medicinskih zapisa promijeniti

zdravstvenu skrb? Potencijalne zdravstvene koristi, uštede i troškovi,” Health Affairs, 2005.
Howe, Jeff, "Uspon crowdsourcinga", Wired, broj 14.06, lipanj 2006.
Hubbard, Douglas W., Kako izmjeriti bilo što: Pronalaženje vrijednosti nematerijalne imovine
u poslovanju (New York: Wiley, 2010.).
Husted, Christian i Nicolas Reinecke, “Poboljšanje nabave u javnom sektoru,”

McKinsey o vladi, 2009.
IBM, Skupina za istraživanje suradničkog korisničkog iskustva (www.research.ibm.com/visual/

projects/history_flow/gallery.htm).
IBM, Mnogo očiju, (www.958.ibm.com/software/data/cognos/manyeyes/).
Informacije su lijepe (www.informationisbeautiful.net/).
Jha Ashish, K., et al., “Korištenje elektroničkih zdravstvenih zapisa u američkim bolnicama,” New
England Journal of Medicine 360(16), 16. travnja 2009.:1628–1638.
Johnston, Douglas, Eric Pan i Jan Walker, "Vrijednost CPOE u ambulantnim uvjetima", Journal
of Healthcare Information Management, 2004.
Jorgensen, Dale, Mun Ho i Kevin Stiroh, “Retrospektivni pogled na ponovno oživljavanje

rasta produktivnosti u SAD-u,” Journal of Economic Perspectives, 2008.
Kaushal, Rainu, et al., “Troškovi nacionalne zdravstvene informacijske mreže,” Annals of Internal
Medicine, 2005.
Kaushik, Avinash, Sedam koraka do stvaranja kulture odlučivanja vođene podacima, listopad
2006.
Laflamme, Francois M., Wayne E. Pietraszek i Nilesh V. Rajadhyax, “Reformiranje bolnica s IT

ulaganjem,” McKinsey Quarterly, kolovoz 2010.
Lohr, Steve, “Za današnjeg diplomanta, samo jedna riječ: statistika,” New York Times, 5. kolovoza
2009.
Lonti, Z., i M. Woods, Prema vladi na prvi pogled: Identifikacija ključnih podataka i pitanja
povezanih s učinkovitošću javnog sektora, Radni dokumenti OECD-a o javnom upravljanju, br. 7,
OECD Publishing, doi:10.1787/245570167540.
Lyman, Peter i Hal Varian, koliko informacija? 2003., Škola informacijskog menadžmenta i
sustava, Kalifornijsko sveučilište u Berkeleyu, 2003.
Magoulas, Roger i Ben Lorica, “Big data: Tehnologije i tehnike za velike podatke,” Izdanje 2.0, broj
11, veljača 2009.
Mango, Paul D. i Vivian E. Riefberg, “Tri imperativa za poboljšanje zdravstvene skrbi u SAD-u,”
McKinsey & Company za IAB Europe, Potrošači koji pokreću digitalnu upotrebu: Ekonomska
vrijednost usluga koje se temelje na online oglašavanju za potrošače, rujan 2010.
McKinsey Global Institute, Računovodstvo troškova američke zdravstvene skrbi: Novi pogled na
to zašto Amerikanci troše više, prosinac 2008.
McKinsey Global Institute, Izvan štednje: Put do gospodarskog rasta i obnove u Europi, listopad
2010.
McKinsey Global Institute, Mijenjanje sudbine američke radne snage: Izazov ljudskog kapitala,
lipanj 2009.
McKinsey Global Institute, Dug i razduživanje: Globalni kreditni balon i njegove ekonomske
posljedice, siječanj 2010.
McKinsey Global Institute, From austerity to prosperity: Seven priorities for the long term, studeni
2010.
McKinsey Global Institute, Rast i konkurentnost u Sjedinjenim Državama: uloga njegovih

multinacionalnih kompanija, lipanj 2010.
McKinsey Global Institute, Rast i obnova u Sjedinjenim Državama: Preoblikovanje američkog

ekonomskog motora, veljača 2011.
McKinsey Global Institute, Kako IT omogućuje rast produktivnosti, listopad 2002.
McKinsey Global Institute, rast produktivnosti u SAD-u, 1995.–2000., listopad 2001.
Mekhjian, Hagop S., et. al., "Neposredne koristi ostvarene nakon provedbe unosa naloga liječnika
u akademskom medicinskom centru", Journal of the American Medical Informatics Association,
9:529-539, 2002.
Miller, George A., “Čarobni broj sedam, plus ili minus dva: Neka ograničenja naše sposobnosti
obrade informacija,” Psychological Review, svezak 63(2), ožujak 1956.: 81–97.
142
MIT Senseable City Laboratory (senseable.mit.edu/).
Nacionalni centar za zdravstvenu statistiku, Centri za kontrolu i prevenciju bolesti, Upotreba

elektroničkog medicinskog zapisa/elektroničkog zdravstvenog zapisa od strane ordinacijskih liječnika,
prosinac 2009.
Priroda o velikim podacima (www.nature.com/news/specials/bigdata/index.html)
OECD, Praćenje pridržavanja poreznih obveznika: praktični vodič temeljen na iskustvu poreznih tijela,
lipanj 2008.
Oliner, Stephen i Daniel Sichel, “Informacijska tehnologija i produktivnost: Gdje smo sada i kamo idemo?”,
Federal Reserve Bank of Atlanta Economic Review, 2002.
O'Reilly Radar o pokrivenosti podataka i uvidu (radar.oreilly.com/data/).
Pearson, Mark, Odjel za zdravstvo OECD-a, pisana izjava Posebnom odboru Senata za starenje,
rujan 2009.
Peterson, Chris L. i Rachel Burton, Potrošnja na zdravstvenu skrb u SAD-u: Usporedba s drugim
zemljama OECD-a, Istraživačka služba Kongresa, rujan 2007.
Ponemon Institute, Četvrta godišnja američka studija troškova povrede podataka, siječanj 2009.
Potts, Amy L., Frederick E. Barr, David F. Gregory, Lorianne Wright i Neal R. Patel, “Računalni unos
narudžbi liječnika i pogreške u liječenju lijekova u pedijatrijskoj jedinici kritične njege,” Pediatrics 113(1),
2004:59 –63.
PwC Health Industries, Cijena viška: Identificiranje rasipanja potrošnje u zdravstvu, 2009.
Shapiro, Carl i Hal R. Varian, Informacijska pravila: Strateški vodič za mrežnu ekonomiju (Cambridge,
MA: Harvard Business Press, 1998.).
Schonlau, Matthias, “Clustergram: Graf za vizualizaciju hijerarhijske i nehijerarhijske analize klastera,”

The Stata Journal, 2002.; 2 (4): 391–402.
Simon, Herbert A., “Dizajniranje organizacija za svijet bogat informacijama,” u Martin Greenberger,
Računala, komunikacije i javni interes (Baltimore, MD: The Johns Hopkins Press, 1971.).
"Posebno izvješće: Rad s podacima", Science, 11. veljače 2011.
“Posebno izvješće o upravljanju informacijama: Podaci, podaci posvuda”, The Economist, 25. veljače
2010.
Technium (www.kk.org/thetechnium/)
Think Quarterly (thinkquarterly.co.uk/).
Thomke, Stefan H., Eksperimentiranje je važno: Otključavanje potencijala novih tehnologija za

inovacije (Cambridge, MA: Harvard Business Press, 2003.).
Varian, Hal. Računalno posredovane transakcije, 2010. Ely predavanje na sastanku Američkog
ekonomskog udruženja, Atlanta, Georgia.
Viegas, Fernanda B., Martin Wattenberg i Kushal Dave, Proučavanje suradnje i sukoba
između autora s vizualizacijama toka povijesti, CHI2004 zbornik radova SIGCHI
konferencije o ljudskim faktorima u računalnim sustavima, 2004.
Walker, Jan, et al., “Vrijednost razmjene zdravstvenih informacija i

interoperabilnosti”, Health Affairs, 2005.
Wikipedia (http://en.wikipedia.org/).
Yankee Group, Globalna mobilna prognoza, prosinac 2010.

Relevantne publikacije McKinsey Global Instituta
kolovoza 2010
Oblaci, veliki podaci i pametna imovina:
Angus
Greig
Deset tehnoloških poslovnih trendova koje valja promatrati

Oblaci, veliki podaci i pametna
imovina: deset tehnoloških poslovnih
trendova koje valja promatrati
Napredne tehnologije i njihovo brzo usvajanje mijenjaju tradicionalno poslovanje
modeli. Viši rukovoditelji trebaju strateški razmišljati o tome kako pripremiti svoje organizacije za izazovno novo
okruženje.
Napredne tehnologije i njihovo brzo usvajanje mijenjaju tradicionalne poslovne modele.
Viši rukovoditelji trebaju strateški razmišljati o tome kako pripremiti svoje organizacije za
Jacques Bughin, Prije dvije i pol godine opisali smo osam poslovnih informacijske tehnologije koje se primjenjuju također se
Michael Chui, i trendova omogućenih tehnologijom koji su temeljito mijenjaju, budući da novi razvoji poput virtualizacije i računalstva
James Manyika
preoblikovali strategiju u širokom nizu u oblaku preraspoređuju tehnološke troškove
industrije.1 Pokazali smo kako kombinirani učinci i obrascima korištenja dok se stvaraju novi načini za
nadolazećih internetskih tehnologija, povećane računalne pojedince da konzumiraju dobra i usluge i za poduzetnike i
snage i brze, sveprisutne digitalne zajednice poduzeća da sanjaju o održivim
Kacije su iznjedrile nove načine upravljanja talentom i poslovni modeli. Vrtoglava brzina promjena utjecala je na
1 James M. Manyika, Roger P.
Roberts, i Kara L. Sprague, “Osam imovinom, kao i nova razmišljanja o organizacijskim naših izvornih osam trendova, koji su se nastavili širiti (iako
poslovnih tehnoloških trendova
strukturama. često bržim tempom
izazovno novo okruženje.

koje treba promatrati,”
mckinseyquarterly.com, nego što smo očekivali), mijenjaju se na neočekivane načine
prosinca 2007.
2Dvije od originala Od tada se tehnološki krajolik nastavlja i rastu u broju do čak deset.2
osam trendova spojilo se u trebale brzo evoluirati. Facebook, za nešto više od dva
megatrend oko distribuiranog
zajedničkog stvaranja. Također kratkim godinama, upeterostručio se u mrežu koja dotiče Tehnološko okruženje koje se brzo mijenja postavlja ozbiljna
smo identificirali tri dodatna
više od 500 milijuna korisnika. Više pitanja za rukovoditelje o tome kako pomoći
trenda usredotočena na odnos
između tehnologije i sada koristi više od 4 milijarde ljudi diljem svijeta njihove tvrtke kapitaliziraju transforma
Tržišta u nastajanju,
mobilnih telefona, a za 450 milijuna tih ljudi web je cija u tijeku. Iskorištavanje ovih trendova obično ne pripada
održivost okoliša,
i javno roba. potpuno mobilno iskustvo. Putevi nijednom izvršnom direktoru—i kao promjena
ožujka 2010
Internet stvari
Sve više objekata postaje ugrađeno sa senzorima i dobiva sposobnost komunikacije. Nastale
nove informacijske mreže obećavaju stvaranje novih poslovnih modela, poboljšanje poslovnih
procesa i smanjenje troškova i rizika.
Umjetničko djelo autora Harry Campbell

prosinca 2008
Obračunavanje troškova zdravstvene zaštite u SAD-u:

Novi pogled na to zašto Amerikanci troše više
Obračunavanje troškova zdravstvene zaštite u SAD-u:

Novi pogled na to zašto Amerikanci troše više Sjedinjene Države troše 650 milijardi dolara više na zdravstvenu skrb nego što se očekivalo, čak
i kada se prilagode relativnom bogatstvu gospodarstva; MGI ispituje temeljne trendove i ključne
prosinca 2008
pokretače ovih viših troškova. MGI smatra da je izvanbolnička skrb, koja uključuje jednodnevne
posjete bolnici i liječničkoj ordinaciji, daleko najveći i najbrže rastući dio američkog zdravstvenog
sustava. Sljedeći najveći doprinos su troškovi lijekova, administracije i osiguranja.
listopada 2002
Kako IT omogućuje rast produktivnosti
Promatrajući detaljno tri sektora – bankarstvo s stanovništvom, trgovinu na

malo i poluvodiče – MGI otkriva da, iako je IT omogućio povećanje produktivnosti u svakom
sektoru, njegov je utjecaj bio složen i raznolik. IT aplikacije koje su imale veliki utjecaj na
produktivnost dijelile su tri karakteristike: bile su skrojene za poslovne procese specifične za sektor i
povezane s polugama izvedbe; raspoređeni su u slijedu koji je tvrtkama omogućio da učinkovito
iskoriste svoja prethodna IT ulaganja; a razvili su se u sprezi s menadžerskim inovacijama.
listopada 2001
Rast produktivnosti u SAD-u
1995.-2000
Rast produktivnosti u SAD-u 1995.-2000.: Razumijevanje doprinosa informacijske tehnologije u
Razumijevanje doprinosa
Informacijska tehnologija u odnosu na
druge čimbenike odnosu na druge čimbenike
McKinsey
Globalno
Institut Studija MGI-a o rastu produktivnosti u SAD-u imala je za cilj utvrditi uzroke naglog povećanja
Uz pomoć našeg savjetodavnog odbora B. Solowa,
stope rasta produktivnosti rada u Sjedinjenim Državama između 1995. i 2000. Taj su porast
predsjednika, B. Boswortha, T. Halla, J. Tripletta
Washington DC
listopada 2001
Ovo izvješće zaštićeno je autorskim pravima McKinsey & Company, Inc.; niti
jedan njegov dio ne smije se distribuirati, citirati ili reproducirati za distribuciju bez
ključni ekonomisti i kreatori politike protumačili kao dokaz "nove ekonomije", gdje bi IT aplikacije
prethodnog pismenog odobrenja tvrtke McKinsey & Company, Inc.
dovele do bržeg gospodarskog rasta SAD-a. Izvješće izlaže prirodu i važnost uloge šest ključnih
sektora u ubrzanju rasta produktivnosti i njegove uzroke, s fokusom na ulogu IT-a.
www.mckinsey.com/mgi
E-knjige odabranih MGI izvješća dostupne su na MGI web stranici, u Amazonovoj Kindle
knjižari i Appleovoj iBookstore.
Preuzmite i slušajte MGI podcaste na iTunesu ili na

www.mckinsey.com/mgi/publications/
McKinsey Global Institute,

lipanj 2011. Copyright ©
McKinsey & Company
www.mckinsey.com/mgi

Big Data McKinsey

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Big Data McKinsey

Uploaded by

Copyright:

Available Formats

Machine Translated by Google

McKinsey Global Institute

Big data: Sljedeća granica

McKinsey Global Institute

Misija MGI-a je pomoći čelnicima u komercijalnom, javnom i društvenom sektoru da

MGI istraživanje kombinira dvije discipline: ekonomiju i menadžment.

MGI-jev trenutni istraživački program fokusiran je na tri široka područja:

Dodatne informacije o MGI-u i kopije objavljenih izvješća MGI-a mogu se pronaći na

Autorska prava © McKinsey & Company 2011

McKinsey Global Institute

Big data: Sljedeća granica

Multimedija i pojedinci s pametnim telefonima i na društvenim mrežama nastavit će

Zahvalni smo na vitalnom doprinosu i podršci brojnih kolega iz MGI-a i McKinseyja,

Direktor, McKinsey Global Institute

Direktor istraživanja, McKinsey Global Institute

Big data—bujica koja raste

5 milijardi mobilnih telefona u 2010

dijeljenih dijelova sadržaja

235 terabajta podataka koje je

Big data—hvatanje njihove vrijednosti

300 milijardi dolara

250 milijardi eura

600 milijardi dolara

60% potencijalno povećanje

1. Mapiranje globalnih podataka: rast i stvaranje vrijednosti 15

2. Tehnike i tehnologije velikih podataka 27

3. Transformativni potencijal velikih podataka u pet domena 37

3a. Zdravstvena zaštita (Sjedinjene Američke Države) 39

3b. Uprava javnog sektora (Europska unija) 54

3c. Maloprodaja (Sjedinjene Američke Države) 64

3d. Proizvodnja (globalno) 76

3e. Podaci o osobnoj lokaciji (globalno) 85

4. Ključni nalazi koji se primjenjuju na sve sektore 97

5. Implikacije za voditelje organizacije 111

6. Implikacije za kreatore politike 117

Izrada indeksa na temelju potencijala vrijednosti i

Metodologija karte podataka 126

Procjena potencijala vrijednosti u zdravstvu (Sjedinjene Američke Države) 127

Procjena vrijednosnog potencijala u javnoj upravi (Europska unija) 129

Procjena potencijalne vrijednosti u maloprodaji (Sjedinjene Američke Države) 130

Procjena potencijalne vrijednosti u podacima o osobnoj lokaciji (globalno) 133

Metodologija analize ponude i potražnje analitičkog talenta 134

Podaci su postali bujica koja teče u svako područje globalnog gospodarstva.1

Okvir 1. Što podrazumijevamo pod "velikim podacima"?

javnog sektora i stvaranje značajnog gospodarskog viška za potrošače. Na primjer, kad bi

Digitalni podaci sada su posvuda - u svakom sektoru, u svakom gospodarstvu, u

nude građanima u vrijeme kada su javne financije ograničene—i vjerojatno će tako i

Međutim, tvrtke i druge organizacije i kreatori politika moraju se suočiti sa značajnim

1. PODACI SU UŠLI U SVAKU INDUSTRIJU I POSLOVANJE

FUNKCIONIRANJE I SAD SU VAŽAN ČIMBENIK

Nekoliko istraživačkih timova proučavalo je ukupnu količinu podataka koji se

današnjih podataka da ih je fizički nemoguće sve pohraniti.7 Pružatelji zdravstvenih

Mogućnosti velikih podataka nastavljaju se ubrzano razvijati, potaknute inovacijama u

2. BIG DATA STVARA VRIJEDNOST NA NEKOLIKO NAČINA

dobavljača kupcima, budući da postaju osnaženi vlastitim pristupom podacima, npr.

Jednostavna pravovremena dostupnost velikih podataka relevantnim dionicima može stvoriti

Omogućivanje eksperimentiranja za otkrivanje potreba, otkrivanje varijabilnosti i poboljšanje

Segmentiranje populacije za prilagodbu radnji Big data

omogućuje organizacijama stvaranje vrlo specifičnih segmentacija i prilagođavanje

Zamjena/podržavanje ljudskog donošenja odluka automatiziranim algoritmima

Inoviranje novih poslovnih modela, proizvoda i usluga

bazirane usluge od navigacije do određivanja cijene imovine i osiguranja od nezgode na temelju

3. KORIŠTENJE VELIKIH PODATAKA POSTAT ĆE KLJUČNA OSNOVA KONKURENCIJE I RASTA ZA