You are on page 1of 38

Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

1
DATA SCIENCE
I ČUDNE STVARI U
HRVATSKOM
NOGOMETU

DOC. DR. SC. TOMISLAV GLOBAN

EKONOMSKI FAKULTET – ZAGREB

MACROHUB
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

2
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

3
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

4 UVOD

• Studija slučaja jedne od većih kontroverzi hrvatskog


nogometa – odnos Dinama i Lokomotive
• Od 2009. ovaj slučaj neprekidno uzburkava strasti u
domaćoj nogometnoj sferi
• Tvrdnje o prebliskoj povezanosti u sportskim i poslovnim
poduhvatima između dva kluba
• Pretjerana financijska i kadrovska ovisnost Lokomotive o
Dinamu, dovodeći u pitanje samu regularnost 1. HNL
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

5
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

6 O ODNOSU LOKOMOTIVE I
DINAMA
• Prodaja igrača u Dinamo činila 70% godišnjih prihoda
Lokomotive! (Naš Hajduk, 2014)
• 50-70% igrača koji su nastupili za Lokomotivu, u nekom trenutku
svoje karijere bili su članovi i registrirani igrači Dinama
• Nijedan odnos dvaju klubova u ligi nije usporediv s brojem
posudbi i transfera igrača kao onaj između Lokomotive i
Dinama
• Broj posudbi igrača između ovih dvaju klubova uvelike nalikuje
uzorku koji se uobičajeno nalazi između A i B ekipa istoga
kluba
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

7
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

8 O ODNOSU LOKOMOTIVE I
DINAMA
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

9
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

10 IZ MEDIJA
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

11
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

12
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

13
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

14
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

15
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

16
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

17
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

18 CILJ ISTRAŽIVANJA

• Ogleda li se ova bliska povezanost između Dinama i


Lokomotive u sportskim rezultatima između ova dva kluba?
• Postoji li išta neobično u rezultatskim ishodima njihovih
utakmica u usporedbi sa svim ostalim parovima klubova u
HNL-u?
• Ako da, o kojoj razini „neobičnosti” govorimo?
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

19 PODACI

• Prikupili smo rezultate za sve utakmice ikada odigrane


u 1. HNL, počevši od ratne 1992. pa sve do sezone
2015./16.
• Uzorak obuhvaća preko 5000 utakmica te 866 parova
klubova
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

20 KAKO IZMJERITI REZULTATSKI


PODBAČAJ?
• Stvarne rezultate i osvojene bodove znamo, no kako
izračunati koliko je neki klub trebao osvojiti protiv
određenog protivnika?
• Web stranica Football Club Elo Ratings objavljuje povijesni
prikaz vjerojatnosti za svaki ishod (pobjeda domaćina, remi,
pobjeda gosta) za sve utakmice
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

21
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

22 KAKO IZMJERITI REZULTATSKI


PODBAČAJ?
• Što je razlika u renkingu veća, to je veća vjerojatnost da će
bolje rangirani klub pobijediti i obratno, uzimajući u obzir
prednost domaćeg terena i ostale specifičnosti nogometne igre
• 2. 11. 2013. Lokomotiva – Dinamo:
• Vjerojatnost pobjede Lokomotive: 29%
• Vjerojatnost neriješenog: 30%
• Vjerojatnost pobjede Dinama: 41%

• Očekivani broj bodova za Lokomotivu u toj utakmici:


• 0,29 * 3 boda + 0,30 * 1 bod + 0,41 * 0 bodova = 1,17 bodova
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

23 KAKO IZMJERITI REZULTATSKI


PODBAČAJ?

• Očekivani osvojeni broj bodova Lokomotive u 21 utakmicu


(1992. – 2016.) protiv Dinama bio 12,79 bodova
• Sada možemo izračunati indeks podbačaja (IP):
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

24 KAKO IZMJERITI REZULTATSKI


PODBAČAJ?
• Učinak Lokomotive protiv Dinama u analiziranom razdoblju:
• 0 pobjeda
• 1 remi
• 20 poraza

• Taj rezultat je čak 92 posto ispod očekivanog, protiv


Dinama su osvojili samo 8% bodova koje su prema svojoj
snazi i snazi protivnika trebali osvojiti
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

25 KOLIKO JE TO VJEROJATNO?
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

26 KOLIKO JE TO VJEROJATNO?
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

27 KOLIKO JE TO VJEROJATNO?

• Par Lokomotiva – Dinamo jedini izvan 99-postotnog pojasa pouzdanosti


Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

28 KOLIKO JE TO VJEROJATNO?
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

29 KOLIKO JE TO VJEROJATNO?

• Vjerojatnost da se nalazite ovako daleko u repu distribucije


je 0,003%, odnosno 1 naprema 33.333.
• Vjerojatnost da će vas jednom u životu pogoditi grom je
otprilike 2,5 puta veća nego da jedna momčad ima ovoliku
razinu rezultatskog podbačaja protiv istog kluba
• BTW, Lokomotiva je iznadprosječno jak klub za hrvatske
prilike!
• Kladionice ukalkulirale ovu anomaliju u svoje koeficijente!
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

30 ALI LOKOMOTIVA JE POBIJEDILA


DINAMO… I TO DVAPUT!
• Od kraja naše analize do danas, Lokomotiva i Dinamo
odigrali još 10 utakmica:
• 07/2016. Dinamo – Lokomotiva 3-1
• 09/2016. Lokomotiva – Dinamo 0-1
• 12/2016. Dinamo – Lokomotiva 3-1
• 04/2017. Lokomotiva – Dinamo 1-2
• 08/2017. Lokomotiva – Dinamo 0-3
• 11/2017. Dinamo – Lokomotiva 2-0 (učinak 0-1-26)
• 03/2018. Dinamo – Lokomotiva 1-4
• 05/2018. Lokomotiva – Dinamo 3-1
• 08/2018. Dinamo – Lokomotiva 1-0
• 11/2018. Lokomotiva – Dinamo 0-1 (učinak 2-1-28)
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

31 REAKCIJA MAINSTREAM MEDIJA…


Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

32 JE LI TO PROMIJENILO ZAKLJUČKE?

• Nova vrijednost indeksa podbačaja od 0,366


• Lokomotivin bodovni učinak protiv Dinama i dalje je čak
63% ispod očekivanog s obzirom na razliku u snazi
klubova
• Lokomotivin podbačaj protiv Dinama i dalje je najveći
zabilježen u povijesti HNL-a
• I dalje jedini izvan 99-postotnog pojasa pouzdanosti!
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

33 JE LI TO PROMIJENILO ZAKLJUČKE?

• Vjerojatnost za ovakav podbačaj je porasla s 0,003% na 0,012%.


Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

34 ŠTO TO SVE ZNAČI?

• U vakuumu, neuobičajeni uzorak rezultata sam po sebi nije


dokaz nikakvih nemoralnih ili nezakonitih radnji
• Treba uzeti cijeli kontekst odnosa dva kluba…
• Primjer iz Nizozemske (Feyenoord – Excelsior)
• Zaštititi integritet natjecanja i spriječiti gubitak povjerenja u
HNL
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

35
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

36 ISKORISTIVOST ISTRAŽIVANJA

• Nova metodologija za mjerenje rezultatskih podbačaja i


premašaja u sportskim natjecanjima
• primjenjiva u svim natjecanjima i to ne samo u nogometu, već i u
ostalim sportovima

• Izradili smo sveobuhvatnu bazu svih odnosa između svih


klubova koji su ikada igrali u HNL-u
• Od interesa istraživačima koji se bave ekonomikom sporta,
sportskim analitičarima, novinarima, industriji klađenja, klubovima,
svim sferama društva povezanih sa sportom i sportskom industrijom.
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

37 NOVA ISTRAŽIVANJA U
EKONOMICI SPORTA
• Indeks medijskog sentimenta za nogometne klubove
• Utjecaj na posjećenost stadiona?

• Utjecaj novca od TV prava na transferno tržište u nogometu


• Plaćaju li Englezi premiju samo zato što su bogati?

• …
Data Science i čudne stvari u hrvatskom nogometu 21. 1. 2019.

38 FOLLOW-UP

• tgloban@efzg.hr
• Tomislav Globan @

You might also like