Capture

Data Science u sportskom klađenju – lično iskustvo Dine Dicić

Dragi pratioci,

Kao što sam obećala  – očekuje vas još jedna priča o Data Science-u. Ova priča je malo drugačija od prethodne dve. Prvi razlog je što je reč o osobi ženskog pola što je za svako divljenje i pohvalu imajući u vidu da u ovom zanimanju po brojčanom stanju još uvek dominiraju muškarci, a drugi razlog je taj što je u pitanju primena Data Science-a u specifičnoj oblasti – sportskom klađenju.

Dinu sam upoznala na konferenciji Data Science, koja je po prvi put održana u Beogradu 13. i 14. oktobra 2015. godine, gde je održala fantastično predavanje na temu Primena nauke o podacima u sportskom klađenju.

U nastavku vam prenosim intervju sa Dinom.

IMG_8168-2

Reci nam nešto o sebi – koji si fakultet završila i kako si počela da gradiš svoju karijeru?

Osnovne i master studije sam završila na Idaho State University u SAD-u. Studirala sam matematiku ali na post diplomskim sam se više okrenula statistici i verovatnoći. Posle školovanja sam radila kao profesor na fakultetu u Americi a kada sam se posle jedanaest godina vratila u Srbiju dobila sam priliku da se bavim analizom podataka u sportskoj kladionici. Obzirom na to da nisam imala nikakvog iskustva sa data science profesijom, karijeru sam počela prvo izveštavanjem a onda se okrenula više ka  ETL-u, arhitekturi DWH  i predikcijama.

Šta je za tebe data science? Kada si shvatila da želiš da se baviš data science-om?

Za mene data scence je neophodna nauka za svaki biznis. Živimo u svetu gde su podaci sve više dostupni i razvojem tehnologija  prosto je prirodno da se ti podaci koriste za nesto više od samog izveštavanja i gledanja u prošlost. Mislim da nisam imala onaj “AHA“ momenat da ću od sada da se bavim data science-om. Do toga je došlo prirodno – stalnim učenjem i razvojem dolazite do nekih novih stvari a to je u mom slučaju bio data science.

Kako bi opisala specifičnosti primene data science-a u sportskom klađenju?

U svetu, primena data science-a u klađenju je ustaljena stvar bez koje se ne može. U Srbiji, većina ljudi je vrlo skeptična po tom pitanju. Ovde i dalje postoji stigma o tome šta su u stvari kladionice i na koji način one zarađuju. Ali kada pogledate, predikcija koju date na ishod neke utakmice ili događaja u formi kvote je nista drugo nego primena data science-a. Koriste se podaci iz prošlosti koji prolaze kroz matematički model i daju vam verovatnoću da će se nesto desiti u budućnosti.

Odakle crpiš ideje o onome što želiš da analiziraš?

Za bilo koju analizu podataka morate da imate dobro razumevanje biznisa u kome radite, bilo da je to marketing, klađenje, finansije itd. Izveštaji i  grafici  mogu da vam ukažu na  promene u poslovanju. Meni je to najbolji pokazatelj koji deo podataka treba da „napadnete“. Sa druge strane, bitno je i da znate sta je vaš krajnji cilj.  Kada se poslovanje odvija u granicama očekivanog  kao analitičar morate da se zapitate šta možete da uradite da to poslovanje bude još bolje.

Kako bi opisala svoj prvi skup podataka sa kojim si počela ozbiljnije da radiš?

Ogroman! Imala sam tu sreću da radim sa velikom količinom podataka koji su vrlo zanimljivi i kompleksni.

Koje tehnologije i alate koristiš? Zašto baš njih?

To sve zavisi od toga na čemu radim.  Koristim SQL, R, SPSS, Excel i razne data integration alate kao sto su Pentaho Kettle i SSIS. Postoji još nekolio alata koji su lepi i korisni ali skupi tako da se uglavnom fokusiram na open sourse alate.  Definitivno sebe teram da učim Python ali od ostalih dnevnih obaveza on je trenutno u back logu.

Kako znaš/osećaš da si prikupila i da analiziraš prave podatke?

Već sam spomenula da je bitno da imate dobro razumevanje biznisa i podataka koji vam taj biznis donosi. Čest je slučaj da vam prikupljanje i čišćenje podataka traje mnogo duže nego sama analiza i modeliranje. Kroz taj proces upoznate šta je korisno a šta ne za vaš model.

Kako vidiš data science u narednih  5 godina? Da li sebe vidiš u ovoj oblasti u budućnosti?

Data science je posao koji tek kreće u akciju. Sebe definitivno vidim u ovoj oblasti iako to nije bio slučaj pre pet godina.

Koji bi savet dala svima koji žele da uplove u ove vode?

Da se ne plaše da napadnu podatke i da uče nove tehnologije. Imala sam priliku da dovedem studente na praksu i to sam prepoznala kao jedan od problema. Većina njih je imala strah da nesto „ne pokvare“. Radoznalost i konstantno učenje su ključ u ovakvom poslu. Danas ima toliko besplatnih kurseva na internetu da je neophodna samo volja i malo vremena.

Koji je najzanimljiviji rezultat do kojeg si došla primenom data science-a u sportskom klađenju? 

Mozda najzanimljiviji bas ne mogu da ispričam J  , ali tu smo dolazili do mnogo interesantih stvari. Neke od fun fact-ova koje mogu da spomenem koje su prolazile kroz analizu su na primer podaci da žene iako se slabo klade imaju veći procenat dobitnosti od muškaraca i da igrači u Srbiji uglavnom izbegavaju da igraju na Đokovića.