ds-z-150x120

Karijera Data Scientist-a: iz ličnog iskustva Ognjena Zelenbabića

Dragi pratioci,

Sigurno ste se kao i ja, suočili sa poteškoćom da u jednoj rečenici roditeljima, bakama i dekama, strinama i tetkama objasnite na kojoj poziciji radite, kako se zove vaše zanimanje i šta tačno podrazumeva… Zanimanja Business Intelligence Consultant, Database Architect, Database Administrator itd. su teško objašnjiva u jednoj reči onima koji nisu u IT vodama… Generalno gledano, sa razvojem novih tehnologija uvek su se javljale i nove radne pozicije i nova zanimanja… U lavini podataka sa kojima smo svi suočeni u ovoj big data eri, došlo je do razvoja brojnih tehnologija, tehnika i alata koje zahtevaju posebna znanja, stručnosti i veštine zaposlenih. Trenutno aktuelne pozicije koje podrazumevaju rad sa ovim tehnologijama su Data Scientist, Data Engineer, Information Strategist,  Big Data Architect, Big Data Consultant, Data Executive, Chief Digital Officer, i slično…

Zbog velikog interesovanja za sve one specifičnosti i karakteristike ovih novih zanimanja, odlučila sam da intervjuišem nekoliko ljudi koji se baš bave data science-om i uopšte analitikom u big data eri.

Ognjen Zelenbabić je bio i više nego racionalan izbor za intervju o data science-u, a u nastavku ćete i sami shvatiti zašto…

?

Reci nam nešto o sebi – koji si fakultet završio i kako si počeo da gradiš svoju karijeru?

Nisam hteo da prihvatim neminovnost da u Srbiji, nakon toliko godina investiranja u obrazovanje, čovek najviše može da se nada da ima posao. Posle završenih master studija na ETF-u postavio sam sebi cilj da nije dovoljno samo da radim već i da volim ono što radim i da od toga lepo živim. Menjao sam oblast delatnosti nekoliko puta sve dok se na kraju nisam pronašao u svetu prediktivne analitike. Bilo je potrebno mnogo rizika i odricanja da bih na kraju uspeo da se udomim u oblasti koja je intelektualno zahtevna i kreativna. Poziciji u kojoj se sada nalazim su najviše doprineli sati i sati učenja kada god bih uspeo da odvojim slobodno vreme za to.

Kako bi opisao data science? Koliko se data science uklapa u tvoj svakodnevni posao?

Data Science je prirodni iskorak dalje u odnosu na tradicionalnu analitiku i poslovnu inteligenciju. Sa sazrevanjem tehnologija i sa izobilju podataka koje sada imamo nalazimo se u situaciji da možemo da uradimo nešto više sa podacima. Uočavanje skrivenih šablona unutar podataka i njihovo korišćenje je ono što je toliko popularizovalo data science zbog raznih benefita koji iz toga proizilaze. Kada, na primer, uspete da napravite prediktivni model korisničkog ponašanja, dolazite u situaciju da možete da adaptirate svoje poslovne procese u odnosu na ono što će se desiti (data science) a ne u odnosu na ono što se dešavalo (tradicionalna analitika). Moj posao je izrada modela i komuniciranje rešenja odnosno davanje preporuka u zavisnosti od dobijenih rezultata.

Kako izgleda tvoj uobičajen dan na poslu?

To zapravo zavisi od toga koji je dan u pitanju. Nekada je to rad na definisanju mehanizama praćenja i ekstrakcije podataka, nekada je rad na integraciji podataka, čišćenje podataka, eksplorativna analiza, itd. Izrada modela dolazi na red tek kada su svi preduslovi čistih i pravilno pripremljenih podataka ispoštovani. „Najteži“ deo posla je predstavljanje rešenja kada morate da ubedite ljude u nešto što nije intuitivno. Upravo zbog toga je vizuelizacija podataka izuzetno bitna.

Kada si shvatio da želiš da radiš sa podacima? Kako si shvatio da podaci imaju moć?

Da budem iskren, prvenstveno sam hteo da se bavim razvojem algoritama i primenom machine learning-a a podaci su došli kao potreban rekvizit. Od momenta kada sam se na fakultetu prvi put susreo sa machine learning algoritmima kao što su genetski algoritmi, inteligencija roja, neuralne mreže itd. bio sam opčinjen njihovom upotrebnom moći.

Prilikom rešavanja problema, ljudi se uglavnom ograničavaju na ono što već znaju (“Kada imaš čekić sve ti liči na ekser”). Upravo zbog toga smatram da je veoma važno proširiti horizonte i steći što više novih znanja kako bismo bili u stanju da rešavamo kompleksnije probleme i bili veći profesionalci u onome što radimo.

Kako znaš da si prikupio i da analiziraš prave podatke?

Prvi korak analize je uvek eksplorativna analiza kada pokušavamo da uočimo zakonitosti koje postoje unutar podataka. Ako postoje šabloni unutar podataka onda imamo materijal koji možemo iskoristiti za izradu prediktivnih modela, u suprotnom su podaci beskorisni. Eksplorativna analiza podrazumeva upoznavanje sa prirodom podataka uglavnom iscrtavanjem velikog broja grafika (scatter plot, box plot, histogrami itd.) kada možemo vizuelno da uočimo zavisnost promenljivih i njihove međusobne odnose.

Koje tehnologije i alate koristiš? Zašto baš njih?

Koristim dosta alata, sve u zavisnosti od toga kakve su potrebe. Uglavnom koristim Linux, Python, R, SQL, Hadoop, Matlab i Excel. Veliki sam fan Matlab-a ali je on nažalost veoma skup pa firme baš nisu raspoložene da kupuju licence a tu je i problem kako implementirati Matlab program u produkciju. Iz tih razloga sam prešao na open source alatke kao što su Python i R. Svaki od njih imaju svoje prednosti i mane pa njihova upotrebna vrednost zavisi od konteksta. Trudim se da pratim scenu kako bih konstantno bio u toku sa novim tehnologijama. Njih je danas toliko mnogo da nema šanse da se savladaju sve.

Dosta ljudi upadne u zamku da zbog favorizacije neke tehnologije pokušavaju da je proguraju čak i gde to nije prikladno. Ja sam pre za pristup da se utvrdi koji je cilj, šta treba da se postigne, i onda da se pronađe najjednostavnije rešenje za rešenje problema.

Kako vidiš data science u narednih 5 godina? Da li sebe vidiš u ovoj oblasti u budućnosti?

Data Science je uhvatila zamajac koji je teško zaustaviti. Razvoj machine learning algoritama, novih tehnologija koje ih podržavaju i broj ljudi koji se time bave sve je veći tako da u budućnosti možemo da očekujemo još značajnije tehnološke proboje i veću popularizaciju ove oblasti.

Ja sam u data science-u pronašao doživotnu strast tako da sam tu da ostanem. Ono što bih voleo da vidim je da u Srbiji imamo program za edukaciju ovakvih kadrova da makar što se toga tiče idemo u korak sa svetom.

Koji bi savet dao svima koji žele da uplove u ove vode?

Mislim da se može očekivati da će u budućnosti biti veliki deficit za kadrovima ovog profila tako da ne bi bilo loše da se na vreme ukrcate u voz. Strast i posvećenost su veoma bitne jer da biste bili uspešni u ovom poslu podrazumeva se da znate mnogo tehnologija. Ako niste spremni da učite redovno, zaboravite na ovu profesiju.

S druge strane, osećaj da možete pozitivno da utičete na kompletno poslovanje kompanije ili osećaj postignuća koji dobijete kada uspete da izgurate kompleksan projekat je neprocenjiv.

Sigurna sam da vas je ova priča podstakla da razmislite da li želite da se bavite ovom oblašću, a uskoro možete očekivati nove intervjue sa uspešnim profesionalcima iz ove oblasti…