Data Science Srbija Companies: Things Solver

Sa idejom da osnuju kompaniju čija će misija biti izvlačenje akcionih uvida iz podataka, kreiranje najboljih data proizvoda, sve u cilju stvaranja poslovne vrednosti za klijente, Darko i Miloš su 2015. godine osnovali Things Solver.

Things Solver gleda na Data Science kao pristup koji unapređuje proces donosenja poslovnih odluka, dok algoritmi mogu biti snažan prediktivni alat ako se pogodi prava mera i izabere adekvatan model mašinskog učenja. Odabir adekvatnog analitičkog modela podrazumeva razumevanje industrije u kojoj se projekat nalazi i posvećenost problemu koji traži rešenje iz podataka. Prava mera se stiče dugogodišnjim radom nad podacima, što je prva referenca kompanije Things Solver.

Data Science Srbija Companies: Things Solver

Projekti u fokusu u Things Solver-u

Projekti u Things Solveru uključuju kreiranje rešenja kao i razvijanje proizvoda, zasnovanih na analizi podataka. Kada je reč o rešenjima, ona uključuju biznis rešenja za banke, maloprodajne lance, osiguravajuće kuće i avio industriju. Ovakvi projekti podrazumevaju rešavanje konkretnog biznis problema, kao što su povećanje prodaje, sprečavanje churn-a, smanjenje troškova, razne optimizacije procesa i ekspanzija na nova tržišta. U zavisnosti od prirode i količine podataka koji su na raspolaganju razvijaju se rešenja koja integrišu prediktivne i analitičke modele uključujući klasifikacione modele, razne sisteme preporuke (bilo da možemo ili ne da identifikujemo kupce našeg klijenta), regresivne modele, klastering modele, detekciju anomalija i mnoge druge, uz korišćenje neuronskih mreža prema potrebi i kompleksnosti problema.

Osim kreiranja rešenja prilagođenih za specifične biznise i industrije, Things Solver radi i na razvoju Data Science proizvoda. 

Coeus (Kios) je uslužni softver koji, iz poslovnih podataka, izvlači primenljive informacije i znanje. Rezultat su pravovremene i efikasne sugestije za donošenje dobrih poslovnih odluka. Coeus je osmišljen kao podrška prodajnim timovima da istražuju i pronalaze trendove u svojim podacima kroz nekoliko modula. Najveća vrednost biznisu iz perspektive korisnika Coeus‑a je personalizovan pristup i predložen tretman ka svakom kupcu, kao i mogucnost targetiranja veće grupe klijenata sa istim efektom.

SARA je proizvod namenjen telco industriji. U saradnji za A1 grupom, Things Solver radi na razvijanju proizvoda za podršku odlučivanju, koji uključuje optimalno CAPEX planiranje, optimizaciju operativnih delova mreže i automatizaciju mreže upotrebom SON (self-optimizing networks) alata zasnovanog na modelima mašinskog učenja, sa potencijalom da SARA evoluira u “insights driven” proizvod za automatsko donošenje odluka. 

Na šta su ponosni u Things Solveru-u?

Deljenje znanja kao deo kulture

Jedna od novina koje se krčkaju u Things Solveru je i Things Solver Lab. Lab je nastao sa idejom da se omoguće kontinuirano učenje i razvoj. U okviru njega, radi se na R&D projektima, istraživanju novih tehnologija i isprobavanju novih alata, na osnovu inicijativa koje dođu od samih solvera.

Kako bi se omogućilo učenje i razmena znanja, nastala je TS Akademija, kao jedan od gradivnih blokova TS Laba. Održava se jednom nedeljno i u tom terminu solveri imaju priliku da nauče nešto novo, bilo kroz predavanja ili hands-on radionice, ili da sami predlože ili obrade buduće teme.

Osim istraživačkog dela, praktični deo uključuje razvoj već dva proizvoda. Jedan je proizvod za automatizovano predviđanje (forecast), dok je drugi proizvod za upravljanje modelima mašinskog učenja, od treniranja, evaluacije i produkcije, do monitoringa i njihovog automatizovanog smenjivanja u produkciji. 

Lab je za sada interni projekat, sa idejom da se u bliskoj budućnosti uključe i eksterni saradnici, kao što su studenti, istraživači i domenski eksperti. Things Solver je tu da obezbedi neophodnu podršku za rad na projektima, kao i da podrži “spin off” novih startapa, ukoliko neka od ideja zaživi. 

Things Solver danas broji 18 solvera. 

Kako bi se pokrio celokupan proces analitike, okuplja tim ljudi komplementarnih veština i oblasti interesovanja. Osnovne role u kompaniji su Data Engineer, Data Scientist i Developer. Data inženjeri su zaduzeni za usklađivanje različitih izvora podataka, njihovo parsiranje, konsolidaciju, skladištenje, tokove, serviranje i produkcionalizaciju. Data sajentisti na osnovu definisanog problema i dostupnih podataka razvijaju analitičke i prediktivne modele, na osnovu kojih se izvlače uvidi i zaključci koji se prevode u akcioni plan. Developeri razvijaju prilagođene interaktivne web aplikacije, koje klijentima omogućuju analizu rezultata i manipulaciju.

Svaki tim je kombinacija ovih rola. Ono što je karakteristično za Things Solver timove jeste da su oni “self-organizing”, te tako nemaju klasičnog tim lidera. Timovi sami brinu o podeli posla i načinu rada, gde se stavlja akcenat na odgovornost, autonomiju i slobodu. S obzirom na to da se često susreću sa potpuno novim korisničkim zahtevima, timovi ponekad potroše većinu dana na brainstorming i žustre diskusije, koje uvek urode plodom. Ono što ih karakteriše jesu “problem-solving” pristup i posvećenost.

U Things Solveru su posebno ponosni što radnim prostorom vlada kućna atmosfera, pa se tako desi da neki posetioci osete potrebu da se izuju prilikom ulaska u kancelariju.

Data science u Srbiji kroz vizuru Things Solvera

Kao jedni od osnivača Data Science Srbija organizacije, zadržali su kulturu deljenja znanja i u okviru kompanije i preneli je na ostale članove tima. Things Solver je jedan od prvih partnera Data Science Srbija organizacije, i redovno je pokrovitelj različitih vidova okupljanja zajednice, kao i studentskih organizacija.

Budući da su potekli iz zajednice, oni veruju da je cirkulacija znanja ključna za napredak i razvoj. Zajednici vraćaju na više nacina: otvaranjem projekata na GitHubu, vođenjem bloga, saradnjom sa akademijom kroz projekte na kojima se radi na realnim problemima i održavanjem otvorenih radionica. 

Osim cirkulacije znanja, Things Solver se zalaže i za decentralizaciju znanja, pre svega kroz saradnju sa univerzitetima u Beogradu, Novom Sadu i Kragujevcu, u okviru koje će solveri držati predavanja i praktične radionice i time buditi i pothranjivati svest o Data Science-u i njegovoj primeni.

Data Science Srbija Companies: Content Insigths

Content Insights analitika služi za napredno merenje uspešnosti pisanog sadržaja u online medijima. Proizvod je okrenut pre svega novinarima, urednicima sadržaja i onlajn medijima. U stanju je da izmeri nivo uključenosti čitalaca, vreme koje provedu čitajući sa pažnjom, uspešnost sadržaja u kontekstu privlačenja nove publike na sajt, kao i u kontekstu negovanja lojalne publike.

Content Insights analitika služi za napredno merenje uspešnosti pisanog sadržaja u online medijima. Proizvod je okrenut pre svega novinarima, urednicima sadržaja i onlajn medijima.

U srcu analitike nalazi se napredni algoritam pod nazivom CPI (Content Performance Indicator) koji prepoznaje tri modela ponašanja čitalaca i prema tome – “ocenjuje” svaki tekst vrednošću od 0 do 1000, pri čemu se 500 računa kao prag, a sve iznad toga kao natprosečno performiranje teksta.

Data science u Content Insights -u

Content Insights okuplja grupu različitih ljudi sa različitim iskustvima koja ima cilj da novinarskoj industriji ponudi nešto revolucionarno u sferi merenja kvaliteta i uspešnosti sadržaja. U kompaniji postoji zasebno data science odeljenje u kojem rade iskusni stručnjaci čiji rad značajno utiče na dalji razvoj i usavršavanje performansi proizvoda.

U Content Insights-u, upotreba data science-a je raznovrsna sa fokusom na optimalna rešenja. Optimizacija se vrši između kompleksnosti rešenja, kvaliteta rezultata i cene rešenja. Neki od projekata, gde je upotreba data science-a ključna su:

  • Značajna promena metrika: kada posmatramo veb metrike nije dovoljno posmatrati relativnu promenu metrika (jer i relativna promena može biti relativna). Na primer, da bismo utvrdili da li je skok sa 1.24 minuta po stranici na 1.35 minuta značajan, mi koristimo T-test.
  • Ekstrakcija ključnih reči: ovo spada u NLP domen gde nijedno dostupno rešenje ne ispunjava kriterijume specifične za našu nišu poslovanja pa smo tako morali razviti svoj algoritam za ekstrakciju značajnih ključnih reči iz medijskih članaka.
  • Grupisanje članaka: jedna od standardnih problematika vezana za analitiku veb sadržaja. U CI je radimo na više različitih načina u zavisnosti od upotrebe rezultata. Ponekad je to hijerarhijska klasterizacija, a nekada analiza na osnovu sličnosti sadržaja članaka. Takođe, za različite jezike pristup može da se razlikuje zbog specifičnosti jezika.
  • Detekcija anomalija: koristi se kao ispomoć u filtriranju i pripremi podataka. Na primer, podaci koji dolaze od društvenih mreža često imaju haotično ponašanje kada je potrebno detektovati da li je to ponašanje “prirodno” ili je rezultat grešaka u prikupljanju podataka.
  • Put čitalaca: u ovom slučaju se radi o jedinstvenom konceptu atribucije uticaja na konverzije gde smo razvili sopstveni algoritam koji uzima u obzir kompletno putovanje čitalaca, od novih do lojalnih, uključujući i specifičnosti posećenih članaka na tom putovanju.
  • Najuticajnija promena: u moru podataka i metrika, teško je pronaći šta je relevantno u kojem slučaju, te smo u tu namenu razvili algoritam koji radi upravo to. Ovaj algoritam je u stanju da detektuje i izdvoji relevantne promene i skrati vreme eksploracije podataka.

Projekti u fokusu u Content Insights-u

  • Topic detection (tzv. cultural mapping)
  • Content recommendation alat koji se bazira na algoritmu Loyalty CPI

Topic detection podrazumeva razvijanje posebnog alata koji bi kroz topic klasterizaciju, krajnjim korisnicima pomogao da jasno uoče koje su trenutno najaktuelnije teme koje okupiraju pažnju definisane ciljne grupe. Pritom se koriste napredne metrike koje opisuju ponašanje čitalaca, te mere koliko je jedna tema popularna i uspešna u kontekstu privlačenja i održavanja pažnje publike i podsticanja njihove lojalnosti. Koji od tri moguća modela (exposure, engagement, loyalty) će biti u fokusu zavisi od poslovnog modela korisnika.

Zahvaljujući jasno vizualizovanim podacima i uvidima, korisnici će moći da mapiraju trenutno najaktuelnije teme (tzv. cultural conversations), da bolje razumeju svoje čitaoce, te da dodatno optimizuju svoj sadržaj zarad što bolje vidljivosti i povećanja percepcije o vrednosti njihovog brenda.

Kada je reč o content recommendation alatu, u pitanju je poseban widget koji se postavlja na sajt onlajn medija. Ovaj widget čitaocima preporučuje članke za naredna čitanja, obično ih sortirajući na osnovu teme teksta ispod kojeg se nalaze. Cilj ovog tipa widget-a je stimulisanje pažnje čitalaca. Na ovaj način, čitaoci mogu da otkriju još vrednog sadržaja koji odgovara njihovim interesovanjima.

Ono što naš content recommendation alat čini drugačijim je jedinstven biznis model, kao i način na koji se pokreće. Preciznije, naš content recommendation alat funkcioniše na osnovu dva kriterijuma:

  • Loyalty CPI score (widget će prikazati one članke koji imaju natprosečnu Loyalty CPI vrednost, odnosno dokazano su učinkoviti za negovanje lojalne publike tog sajta)
  • Relevantnost (uzima se u obzir kontekst, odnosno bliskost u pogledu teme)

Za razliku od većine content recommendation alata, naš ne preporučuje sadržaj koji je objavljen na drugim sajtovima, već samo onaj sadržaj koji je objavljen na samom sajtu. Na taj način, pomažemo medijima da podstaknu čitaoce na dalje istraživanje njihovog kvalitetnog sadržaja.

Na šta su ponosni u Content Insights-u?

Istraživanje uz pomoć algoritma Loyalty CPI, tj. prvi korak ka utvrđivanju faktora koji utiču na lojalnost čitalaca jednoj publikaciji. Budući da se u industriji onlajn medija lojalnost uglavnom svodi samo na učestalost poseta jednom sajtu, naš data science tim odlučio je da se posveti ispitivanju tzv. perzistencije u ponašanju čitalaca, odnosno procenjivanju šansi koliko će oni zadržati svoj oblik ponašanja u sagledivoj budućnosti. Razumevanje toga je ključ za razumevanje putovanja čitalaca od onih koji su novi posetioci jedne publikacije do razvitka navike čitanja te publikacije.

Data science u Srbiji kroz vizuru Content Insights-a

Sve veća količina podataka koja se obrađuje i nedostatak kadrova dovešće do toga da se algoritmi sve više automatizuju i da njihova primena postane dostupna i manje obučenim stručnjacima. Nauka o podacima je već godinama jedna od najperspektivnijih i najvažnijih IT oblasti, ali se stvari kod nas i dalje sporo razvijaju, naročito kada je reč o stvaranju novih stručnjaka. Zbog toga je najvažnija stvar za struku kod nas da se pokrene što više programa formalnog i neformalnog obrazovanja na temu data science.