Nedeljno prelistavanje, 13. decembar 2015

Sigurno je da nismo originalni kada je u pitanju ovakav tip tekstova, ali nam se čini da je interesantno dati nekoliko predloga za čitanje iz mora dostupnih tekstova koji se mogu naći na mreži. Današnja lista je isključivo moj izbor, ali se nadam da ćemo za ubuduće naći još ljudi voljnih da podele sve interesantne stvari koje su imali prilike da pročitaju tokom radne nedelje.

Read more

Machine Learning algoritmi najmoćniji alat u industriji podataka

 

Jedna od strarijih industrijskih grana sigurno je drvna industrija. Svi znaju da je u drvnoj industriji jedan od osnovnih resursa drvo. Sirovo drvo ima određenu vrijednost ali obradom tog drveta, različitim alatima i kreativnim idejama stvaramo nove, veće vrijednosti, odnosno proizvode, koji nas okružuju i koji zadovoljavaju naše različite potrebe. Možda je malo neobično što ovaj tekst koji se odnosi na tehnologiju počinjem drvnom industrijom, ali želim sa ekonomskog aspekta povući paralelu između same ideje drvne industrije kao stare industrije i jedne nove industrije koja je na početku svoga brzog razvoja.
Upravo smo u eri eksponencijalnog porasta volumena i raznovrsnosti podataka koji se generiraju velikom brzinom i pristižu iz različitih izvora, kao što su senzori, društvene mreže, mobilni uređaji, transakcijski sistemi itd. Uz pomoć savremene tehnologije, svi naši aspekti života ulaze u proces „mjerenja“ i počinju da se kvantifikuju i izražavaju kroz različite digitalne podatke. Taj fenomen je već dobio svoje ime, Datafication. Svi ti podaci predstavljaju savremeni resurs. Resurs, kao što je to upravo i drvo. Sasvim je logično da se u posljednjih nekoliko godina počela razvijati nova industrija, industrija podataka. Koja je vrijednost podataka? Sirovi podaci, kao što je i sirovo drvo, nemaju neku veliku vrijednost, međutim, stavljanjem u funkciju ovih podataka imamo velike mogućnosti da stvaramo velike vrijednosti, često inovativne proizvode i usluge. Novu vrijednost možemo stvoriti samo njihovom obradom uz pomoć različitih alata, naprednih algoritama i kreativnih ideja. Još uvijek veliki broj preduzeća koja raspolažu sa podacima, čvrsto vjeruje da izvlače maksimalnu vrijednost iz podataka primjenom jednostavnih analitičkih postupaka a koji najčešće obuhvataju deskriptivne statističke metode koje izračunavaju procentne vrijednosti, prosjeke, učestalosti, odnosno, postavljanjem SQL upita nad bazama podataka. Naravno, primjenom i ovakvih metoda dobijemo određenu vrijednost, ali… Opet ću uzeti primjer drvne industrije. Kada koristimo sirovo drvo samo za toplotnu energiju (drva za loženje), to nam daje određenu vrijednost, mada minimalnu, nego kada bismo tu istu količinu drva obradili nekom naprednom metodom i kreativnom idejom, tada bi dobili proizvod sa nekim inovativnim dimenzijama koji ima dosta veću vrijednost. Upravo su u industriji podataka naprednije metode algoritmi strojnog učenja (engl. Machine Learning) koji nam pružaju beskrajne mogućnosti da stvaramo nova tehnološka rješenja koja pokreću podaci. Sve je veće prisustvo takvih rješenja a kao najveći korisnici strojnog učenja su tehnološki giganti poput Amazon-a, Google-a i sl. Amazon veliku vrijednost generira kroz Machine Learning algoritme koji automatizovano podešavaju cijenu proizvoda svaki put kada pregledate proizvode, te tako postižu cjenovnu optimizaciju. Odnosno, algoritam postavlja cijene na način da maksimizira profit po prodaji svakog proizvoda. Takav algoritam donosi odluke u stvarnom vremenu i mudriji je nego što mislimo. Koliku vrijednost Machine Learning algoritmi pružaju Amazon-u, a koliko bi pružili neki drugi analitički pristupi? Možemo slobodno reći da klasična poslovna inteligencija ide prema umjetnoj poslovnoj inteligenciji kao svome vrhuncu. Industrija podataka će proizvoditi nova rješenja zasnovana na Machine Learning tehnologiji koja pokreću podaci.

Hadoop Srbija postaje Data Science zajednica Srbije

Tačno 25. marta 2014. godine napisao sam prvi tekst za blog Hadoop Srbija koji sam pokrenuo nekoliko dana pre toga. Cilj mi je bio da prenesem znanje koje sam imao o Hadoop-u i Big Data tehnologijama. Na početku sam krenuo sam, nešto kasnije mi se priključila Aleksandra koja je vodila računa o društvenim mrežama i bila kritičar mojih tekstova, kao neko ko se ne bavi ovim tehnologijama. Tekst po tekst, sve više ljudi je čitalo moj blog i mnogo njih mi se javilo. Nako toga timu su se priključili Jelena i Miloš koji su mnogo doprineli samom razvoju bloga. Sad je došlo vreme da blog raste i da se priključe novi ljudi, da postane zajednica koja će dalje graditi svest o podacima, tehnologijama i nauci o podacima.

Zašto datascience.rs ?

Počeo sam da pišem samo o Hadoop-u i alatima koji se dodaju na njega, ali vremenom, kako sam učio, tu su se pojavili novi alati i postalo mi je jasno da pišemo mnogo šire nego što je Hadoop Srbija. Pored toga, upoznao sam Branka i Zorana koji su bili voljni da postavimo temelje zajednice. Branko je već imao domen i mogli smo da počnemo. Na jednom sastanku Miloš, Zoran, Branko i ja smo doneli odluku da napravimo sajt datascience.rs i počnemo.

Meetup grupa

Pored sajta, tu je i meetup grupa. Zoran je u avgustu pokrenuo ovu grupu gde smo se kasnije priključili kao organizatori i sada je grupa jedna od aktivnosti Data Science zajednice Srbije. Trudićemo se da organizujemo što više kvalitetnih meetup-a i druženja.

Konferencija

U Srbiji je u oktobru održana i prva Data Science konferencija u našoj zemlji, koju je organizovao Institut savremenih nauka, a gde je Branko bio jedna od organizatora. Kvalitet predavanja, kompanije koje su se pojavile i podržale konferenciju i velika posećenost dodatno su nas ohrabrili da nastavimo da radimo. Takođe, tu je i podrška od organizacionog tima, divne ekipe, kojoj želim da se i na ovaj način zahvalim i čestitam na uspešnoj konferenciji.

Hadoop Srbija domen će biti preusmeren na novu lokaciju. Tu je stara ekipa i još novih ljudi koji će deliti svoja iskustva. Svi zainteresovani da pišu i podele svoja iskustva mogu nan se javiti. Ovo će biti mesto za sve nas koji radimo sa podacima.

Na kraju želim da se zahvalim i drugim IT zajednicama u Srbiji koje nas podržavaju. Uživajte u novom blogu i ovim putem vas pozivam da dođete da se družimo na nekom od meetup-a.