OptDataSchool

Osvrt na OptData Spring School u Novom Sadu

Fakultet tehničkih nauka u Novom Sadu je od 13. do 17. marta bio domaćin vrlo interesantnog događaja pod nazivom Spring School on Optimization and Data Science koji smo pre nekog vremena već najavili na našem sajtu. Lokalni organizator je bila grupa profesora sa FTN, uz pomoć nekoliko evropskih institucija i u okviru COST projekta.

Spring School on Optimization and Data Science je okupila oko 80 studenata iz preko 15 evropskih zemalja. Škola je organizovana sa ciljem da se studentima da uvid u savremene metode optimizacije i mašinskog
učenja kroz teorijska predavanja i predstavljanje praktičnih rešenja. Tokom pet dana studenti su mogli da čuju 21 predavanje od strane 16 predavača – univerzitetskih profesora i profesionalaca iz ovih oblasti.

Gradient Descent i Mixed-Integer Programming

Čast da održi uvodno predavanje je imao Robert Gover sa pariske École Normale Supérieure. Gover je tokom tri sata do najsitnijih detalja objašnjavao Gradient Descent, Stochastic Gradient Descent i Stochastic Average Gradient algoritme. Svoje sjajno izlaganje Gover je potkrepio detaljnim matematičkim izvođenjima i dokazima.

Do kraja prvog dana su još govorili prof. Kulić sa Fakulteta tehničkih nauka na temu neuronskih mreža i njihove primene, a zatim i gosti sa berlinskog ZUSE Instituta Gregor Hendel i Ambroz Glajksner.

Hendel i Glajksner su se bavili mixed-integer programiranjem (MILP), oblašću koja autoru ovih redova definitivno predstavlja potpunu nepoznanicu. MILP optimizacija se pokazala kao vrlo primenjiva na različite probleme u proizvodnoj industriji i saobraćaju i transportu. Osim toga, MILP se može iskoristiti kao optimizaciona metoda kod različitih algoritama mašinskog učenja. Iz prve ruke smo mogli da se uverimo kako to izgleda na primeru Sparse Support Vector Machine i SCIP, MILP rešenja koje je razvijeno na ZUSE institutu. U korist MILP je govorio i Filip Hungerlender sa Univerziteta u Klagenfurtu pričajući o optimizaciji dostave online narudžbina kod jednog trgovinskog lanca u Velikoj Britaniji. Na kraju, od Stenlija Šejda smo mogli da čujemo da MILP koristi i Deutsche Bahn za potrebe optimizacije redova vožnje i iskorišćenja vagona.

Ko nije znao dovoljno ili nimalo o genetskim algoritmima, predavanje prof. Kanovića sa FTN je bila prilika da to promeni. Osim što je bio odličan domaćin, prof. Kanović je uspeo da da sjajan prikaz toga šta su genetski algoritmi i predstavi ih kao potencijalno rešenje za optimizaciju neuralnih mreža i Support Vector Machine.

Paralelizacija i Machine Learning

Malo starije generacije su sigurno čule za Cray koji je tokom osamdesetih godina 20. veka imao svoje zlatno doba na polju superkompjutera. Usledile su neke teške godine i nekoliko promena vlasnika, ali kompanija i dalje uspešno opstaje na polju klastera i HPC (high performance computing). Uc-Uve Haus iz Cray Research laboratorije u Cirihu je tokom svog prvog predavanja dao vrlo temeljan pregled postojećih deep learning rešenja i ukazao na njihove prednosti i mane. Hausovo drugo predavanje je bilo posvećeno paralelizaciji i distribuiranoj obradi podataka. Verovali ili ne, Fortran i C su još uvek vrlo legitimna i korišćena rešenja za određene setove velikih podataka.

Da događaj ne prođe bez pomena programskog jezika R pobrinuo se Bernd Bišl sa Ludvig Maksimilijan Univerziteta u Minhenu. Bišl je odgovoran za razvoj mlR, popularnog paketa za mašinsko učenje koji nudi veliki broj različitih tehnika, ali i mnogobrojne mogućnosti optimizacije. Bišlova predavanja su bila posvećena bejzijanskim metodama optimizacije i optimizaciji kroz hiperparametre. Za razliku od većine svojih akademskih kolega, Bišl je u svojim predavanjima bio potpuno fokusiran na praktične primene algoritama u radu sa realnim podacima.

Primena mašinskog učenja i optimizacije

Prof. Zoran Jeličić i Milena Petković sa FTN su predstavili projekat predikcije potrošnje energenata i električne energije na kom su imali prilike da aktivno učestvuju, dok je njihov kolega Milan Rapaić pričao o adaptivnim metodama regresije i klasifikacije kroz jedno vrlo interaktivno i dinamično predavanje.

Nataša Đurđevac-Konrad i Tim Konrad su kroz svoja predavanja imali priliku da kažu nešto više o mašinskom učenju u medicini – primeni algoritama, ali i problemima sa kojima se susreće moderna medicina i načinu na koji mašinsko učenje može da pomogne.

Na kraju, jedini predstavnik biznisa je bio Danijel Hulme, koji je nakon završenog doktorata na londonskom UCL osnovao kompaniju Satalia. Satalia se jedna od 5 kompanija koja se nalazi da Gartner-ovoj listi “Cool Vendors in Data Science” uz npr. kompaniju Dato koji je nedavno kupio Apple. Danijel je predstavio kompanijsko “Optimization-as-a-Service” rešenje – crowdsource za optimizacione probleme koje daje priliku svim zainteresovanim da ponude svoje rešenje za različite probleme optimizacije.

Organizatori su uspeli da dovedu sjajne predavače i dali sve od sebe da prijatnim učine boravak svih polaznika. Studentima su podeljeni sertifikati o učešću što je lep gest organizatora. Ukupno gledano, FTN se pokazao kao dobro mesto za učenje o optimizaciji i data science. Iako nije lako sumirati petodnevni događaj koji je imao prilično šarenolik program, Spring School on Optimization and Data Science zaslužuje visoke ocene. Nadamo se da će ovakvih događaja biti još više u budućnosti.