Dizajn dimenzionih baza na SQL user grupi

Dimenziono modelovanje predstavlja koncept i skup tehnika u izradi DWH. Krajnji rezultat predstavlja dimenzioni model baze podataka koji se specifičan i konceptualno se razlikuje od ER modela. Ovako kreirane dimenzione baze koriste se za ad hoc analize od strane poslovnih analitičara pomoću različitih BI alata i fizički moraju biti napravljene tako da imaju veliku brzinu čitanje ogromne količine podataka. S druge strane neophodno je napraviti ETL koji može osvežiti dimenzionu bazu sa podacima u realnom vremenu. Na ovom predavanju biće prikazani koncepti dimenzionog modela, smernice u fizičkom dizajnu tabela zavisno od tipa dimenzionih i fakt tabela, kao i smernice u … Pročitaj više

Let’s start with Spark

Apache Spark je alat za distribuiranu obradu velikih količina podataka, Big Data. Pruža veliku brzinu u obradi i sastoji se od četiri modula: SQL, MLlib, Streaming i Graph. Znatno olakšava posao ljudima koji se bave podacima. Data Science zajednica Srbije je uz podršku kompanije Databricks pokrenula zvaničan Apache Spark Meetup. Prvo predavanje će se održati 17. maja u Startit Centru sa početkom u 18.30h. Tema ovog meetup-a je Let’s start with Spark. Predavači, Darko i Miloš će predstaviti osnove Spark-a, pokazaće kako i odakle početi sa ovom tehnologijom. Pričaćemo i  o okruženjima za razvoj Spark aplikacija, uz pomoć kojih je … Pročitaj više

Prediktivna Analitika nad Velikim Podacima – Osnova Personalizovane Medicine

U Utorak, 10.5.2016. Milan Vukićević (Fakultet Organizacionih Nauka, Univerziteta u Beogradu) će održati predavanje na temu “ Prediktivna Analitika nad Velikim Podacima – Osnova Personalizovane Medicine“. Predavanje će biti održano u 18:00 u sali 105. Prediktivna analitika nad Velikim Podacima je prepoznata kao  jedan od glavnih faktora razvoja medicine od Reaktivne do Personalizovane, Prediktivne i Preventivne.  Tome je doprineo trend rasta broja pacijenata od hroničnih i teških bolesti sa jedne strane i eksponencijalni rast raspoloživih podataka i razvoj skalabilnih prediktivnih metoda sa druge strane. Međutim i pored ogromnog potencijala, jako mali broj razvijenih modela postižu zadovoljavajući nivo prediktivnih performansi. Ovo dovodi do toga da se potencijal … Pročitaj više

Uvod u R za Data Science: Selekcija i početak rada

Pošto su se Branko Kovač i Goran S. Milovanović suočili sa 260 (rečima: dvesta i šezdeset) mahom odličnih kandidata za kurs Uvod u R za Data Science, tek juče su uspeli da završe težak i nezahvalan posao selekcije polaznika. Kapacitet kursa je 15 polaznika. Branko i Goran su sve prijave za kurs ocenili nezavisno i onda kroz zajedničku diskusiju o najbolje rangiranim kandidatima odabrali grupu koja će početi sa radom u Startitu u četvrtak, 28. aprila, u 19h. Svi polaznici kursa su dobili e-mail na koji treba da odgovore do utorka, 26. aprila u 12h i potvrde svoje učešće. Ko … Pročitaj više