R

Prijavi se za kurs Uvod u R za Data Science!

Nauči besplatno osnove baratanja podacima i rad sa osnovnim statističkim modelima u programskom jeziku R sa nama!

Zadovoljstvo nam je da vas obavestimo da Data Science zajednica Srbije u saradnji sa Startitom organizuje besplatan kurs Uvod u programski jezik R za Data Science. Poznavanje ovog programskog jezika predstavlja jednu od najvažnijih pretpostavki za rad u savremenoj Data Science, izazovnoj profesiji koja okuplja istraživače i praktičare u zajednicu za koju se globalno projektuje ogroman broj novih radnih mesta u godinama pred nama. Za učešće se možete prijaviti ovde, gde ćete, osim forme za prijavu, pronaći kratki opis kursa, kao i nekoliko kratkih uslova za učešće. Uvodni kurs počinje 28. aprila 2016, odvijaće se u dvočasovnim sesijama u prostorijama Startita svakog četvrtka, imaće deset sesija, a o prvom sastanku će polaznici biti obavešteni odmah posle završetka selekcije.

Osnovni preduslov za pohađanje kursa Uvod u R za Data Science je da imate iskustvo prethodnog programiranja u ma kom programskom jeziku koji nije isključivo deskriptivne prirode (primeri: PASCAL, C, C++, FORTRAN, BASIC, Java, JavaScript, Python… više ili manje bilo šta preko HTML i CSS). Preduslov nije da vaše iskustvo bude profesionalno niti elaborirano na bilo koji drugi način: u suštini, ako ste već upoznati sa strukturama podataka u nekim proceduralnim i/ili objektno orijentisanim programskim jezicima, elementima kontrole toka, funkcijama i sl – slobodno možete da se bacite na učenje programskog jezika R sa nama! Saznajte više ovde gde ćete naći i kratak upitnik koji će vam pomoći da odlučite da li bi vam ovaj kurs bio interesantan.

Kurs će držati Branko Kovač, Data Analyst u CUBE Risk Management Solutions i jedan od osnivača Data Science zajednice, i Dr Goran S. Milovanović, Data Scientist, DiploFoundation. Polaznici će sa Brankom proći važne osnove programiranja u R-u, dok će sa Goranom raditi na primeni osnovnih statističkih modela u R kroz studije slučaja sa konkretnim projektnim zadacima, što bliže pitanjima neposredne primene.

Za učešće se možete prijaviti ovde, gde ćete, osim forme za prijavu, pronaći kratki opis kursa, kao i nekoliko kratkih uslova za učešće. Uvodni kurs počinje 28. aprila 2016, odvijaće se u dvočasovnim sesijama u prostorijama Startita svakog četvrtka, imaće deset sesija, a o prvom sastanku će polaznici biti obavešteni odmah posle završetka selekcije.

Pridružite nam se da zavrtimo R zajednicu kod nas zajedno!

Pregled kursa

  • Uvod u programski jezik R: strukture podataka i osnove kontrole toka.

Ilustrativni pregled programskog jezika R na primerima. Upoznavanje sa radom u RStudio razvojnom okruženju. Šta sve to R može i kako ga naterati da izvede najjednostavnije trikove koje ćemo vući u Data Science? Šta je to CRAN repozitorijum R paketa, šta su uopšte R paketi i kako se instaliraju.

  • Vektori, matrice, i liste u R.

R je vektorski programski jezik, što znači da u R programiranju treba maksimalno da iskoristimo mogućnost lake i brze manipulacije vektorima i matricama. S druge strane, mnogo rada u R je bazirano na upotrebi lista. Naučićemo osnove baratanja sa ovim strukturama podataka.

  • Data frame tip, faktori, i objekti u R.

Data frame nije najjednostavniji tip podataka u R, ali za veći broj R paketa za analizu i vizuelizacije on predstavlja polaznu strukturu na koju se primenjuju bitne funkcije. Slično, faktori u R su ponekad čvrsto vezani za logiku određenih statističkih analiza i vizuelizacija. Konačno, R je objektno-orijentisan programski jezik: dakle, naučićemo više i o objektima.

  • Staviti sve to u pogon: strukture podataka + kontrola toka. Funkcije u R.

Sada već programiramo u R, učimo kako se formiraju i pozivaju funkcije, struktuiramo naš kod i spremamo se na rad u različitim R paketima. Kontrola toka je sigurno u našim rukama, lako baratamo svim osnovnim tipovima podataka kojima R raspolaže.

  • Struktuiranje podataka: manipulacija stringovima u R.

Jedna od stvari po kojima se savremena Data Science razlikuje od prethodnog rada u različitim oblastima analitike podataka je to što smo danas često primorani da se bavimo struktuiranjem nestruktuiranih ili polustruktuiranih informacija, najčešće prikupljenih sa interneta. To mahom znači puno, puno manipulacije stringovima. Uvod u upotrebu R kapaciteta i paketa za rad sa stringovima. Priča za sebe: regularni izrazi u R.

  • Korelacije i jednostavna linearna regresija u R

Na osnovu vrednosti jedne varijable, pod određenim uslovima koji moraju biti zadovoljeni, u stanju smo da predviđamo vrednost neke druge varijable. Na osnovu nečije težine, makar i neprecizno, možemo da predvidimo koliko je ta osoba visoka, ili koji broj cipela nosi. U tržišnim istraživanjima, neko može da nam naruči da na osnovu nekog raspoloživog znanja o kupcima određenog proizvoda predvidimo kako će se on prodavati. Učimo osnovni model ovakve vrste prediktivnog rada u R, model jednostavne linearne regresije.

  • Multipla regresija u R

Na osnovu poznavanja vrednosti više varijabli, pod određenim uslovima koji moraju biti zadovoljeni, u stanju smo da predviđamo vrednost neke varijable koja nije među njima. Učimo model multipla regresione analize u kome ćemo već upoznati većinu problema sa kojima se suočavamo u prediktivnom poslu u Data Science. Kako da pokušamo da predvidimo ponašanje nekoga ili nečega na osnovu prikupljenog velikog broja varijabli tj. osobina te osobe ili tog fenomena? Multipla regresija je verovatno najjednostavniji odgovor na ovo veoma komplikovano pitanje.

  • Proširenje linearnog modela u zadatku klasifikacije: binomijalna i multinomijalna logistička regresija u R

Na osnovu poznavanja toga u koju od dve kategorije neka stvar spada, pokušavamo da kažemo što više možemo o tome zbog kojih njenih osobina – kojih može biti i veliki broj – se ona nalazi baš tamo. Pošto se rešimo problema binomijalne logističke regresije u R, sažetog u prvoj rečenici, prelazimo na složeniji problem multinomijalne logističke regresije: na osnovu znanja o tome iz koje od više raspoloživih kategorija dolazi neka stvar, pokušavamo da zaključimo zbog kojih njenih osobina se ona našla baš tamo? Interesantno, jednom kada znamo koje osobine vode u koju kategoriju stvari, mi možemo da rešimo klasifikacije prethodno neklasifikovanih objekata, što je jedan od najčešćih poslova koje će Data Scientist imati.

  • Redukcija dimenzionalnosti: multidimenzionalno skaliranje u R

Postoji veliki, veliki broj osobina kojima ste opisali određeni skup objekata. Neko traži od vas da napravite pregled te vaše analize i da rezultate prikažete vizuelno što jasnije. Avaj, vi ste problem opisali preko 100 karakteristika, a ljudski vizuelni sistem trpi dve do tri dimenzije: šta sad? Redukcija dimenzionalnosti je posao sa kojim se u Data Science srećemo skoro svaki dan: kako svesti obilje karakteristika stvari na manji broj karakterstika, a izgubiti pri tom što je manje moguće korisnih informacija? Razmatramo tek jedno moguće rešenje primenom multidimenzionalnog skaliranja u programskom jeziku R.

  • Neparametrijski statistički modeli u R

Popularnost neparametrijskih statističkih metoda već duže od deceniju dobija na zamahu, zahvaljući pre svega tome što se odlikuju pretpostavkama mnogo “jeftinijim” od uobičajenih. Završavamo sa pregledom osnovnih neparametrijskih metoda u R: kada ih i zašto koristimo, i kako?

26 replies
  1. Saša Vujović
    Saša Vujović says:

    Poštovani,

    Želeo bih da se prijavim na kurs “Uvod u R za Data Science”.

    Srdačan pozdrav

    Saša Vujović

  2. Nikola Simić
    Nikola Simić says:

    Da li se zna u kom terminu će se odvijati nastava? Zaposlen sam pa bih preferirao popodnevne termine (nakon 17h), ako je to ikako moguće.

    • Branko Kovač
      Branko Kovač says:

      Nikola,

      Kurs će biti u terminu od 19h. Ako imaš još bilo kakvih pitanja, tu sam. Ili me možeš pronaći na Linkedinu, pa pitati tamo.

      Pozdrav,
      Branko

  3. Slađana Cerović
    Slađana Cerović says:

    Bravo, ovo je sjajna inicijativa!

    Možete li mi reći do kada tačno traje kurs – deset nedelja počevši od 28. Aprila?
    Ja planiram da budem van Beograda od 21. Maja do 19. Juna (4 nedelje), pa ne znam ima li smisla da se prijavljujem.

    Hvala i pozdrav,
    Slađana

    • Branko Kovač
      Branko Kovač says:

      Slađana,

      Upravo tako – 10 nedelja sa početkom 28. aprila. U periodu odsustva bi propustila vrlo interesantna predavanja o linearnoj i logističkoj regresiji koja su centralna tema kursa.

      Pozdrav,
      Branko

  4. Mladen
    Mladen says:

    Da li ce biti online stream-a nakon odrzanih predavanja, jer necu moci da dolazim na sva a opet nije prakticno slusati samo neke teme?

  5. Dejan
    Dejan says:

    Samo da pitam, posto sam u komentarima video da ce se sva predavanja odrzavati u Beogradu, da li ce biti mozda neki stream, ili video za nas koji nismo iz BG?
    Mnogo mi je da 10 puta idem iz NS…

    Pozdrav

  6. Stefan
    Stefan says:

    Cao, super inicijativa.
    Hoce li biti stream ili neki upload za nas koji ne mozemo da putujemo za Bg?

  7. Goran S. Milovanović
    Goran S. Milovanović says:

    Da odgovorim na pitanja vezana za termine i stream:

    – termini će biti popodnevni, dakle izvesno posle uobičajenog radnog vremena, najranije od 18h mislim čak 19h ali ostaje da se to tačno precizira;

    – stream/video: ne znam još, moramo da vidimo sa Startitom, Meetup uobičajeno ide tako ali ne znam kolika je komplikacija napraviti to i za kurs Uvod u R za Data Science; potrudićemo se da bude, bez obećanja.

    Pozdrav svima,
    Goran

  8. Boban
    Boban says:

    Sjajna inicijativa. Bilo bi super da bude neki stream za nas koji nismo iz Bg-a

  9. Milos
    Milos says:

    Bilo bi zaista super ako bi mogao neki stream ili na youtube da se okace klipovi za nas koji nismo iz Beograda , inace svaka cast na akciji. Pozdrav !

  10. Branko
    Branko says:

    Ljudi, mora da bude stream, ili bar postavljeni snimci 🙂 Svaka cast za inicijativu i organizaciju! Vreme je i da se Kg ukljuci u tokove 🙂

  11. Ivana
    Ivana says:

    28.04. je dan pred praznike, kad se ide na put pa biste mogli da razmotrite da prvi termin bude 27.04. ili 05.05., da ne bismo gubili prvi cas.

  12. Marija
    Marija says:

    Postovani,

    ja bih se prijavila za kurs ali 28.4 nisam u Beogradu, na ostalim casovima bi bila.
    Da li ima smisla da propustim prvo predavanje?

  13. Goran S. Milovanović
    Goran S. Milovanović says:

    Ćao,

    da pokušam da odgovorim na većinu pitanja u jednom komentaru

    – datum početka kursa je fiksni, ne možemo da ga menjamo
    – ima 190 prijavljenih do sada, a kapacitet je 20 – daćemo sve od sebe da obezbedimo strim (Startit kaže da tu ne bi trebalo da bude problema)
    – u skladu sa vremenom (Branko i ja smo obojica zaposleni a ovo radimo na čisto volonterskim osnovama) pokušaćemo da što bolje predstavimo kurs i materijale za učenje online
    – svakako će biti obezbeđen *neki* vid participacije za ljude koji ne budu mogli da rade sa nama u Startit
    – po svemu sudeći, ovo će biti tek prvi ovakav kurs i tek prvi u nizu sličnih kurseva, pošto je interesovanje – najiskrenije – probilo ama baš sva očekivanja koja smo imali.

    Stay in touch,
    Goran

  14. Stefan
    Stefan says:

    Postovani,

    Da li je prijava sve sto je potrebno, ili ce se vrsiti dodatna selekcija?
    Da li cemo dobiti neko obavestenje na mail i odluku o tome da li da dodjemo 28.04. ili ne?

    Hvala!

    • Branko Kovač
      Branko Kovač says:

      Stefane,

      Prijave traju do 22. aprila. U subotu 23. aprila ćemo uraditi selekciju i obavestiti sve prijavljene o rezultatima. S obzirom na broj prijava i ograničen broj mesta u Startit centru, selekcija je neophodna.

      Pozdrav,
      Branko

  15. Stefan
    Stefan says:

    Pozdrav, da li ste zavrsili selekciju i da li ce i oni koji nisu prosli biti obavesteni o tome posto ja nisam dobio nikakvu povratnu informaciju?

  16. Goran S. Milovanović
    Goran S. Milovanović says:

    Ćao svima,

    selekcija za kurs Uvod u R za Data Science ja završena.

    Kapacitet kursa je 15 polaznika. Branko Kovač i ja smo se suočili sa 260 -i to mahom veoma dobrih – prijava. Molimo vas uzmite u obzir da je zadatak selekcije bio težak za nas.

    Ukoliko ste primljeni u ovu grupu kursa Uvod u R za Data Science, dobili ste od nas e-mail u kome vas obaveštavamo o tome. Neophodno je da na taj e-mail, kao što je navedeno u njemu, odgovorite što pre i obavestite nas da li ste sigurno učesnik kursa, jer ako niste, vaše mesto bismo ustupili sledećem dobrom kandidatu.

    Ukoliko je vaša prijava bila baš veoma interesantna za nas, a nismo mogli da vas primimo u ovu prvu grupu od 15 polaznika, obavestili smo vas mejlom da sledeći put kada budemo u mogućnosti da ovaj kurs organizujemo vi nećete morati da prolazite selekciju, već ćete biti automatski upisani – ako još uvek budete zainteresovani za R, naravno.

    Toliko. Dakle, proverite mailbox. Ostajemo u kontaktu.

    Srdačan pozdrav,

    Goran S. Milovanović,
    DataScientist, DiploFoundation
    Data Science zajednica Srbije

  17. Zlatan
    Zlatan says:

    Pozdrav svima,
    Da li će, kao što je spominjano biti organizovan neki stream za ljude koji nisu prošli selekciju, kako bi mogli da prate ovaj kurs? Hvala unapred.

  18. Branko Kovač
    Branko Kovač says:

    Zlatane,

    Streaminga nema. Pritom, izuzev uvodnog časa, plan nam je da manji deo vremena posvetimo samom predavanju, a da se što više posvetimo praktičnom radu sa polaznicima pomažući im i odgovarajući na pitanja. Iz navedenog razloga smatram i da streaming ne bi bio od naročitog značaja svima onima koji žele da prate kurs na ovaj način.

    Svi materijali će biti redovno objavljivani na posebnoj stranici – http://www.datascience.rs/kurs-r-za-data-science/. Kod koji je korišćen ili će biti korišćen na narednim predavanjima je detaljno iskomentarisan i daje solidnu osnovu za samostalan rad.

    Srdačan pozdrav,
    Branko

Trackbacks & Pingbacks

Comments are closed.