Apache Flume

U prethodnom tekstu sam pisao o tome kako uneti podatke u Hadoop klaster, odnosno u HDFS. Nastavljamo tu priču, konkretno u ovom tekstu ću pažnju posvetiti Apache Flume-u. Opisaću alat, ali i dati primere koda koje sam testirao i koristio. Šta je Flume? Apache Flume je distribuiran i izuzetno pouzdan servis za sakupljanje, agregaciju i transport […]

Unos podataka u Hadoop klaster

Pre početka instalacije Hadoop-a isplaniraćete ceo sistem ili možda imate neki test Hadoop sistem. U svakom slučaju, prvo morate da se zapitate koje podatke treba obraditi vaš sistem. Kako je Hadoop jako fleksibilan što se tiče raznolikosti podataka, sledeće na šta treba da obratite pažnju je kako te podatke da prebacite u HDFS. Brzina podataka […]

HBase

Kada se spomene Hadoop, često se postavi pitanje koliko je brz u izvršavanju analize nad nekim podacima. Hadoop nije brz, odnosno sam po sebi ne pruža mogućnost obrade u realnom vremenu. Moram da napomenem da kada se kaže da Hadoop nije brz, ne znači da ga ne treba koristiti, nego treba razmisliti u kom trenutku […]

KATEGORIJE

PRIJAVITE SE NA NAŠU MAILING LISTU