Hue – Hadoop web interfejs

Hue je open-source web interfejs za Hadoop i njegov ekosistem. Napisan je u Python-u i podržava najčešće alate iz Hadoop ekosistema. Odličan je za one koji žele samo da koriste Hadoop bez da razmišljanja šta se dešava ispod, takođe ako ne želite da koristite komandnu liniju. Ovaj korisnički interfejs je dizajniran tako da objedinjuje sve instalirane alate iz ekosistema. Moram da priznam, dosta je lakše kada vam je sve na jednom mestu i kada ne morate da otvarate više Linux terminala da biste paralelno radili na dve strane. Moj prvi susret sa Hadoop-om je bio preko Hue interfejsa, to me je možda i ohrabrilo da nastavim dalje da istražujem Hadoop. Neko moje zapaženje je da je odlično u početku koristiti Hue, ali treba i pogledati malo šta se dešava ispod, jer je to odličan način da se nauči više. Mada ne treba stvar generalizovati, ako želite da se bavite samo analizom podataka onda je Hue sasvim dovoljan za vas, u slučaju da ste administrator Hadoop klastera ili implementator, to jednostavno nije dovoljno. Isto tako, ako ste Hadoop developer, Hue vam nije dovoljan. Jedna jako lepa stvar je da Hue ima svoj SDK, tako da možete i sami da pšete aplikacije koje će se izvršavati na vrhu Hadoop-a.

U svom radu sa Hadoop-om Hue gotovo i da ne koristim, ali moram da priznam odličan je kao fajl menadžer, HCatalog editor i Hive editor. Za ostale poslove radije se okrećem Linux terminalu. Takođe, Hue ne podržava sve alate. Skoro sam radio sa Apache Flume-om, jednim jako interesantnim alatom o kome ću pisati, on nije podržan u Hue-u. Isto tako, ako je vaš posao i instalacija Hue-a na postojeći Hadoop ekosistem, onda ćete se definitivno odlučiti za alternativu. Možda je to moj pogled na problem, ali uvek se desi da zaboravim nešto da podesim pri instalaciji Hue-a i onda neće potpuno da funkcioniše. Hortonworks uz HDP nudi i svoju verziju Hue-a koja sasvim radi posao, postoji i zvanična verzija koja je pod većim uticajem Cloudera-e. Ta verzija je vizuelno lepša, bar po mom mišljenju, takođe odlična je ako često koristite Sqoop alat.

Hue

Hue

Moj zaključak je da je Hue nekako više naklonjen onima koji se bave analizom podataka, onima koji se više bave Hive-om, SQL-om ili Impalom. Što se tiče pisanja nekog MapReduce koda u Javi ili Pigu definitivno treba koristiti Eclipse, pa terminal. Moram još jednom da napomenem da je Hue odličan kao fajl menadžer, ja ga najčešće za to koristim, kako bih lakše video rezultate rada. Testirao samo mnoge elemente i alate Hadoop-a, ali ovo je nešto što trenutno mislim o upotrebi Hue-a.

Savet je da proučite Hue, da probate, da vidite šta vam odgovara, da radite u njemu, ali definitivno ako želite da što više naučite o Hadoop-u, onda probajte da ne koristite Hue. Ne bih da zvučim kao neko ko obožava Linux terminal, nisam ga čak ni koristio dok nisam počeo da se bavim Hadoop-om. Što više razumete Hadoop, rad iz terminala je dosta moćniji.
Ovo je bio samo kratak pregled šta je Hue, kako sam ga ja video i kako ga koristim. Nisam želeo puno da detaljišem, jer ne koristim Hue nešto preterano puno, ali sam siguran da može da se upotrebi mnogo bolje nego što ja to trenutno radim. Sve u svemu, ovo je jedan dobar alat i može da bude jako koristan. Sledeći tekstovi o interesantnim temama poput Pig, Hive, Sqoop…  Spremite se da hadupujemo zajedno!