Budući da je paket za skladištenje podataka izgrađen na vrhu Hadoopa, Apache Hive sve se više koristi za analizu podataka, rudarenje podataka i prediktivno modeliranje. Organizacije traže profesionalce koji se čvrsto drže . U ovom postu pogledajmo kako pokrenuti skripte za košnice. Općenito, skripte koristimo za istodobno izvršavanje niza izjava. Skripte za košnice koriste se uglavnom na isti način. Smanjit će vrijeme i trud koji ulažemo u ručno pisanje i izvršavanje svake naredbe.
Skripte za košnice podržane su u verzijama Hive 0.10.0 i novijim. Kako je verzija Hive 0.90 instalirana u CDH3, ne možemo pokretati skripte Hive u CDH3. Možete isprobati korake u nastavku u CDH4 jer je u njima instalirana verzija Hive 0.10.0. Jeste li svjesni kako stvoriti skriptu za košnice? Ako nije, kliknite da se dobije više pojašnjenja.
Sada, pogledajmo kako napisati skripte u Hive i pokrenuti ih u CDH4:
Korak 1: Pisanje skripte za košnicu.
Da biste napisali skriptu za košnice, datoteku treba spremiti s nastavkom .sql. Otvorite terminal u vašoj distribuciji Cloudera CDH4 i dajte sljedeću naredbu za stvaranje skripte za košnice.
Naredba: sudo gedit uzorak.sql
Izvršenjem gornje naredbe otvorit će datoteku sa popisom svih naredbi Hive-a koje je potrebno izvršiti.
U ovoj skripti stvorit će se tablica, opisati i učitati i preuzeti podaci iz tablice.
1. Stvaranje tablice u košnici:
Naredba: stvoriti tablični proizvod (productid: int, naziv proizvoda: string, cijena: float, kategorija: string) redovi oblikovati polja razdvojena završenima sa „,“
Ovdje je proizvod naziv tablice, a {productid, naziv proizvoda, cijena, kategorija} su stupci ove tablice.
Polja završena s „,“ označavaju da su stupci u ulaznoj datoteci odvojeni simbolom „,“.
Prema zadanim postavkama zapisi u ulaznoj datoteci odvojeni su novim redom.
2. Opisivanje tablice:
Naredba: opisati proizvod
3. Učitavanje podataka u tablicu.
Da bismo prvo učitali podatke u tablicu, moramo stvoriti ulaznu datoteku koja sadrži zapise koje treba umetnuti u tablicu.
Stvorimo ulaznu datoteku.
Naredba: sudo gedit input.txt
Uredite sadržaj datoteke kako je prikazano na slici.
4. Dohvaćanje podataka:
Za dohvaćanje podataka koristi se naredba select.
Naredba: Odaberite * iz proizvoda
Gornja naredba koristi se za dohvaćanje vrijednosti svih stupaca prisutnih u tablici. Skripta bi trebala biti takva kao što je prikazano na donjoj slici.
Sad smo završili s pisanjem skripte Hive. Datoteka sample.sql sada se može spremiti.
Korak 2: Pokretanje skripte za košnice
Slijedi naredba za pokretanje skripte Hive:
Naredba: košnica –f /home/cloudera/sample.sql
Tijekom izvršavanja skripte, pripazite da je prisutan čitav put do lokacije datoteke skripte.
Vidimo da se sve naredbe uspješno izvršavaju.
Tako se pokreću i izvršavaju Hive skripte u CDH4.
Hiveop je kritična komponenta Hadoopa i vaša stručnost u Hiveu može vam stvoriti najbolje plaćene Hadoop poslove! Edureka ima posebno kurirani tečaj Hadoop-a koji vam pomaže svladati koncepte kao što su MapReduce, pređa, svinja, košnica, HBase, Oozie, Flume i Sqoop. Kliknite gumb u nastavku da biste započeli.
Imate pitanje za nas? Molimo navedite ih u odjeljku za komentare i javit ćemo vam se.
Vezane objave:
python pretvoriti broj u binarni