Pregled arhitekture pohrane HBase



Tamo arhitektura HBase Storage sadrži brojne komponente. Pogledajmo funkcije ovih komponenata i znamo kako se zapisuju podaci.

Apache HBase je baza podataka otvorenog koda, distribuirana, nerelacijska baza podataka po uzoru na Googleov Bigtable i napisana na Javi. Pruža mogućnosti slične Bigtableu na vrhu Hadoop-a i HDFS-a (Hadoop Distributed Files System), tj. Pruža otporan način čuvanja velikih količina rijetkih podataka, što je uobičajeno u mnogim slučajevima korištenja velikih podataka. HBase se koristi za pristup velikim podacima za čitanje / pisanje u stvarnom vremenu.





Arhitektura HBase Storage sadrži brojne komponente. Pogledajmo funkcije ovih komponenata i znamo kako se zapisuju podaci.

Datoteke H:



HFiles čini nisku razinu HBaseove arhitekture. HFiles su datoteke za pohranu stvorene za brzo i učinkovito pohranjivanje HBase-ovih podataka.

kako napisati tostring metodu

HMaster:

što je virtualna funkcija java

HMaster je odgovoran dodijeliti regije svakom HRegionServeru kad se HBase pokrene. Odgovorna je za upravljanje svime što se odnosi na redove, tablice i njihove koordinacijske aktivnosti. Hmaster također ima detalje o metapodacima.



Komponente HBase:

HBase ima sljedeće komponente:

  • Tablica - sastoji se od regija
  • Regija - raspon redaka pohranjenih zajedno
  • Regijski poslužitelji - poslužuje jednu ili više regija
  • Glavni poslužitelj - Daemon je odgovoran za upravljanje klasterom HBase

HBase podatke pohranjuje izravno na HDFS i uvelike se oslanja na HDFS-ovu visoku dostupnost i toleranciju na greške.

Arhitektura skladišta HBase:

Arhitektura skladišta HBase

Općenito je da klijent prvo kontaktira čuvara zoološkog vrta kako bi pronašao određeni ključ retka. To čini dohvaćanjem imena poslužitelja od Zookeeper-a. S tim informacijama sada može pitati taj poslužitelj da bi dobio poslužitelj koji sadrži metatabilu. Oba su ova detalja predmemorirana i pogledana samo jednom. I na kraju, može postaviti upit metaserveru i dohvatiti poslužitelj koji ima redak koji klijent traži.

Jednom kada zna u kojoj se regiji nalazi redak, on također pohranjuje ove podatke i izravno kontaktira HRegionServer. Tako s vremenom Klijent ima cjelovite informacije odakle uzima redove bez potrebe za ponovnim upitom metaservera. Kada se otvori HRegion, postavlja instancu Store za svaku HColumnFamily za svaku tablicu. Podaci se zapisuju kada Klijent pošalje zahtjev HRegionServeru koji pruža detalje za odgovarajuću instancu HRegion. Prvi korak je da moramo odlučiti treba li podatke prvo zapisati u 'Write-Ahead-Log' (WAL) predstavljenu hLog klasom. Odluka se temelji na zastavi koju je postavio klijent.
Nakon što se podaci upišu u WAL, oni se stavljaju u MemStore. Istodobno, Memstore se provjerava je li pun i u tom se slučaju traži ispiranje na disk. Tada se podaci upisuju u HFile.

Imate pitanje za nas? Spomenite ih u odjeljku za komentare i javit ćemo vam se.

Vezane objave

kuhar vs ansible vs marioneta

Uvid u arhitekturu HBase