Svladao Hadoop? Vrijeme je za početak rada s Apache Sparkom



Ovaj post na blogu objašnjava zašto morate započeti s Apache Sparkom nakon Hadoopa i zašto učenje Sparka nakon svladavanja hadoopa može učiniti čuda za vašu karijeru!

Hadoop, kao što svi znamo, dječak je s velikim posterima. Kao programski okvir sposoban za obradu slonskih proporcija podataka, Hadoop se probio na vrh popisa CIO modnih riječi.





Međutim, neviđeni porast stoga u memoriji uveo je ekosustav velikih podataka u novu alternativu za analitiku. MapReduce način analitike zamjenjuje se novim pristupom koji omogućava analitiku kako u okviru Hadoop-a tako i izvan njega. Apache Spark svježe je novo lice analitike velikih podataka.

Zaljubljenici u velike podatke certificirali su Apache Spark kao najvrući motor za izračunavanje podataka za velike podatke na svijetu. Brzo izbacuje MapReduce i Javu s njihovih položaja, a trendovi poslova odražavaju ovu promjenu. Prema istraživanju koje je proveo TypeSafe, 71% globalnih programera Jave trenutno procjenjuje ili istražuje oko Sparka, a 35% njih već ga je počelo koristiti. Stručnjaci za Spark trenutno su traženi, a sljedećih tjedana očekuje se da će samo broj radnih mjesta povezanih s Sparkom proći kroz krov.



Pa, što je to zbog Apache Sparka zbog kojeg se pojavljuje na vrhu svakog popisa obaveza CIO-a?

Evo nekoliko zanimljivih značajki Apache Sparka:

  • Hadoop integracija - Spark može raditi s datotekama pohranjenim u HDFS-u.
  • Sparkova interaktivna školjka - Spark je napisan na Scali i ima svoju verziju tumača Scala.
  • Spark’s Analytic Suite - Spark dolazi s alatima za interaktivnu analizu upita, veliku obradu i analizu grafova te analizu u stvarnom vremenu.
  • Otporni distribuirani skupovi podataka (RDD) - RDD-ovi su distribuirani objekti koji se mogu predmemorirati u memoriji, preko klastera računalnih čvorova. Oni su primarni podatkovni objekti koji se koriste u Sparku.
  • Distribuirani operateri - Osim MapReduce, postoji još mnogo operatora koje se mogu koristiti na RDD-ima.

Organizacije poput NASA-e, Yahoo-a i Adobe-a obvezale su se na Spark. To je ono što John Tripier, Saveznici i voditelj ekosustava u Databricks-u moraju reći: „Usvajanje Apache Sparka od strane velikih i malih poduzeća raste nevjerojatnom brzinom u širokom spektru industrija, a potražnja za programerima s certificiranom stručnošću brzo je slijedeći odijelo «. Nikad nije bilo bolje vrijeme za Learn Spark ako imate pozadinu u Hadoopu.



kako koristiti br u html - u

Edureka je posebno kurirala tečaj Apache Spark & ​​Scala, koji su zajedno kreirali stručnjaci iz stvarnog života. Za diferencirano iskustvo e-učenja uživo uz projekte koji su relevantni za industriju, pogledajte naš tečaj. Nove serije počinju uskoro, pa pogledajte tečaj ovdje: .

Imate pitanje za nas? Molimo spomenite to u odjeljku za komentare i javit ćemo vam se.

Vezane objave:

Apache Spark vs Hadoop MapReduce