Hadoop, kao što svi znamo, dječak je s velikim posterima. Kao programski okvir sposoban za obradu slonskih proporcija podataka, Hadoop se probio na vrh popisa CIO modnih riječi.
Međutim, neviđeni porast stoga u memoriji uveo je ekosustav velikih podataka u novu alternativu za analitiku. MapReduce način analitike zamjenjuje se novim pristupom koji omogućava analitiku kako u okviru Hadoop-a tako i izvan njega. Apache Spark svježe je novo lice analitike velikih podataka.
Zaljubljenici u velike podatke certificirali su Apache Spark kao najvrući motor za izračunavanje podataka za velike podatke na svijetu. Brzo izbacuje MapReduce i Javu s njihovih položaja, a trendovi poslova odražavaju ovu promjenu. Prema istraživanju koje je proveo TypeSafe, 71% globalnih programera Jave trenutno procjenjuje ili istražuje oko Sparka, a 35% njih već ga je počelo koristiti. Stručnjaci za Spark trenutno su traženi, a sljedećih tjedana očekuje se da će samo broj radnih mjesta povezanih s Sparkom proći kroz krov.
Pa, što je to zbog Apache Sparka zbog kojeg se pojavljuje na vrhu svakog popisa obaveza CIO-a?
Evo nekoliko zanimljivih značajki Apache Sparka:
- Hadoop integracija - Spark može raditi s datotekama pohranjenim u HDFS-u.
- Sparkova interaktivna školjka - Spark je napisan na Scali i ima svoju verziju tumača Scala.
- Spark’s Analytic Suite - Spark dolazi s alatima za interaktivnu analizu upita, veliku obradu i analizu grafova te analizu u stvarnom vremenu.
- Otporni distribuirani skupovi podataka (RDD) - RDD-ovi su distribuirani objekti koji se mogu predmemorirati u memoriji, preko klastera računalnih čvorova. Oni su primarni podatkovni objekti koji se koriste u Sparku.
- Distribuirani operateri - Osim MapReduce, postoji još mnogo operatora koje se mogu koristiti na RDD-ima.
Organizacije poput NASA-e, Yahoo-a i Adobe-a obvezale su se na Spark. To je ono što John Tripier, Saveznici i voditelj ekosustava u Databricks-u moraju reći: „Usvajanje Apache Sparka od strane velikih i malih poduzeća raste nevjerojatnom brzinom u širokom spektru industrija, a potražnja za programerima s certificiranom stručnošću brzo je slijedeći odijelo «. Nikad nije bilo bolje vrijeme za Learn Spark ako imate pozadinu u Hadoopu.
kako koristiti br u html - u
Edureka je posebno kurirala tečaj Apache Spark & Scala, koji su zajedno kreirali stručnjaci iz stvarnog života. Za diferencirano iskustvo e-učenja uživo uz projekte koji su relevantni za industriju, pogledajte naš tečaj. Nove serije počinju uskoro, pa pogledajte tečaj ovdje: .
Imate pitanje za nas? Molimo spomenite to u odjeljku za komentare i javit ćemo vam se.
Vezane objave: