Obrada velikih podataka s Apache Spark & ​​Scala



Apache Spark pojavio se kao sjajan razvoj u obradi velikih podataka.

pl sql tutorial s primjerima

IST: 7:00 - 08:00, 17. listopada’14





PDT: 18:30 - 19:30, 16. listopada ’14

Ograničena mjesta !! Ispunite obrazac s desne strane i rezervirajte svoj termin danas.



Pozdrav svima, provodimo besplatni vebinar na Apache Spark i Scala 18. listopada’14. Naslov webinara je ‘Obrada velikih podataka s Apache Sparkom i Scalom’ . Na ovom webinaru bit će riječi o bitnim temama u vezi s Apache Sparkom i Scalom. Bilo koji upiti ili sumnje mogu se razjasniti tijekom sesije.

Teme koje treba pokriti:

  • Što su veliki podaci?
  • Što je Spark?
  • Zašto Spark?
  • Iskra ekosustav
  • Bilješka o Scali
  • Zašto Scala?
  • Hello Spark - ruke naprijed

Zašto Spark?

Apache Spark je računalni okvir klastera otvorenog koda za klastere Hadoop zajednice. Kvalificiran je za jednog od najboljih mehanizama za analizu i obradu podataka velikih podataka sa svojom nenadmašnom brzinom, lakoćom korištenja i sofisticiranom analitikom. Slijede prednosti i značajke koje Apache Spark čine crossover hitom kako za operativnu tako i za istražnu analitiku:

  • Programi razvijeni preko Sparka rade 100 puta brže od onih razvijenih u Hadoop MapReduceu.
  • Spark sastavlja 80 operatora visoke razine.
  • Spark Streaming omogućuje obradu podataka u stvarnom vremenu.
  • GraphX ​​je knjižnica za grafičke proračune.
  • MLib je knjižnica strojnog učenja za Spark.
  • Primarno napisan na Scali, Spark se može ugraditi u bilo koji operativni sustav zasnovan na JVM-u, a istovremeno se može koristiti i na način REPL (čitanje, procjena, obrada i učitavanje).
  • Ima moćne mogućnosti predmemoriranja i trajanja diska.
  • Spark SQL omogućuje mu stručno rukovanje SQL upitima
  • Apache Spark može se implementirati putem Apache Mesos, Pređe u HDFS-u, HBase, Cassandre ili Spark Cluster Managera (Spark-ov vlastiti klaster manager).
  • Spark simulira Scala-in funkcionalni stil i API za kolekcije, što je velika prednost programerima Scala i Java.

Potreba za Apache Sparkom:

Spark donosi neizmjerne koristi industriji u pogledu brzine, raznolikosti zadataka koje može obavljati, fleksibilnosti, kvalitetne analize podataka, isplativosti itd., Što su potrebe dana. Pruža vrhunska rješenja za analitiku velikih podataka u stvarnom vremenu IT industriji, udovoljavajući rastućoj potražnji kupaca. Analitika u stvarnom vremenu iskorištava poslovne mogućnosti. Njegova kompatibilnost s Hadoop-om olakšava tvrtkama da ga brzo prihvate. Postoji velika potreba za stručnjacima i programerima naučenim od Spark-a, jer je ovo relativno nova tehnologija koja se sve više usvaja.