Kurzy Big Data Hadoop and Spark Developer
Školení Big Data Hadoop and Spark Developer poskytované iLEARN
Dostupnost a ceny kurzů Big Data Hadoop and Spark Developer
Doporučené produkty
V této prezentaci najdete výběr školicích kurzů a zkoušek v kontextu Big Data Hadoop and Spark Developer .
Pokud kurz nebo zkoušku, o kterou máte zájem, nevidíte, kontaktujte nás.
VÝVOJÁŘ VELKÝCH DAT HADOOP A SPARK
Svět se stává stále více digitálním a význam velkých dat a datové analytiky bude v příštích letech dále růst. Volba povolání v oblasti velkých dat a analytiky může být právě to, co jste se snažili najít, abyste splnili svá kariérní očekávání.
Školení Big Data Hadoop vásnaučí koncepty frameworku Hadoop, jeho tvorbu v prostředí clusteru a připraví vás na certifikaci CCA175 Big Data společnosti Cloudera.
CERTIFIKACE PRO VÝVOJÁŘE V OBLASTI BIG DATA HADOOP A SPARK
Není k dispozici žádná zkouška, ale pro získání certifikátu musíte absolvovat 85 % kurzu, jeden projekt a jeden simulační test s minimálním výsledkem 80 %.
KURZ BIG DATA HADOOP AND SPARK DEVELOPER
V tomto kurzu Big Data Hadoop se seznámíte s rámcem pro zpracování velkých dat pomocí systémů Hadoop a Spark, včetně HDFS, YARN a MapReduce. Kurz se bude zabývat také technologiemi Pig, Hive a Impala pro zpracování a analýzu velkých datových sad uložených v HDFS a využitím Sqoop a Flume pro příjem dat.
Bude vám ukázáno zpracování dat v reálném čase pomocí Sparku, včetně funkčního programování ve Sparku, implementace aplikací Spark, pochopení paralelního zpracování ve Sparku a použití optimalizačních technik Spark RDD. Seznámíte se také s různými interaktivními algoritmy ve Sparku a budete používat Spark SQL pro vytváření, transformaci a dotazování datových formulářů.
Nakonec budete muset realizovat reálné průmyslové projekty s využitím CloudLabu v oblastech bankovnictví, telekomunikací, sociálních médií, pojišťovnictví a elektronického obchodu.
Zde níže si můžete přečíst list kurzu s informacemi o Big Data Hadoop and Spark Developer.
Objectives
Na konci kurzu budete schopni porozumět:
- Různé součásti ekosystému Hadoop, jako jsou Hadoop 2.7, Yarn, MapReduce, Pig, Hive, Impala, HBase, Sqoop, Flume a Apache Spark
- Distribuovaný souborový systém Hadoop (HDFS) a architektura YARN
- MapReduce a jeho vlastnosti a osvojení si pokročilých konceptů MapReduce
- Různé typy souborových formátů, schéma Avro, použití Avro s Hive a Sqoop a vývoj schématu
- Flume, architektura Flume, zdroje, flume sinks, kanály a konfigurace flume
- HBase, její architektura a ukládání dat a naučte se rozdíl mezi HBase a RDBMS
- Podrobně o odolných distribučních datových sadách (RDD)
- Běžné případy použití Sparku a různé interaktivní algoritmy
Budete také umět:
- Přijímat data pomocí Sqoop a Flume
- Vytvářet databáze a tabulky v systémech Hive a Impala, porozumět HBase a používat systémy Hive a Impala k rozdělování dat
- Získat praktické znalosti o Pig a jeho součástech
- Provádět funkční programování ve Sparku a implementovat a vytvářet Sparkové aplikace
- Získat hluboké znalosti o paralelním zpracování ve Sparku a optimalizačních technikách Spark RDD
- Vytvářet, transformovat a dotazovat se na datové rámce pomocí Spark SQL
Who it is aimed at
Kariérní příležitosti v oblasti velkých dat jsou na vzestupu a Hadoop se rychle stává nezbytnou technologií v architektuře velkých dat. Školení o velkých objemech dat je vhodné pro odborníky v oblasti IT, správy dat a analytiky, včetně:
- Vývojáře a architekty softwaru
- Odborníky na analytiku
- Seniorní IT profesionály
- Odborníci na testování a mainframe
- Odborníci na správu dat
- Odborníci na business intelligence
- Projektoví manažeři
- Začínající datoví vědci
- Absolventi, kteří chtějí vybudovat kariéru v oblasti analýzy velkých dat
Contents
Kurz zahrnuje následující témata:
- Úvod do kurzu
- Lekce 1 - Úvod do velkých dat a ekosystému Hadoop
- Lekce 2 - HDFS a YARN
- Lekce 3 - MapReduce a Sqoop
- Lekce 4 - Základy Hive a Impala
- Lekce 5 - Práce s Hive a Impala
- Lekce 6 - Typy datových formátů
- Lekce 7 - Pokročilý koncept Hive a rozdělování datových souborů
- Lekce 8 - Apache Flume a HBase
- Lekce 9 - Pig
- Lekce 10 - Základy Apache Spark
- Lekce 11 - RDD ve Sparku
- Lekce 12 - Implementace aplikací Spark
- Lekce 13 - Paralelní zpracování ve Sparku
- Lekce 14 - Techniky optimalizace RDD ve Sparku
- Lekce 15 - Algoritmus Spark
- Lekce 16 - Spark SQL
- BEZPLATNÝ KURZ - Apache Kafka
- BEZPLATNÝ KURZ - Jádro Javy
Prerequisites
Pro tento kurz nejsou stanoveny žádné předběžné podmínky. Je však výhodné mít určité znalosti jazyka Core Java a SQL.Pokud potřebujete oprášit své znalosti jazyka Core Java, nabízíme bezplatný samostudijní Online kurz "Java essentials for Hadoop".
Duration
Doba trváníOnline kurzu:
- přístupk platformě na 1 rok