Apache Spark en Scala-cursus - Klassikaal

1.995,00 EUR

  • 24 hours
Live Virtueel Klassikaal
In Huis / In Bedrijf
Volgende cohort:May 11, 2026
+ 13 dagen over

Ontgrendel het volledige potentieel van big data door Apache Spark met Scala te beheersen—een van de krachtigste combinaties in moderne data-engineering. Deze praktijkgerichte cursus is ontworpen om je te helpen enorme datasets te verwerken, analyseren en er inzichten uit te halen met behulp van Sparks razendsnelle, in-memory rekenkracht. Je leert hoe je schaalbare datapijplijnen bouwt, realtime-analyses uitvoert en machinelearningmodellen implementeert—terwijl je tegelijkertijd sterke programmeervaardigheden in Scala ontwikkelt.

Belangrijkste functies

Taal

Lesmateriaal in het Engels

Niveau

Niveau: beginner - gemiddeld

24 uur praktijkgerichte training onder begeleiding van een instructeur

Meer dan 50 uur aanbevolen studietijd

3 praktijkgerichte projecten voor toepassing in de echte wereld

Meer dan 70 uur aan quizzen, opdrachten en oefenmateriaal

Praktische labs met real-world datasets

Behandeling van Spark-ecosysteemtools zoals Spark SQL, MLlib en Streaming

Praktische ervaring met programmeren in Scala

Deskundige begeleiding en ondersteuning gedurende de hele cursus

Vraag om datumbevestiging!

Inclusief certificaat van afronding van het programma

Hero

Leerdoelen

Aan het einde van dit programma ben je in staat om:

Big Data-grondbeginselen

Ontwikkel een grondig begrip van bigdataconcepten, belangrijke componenten en frameworks, waaronder de Hadoop-architectuur en de verschillende bedrijfsmodi daarvan.

Inleiding tot Scala

Leer de basisprincipes van programmeren in Scala, inclusief de kernsyntaxis en -concepten die nodig zijn om met Apache Spark te werken.

Inleiding tot Spark

Begrijp de kernprincipes van Apache Spark en hoe je Spark-toepassingen bouwt en uitvoert.

Spark-framework en -implementatie

Verdiep je in het Spark-framework, inclusief de architectuur en de verschillende implementatiebenaderingen.

Spark-gegevensstructuren

Werk met de interne datastructuren van Spark, zoals RDD’s, en gebruik API’s en Scala-functies om data te creëren en te transformeren.

Spark-ecosysteem

Doe praktijkervaring op met belangrijke onderdelen van het Spark-ecosysteem, waaronder Spark SQL, Streaming, MLlib, GraphX en meer.

Hero

Cursusplanning

  1. Inleiding tot Big Data, Hadoop en Spark

    Les 1

    • Big data-concepten en praktijkvoorbeelden
    • Hadoop-ecosysteem en HDFS
    • Clusterarchitectuur en YARN
    • Batchverwerking versus realtime verwerking
    • Inleiding tot Spark en de voordelen ervan
  2. Inleiding tot Scala

    Les 2

    • Scala‑basisprincipes en REPL
    • Variabelen, controlestructuren en functies
    • Collecties (Array, Map, Lijsten, Tuples)
    • Scala in big data-ecosystemen
  3. Objectgeoriënteerd en functioneel programmeren in Scala

    Les 3

    • Klassen, objecten en pakketten
    • Eigenschappen en overerving
    • Concepten van functioneel programmeren
    • Hogere-ordefuncties en foutafhandeling
  4. Scala-collectie-API's

    Les 4

    • Collectietypen en hiërarchieën
    • Prestatiekenmerken
    • Java-interoperabiliteit
    • Scala-implicieten gebruiken
  5. Inleiding tot Spark en RDD's

    Les 5

    • Spark-architectuur en -configuratie
    • Spark-toepassingen en Spark-shell
    • RDD (Resilient Distributed Datasets)
    • Gegevens­transformaties en acties
    • Caching en persistentie
    • Gegevens laden en opslaan
  6. Spark SQL & Gegevensverwerking

    Les 6

    • Spark SQL-architectuur
    • DataFrames en Datasets
    • Werken met JSON en Parquet
    • Door de gebruiker gedefinieerde functies (UDF's)
    • Integratie met Hive
  7. Machine Learning met Spark MLlib

    Les 7

    • Inleiding tot machine learning-concepten
    • MLlib-functies en -hulpmiddelen
    • Gecontroleerde en ongecontroleerde algoritmen
    • Lineaire regressie, beslissingsbomen, random forests
    • Clusteringstechnieken
  8. Streaming met Kafka en Flume

    Les 8

    • Concepten voor realtime gegevensverwerking
    • Kafka-architectuur en clusterconfiguratie
    • Gegevensinname en streamingpijplijnen
Cursus Apache Spark en Scala

Voor wie is dit programma bedoeld?

Vereisten

  • Basiskennis van SQL en databases
  • Bekendheid met programmeren (bij voorkeur in Python, Java of Scala)
  • Basiskennis van Linux/Unix (handig maar niet verplicht)
  • Kennis van Hadoop-concepten is een voordeel, maar geen vereiste



Data Scientists en Data Engineers

Data-analisten en BI-professionals

Softwareontwikkelaars en -architecten

Onderzoeksprofessionals die met data werken

Start nu met de cursus

Verklaringen

Licenties en accreditatie

De cursus wordt aangeboden volgens de Partner Program Agreement en voldoet aan de vereisten van de License Agreement.

Gelijkheidsbeleid

Kandidaten worden aangemoedigd om contact op te nemen met AVC voor begeleiding en ondersteuning tijdens het gehele accommodatieproces.

Veelgestelde vraag

Contact background

Heeft u bedrijfsoplossingen of LMS-integratie nodig

Heb je niet de cursus of het programma gevonden dat geschikt zou zijn voor jouw bedrijf? Heb je een LMS-integratie nodig? Neem contact met ons op! Wij zullen met een passende oplossing komen!