Wat houdt de training in?
In deze eendaagse cursus maak je kennis met het Databricks-platform en het Lakehouse-concept. Je leert hoe Databricks samenwerking tussen data-teams versnelt en hoe je data kunt laden, transformeren en analyseren met notebooks, Delta Lake en Databricks Workflows. Daarnaast ontdek je hoe Databricks naadloos integreert met cloudomgevingen en hoe je het platform inzet voor schaalbare datapijplijnen en analytics, met SQL en Python als belangrijkste werktalen.
Wat je leert
- De kernprincipes van het Databricks Lakehouse-platform.
- Werken met Databricks-notebooks met SQL, Python en Spark.
- Data laden, transformeren en analyseren.
- Delta Lake gebruiken voor versiebeheer, betrouwbaarheid en datakwaliteit.
- Toegang en autorisaties instellen binnen Databricks.
- Processen automatiseren met Databricks Workflows.
Inhoud (globaal programma)
Deel 1 – Introductie tot het Lakehouse
- Concept, architectuur en positionering van Databricks.
Deel 2 – Verkennen van het platform
- Clusters, notebooks en de workspace.
Deel 3 – Hands-on: data laden & transformeren
- Werken met SQL en Python in Databricks.
Deel 4 – Werken met Delta Lake
- ACID-transacties, betrouwbaarheid en datakwaliteit.
Deel 5 – Pipelines & Workflows
- Plannen, automatiseren en uitvoeren van taken.
Deel 6 – Best practices & Q&A
- Integratie, beheer en vervolgstappen.
Voor wie?
- Data engineers en data scientists.
- Data-analisten en BI-professionals.
- Teams die Databricks willen inzetten om dataworkflows te vereenvoudigen en te versnellen.
Voorkennis
- Basiskennis van SQL.
- Basisinzichten in datawarehousing.
- Ervaring met Python is een pluspunt, maar niet vereist.


