Data Pipeline Monitoring

Post-Summit Databricks upgrades veranderen hoe je jobs falen — je alerts weten dat nog niet

Data+AI Summit 2026 introduceerde serverless auto-optimization, Lakeflow Jobs rebranding en nieuwe identity controls. Elk van die veranderingen verschuift hoe failures aan de oppervlakte komen, en je huidige monitoring is gebouwd voor de oude patronen.

Je Databricks job slaagde voor elke test en mislukte toch om 3 uur ’s nachts

De Databricks community viert indrukwekkende builds. Production clusters interesseert het niet hoe slim je notebook was — het enige wat telt is of je spot instances lang genoeg hebben overleefd om de job af te ronden.

Databricks valt uren weg en niemand krijgt een foutmelding

Een Databricks-storing die zichzelf in drie uur oplost, breekt toch elke pipeline die in dat tijdvenster gepland stond. Het probleem is niet de storing zelf, maar dat niets je heeft verteld dat het heeft plaatsgevonden.

15 juni 2026→

Power BI's PDF connector parseert je bestand één keer. Daarna breekt hij bij elke structuurwijziging.

De PDF connector in Power Query werkt prima tijdens development. Hij faalt bij scheduled refresh, op het moment dat niemand toekijkt terwijl de column mappings verdwijnen.

1 juni 2026→

Je afwijkingsvisual in Power BI liegt alleen als de refresh stilletjes mislukt

Custom visuals zoals PBIGenie's Hammerhead maken actual-versus-budget vergelijkingen leesbaar. Ze maken de onderliggende data nog niet betrouwbaar.

25 mei 2026→

AI-agents genereren queries die je pipeline monitoring niet kan traceren

Copilot schrijft een DAX-query die je dataset refresh laat time-outen. Het error log zegt timeout. Het zegt niet waarom die query überhaupt bestond.

Databricks Lakebase introduceert een nieuw failure surface dat je pipeline monitoring mist

Synced tables, scale-to-zero session drops en metrics die nul rapporteren terwijl de data er nog is. Lakebase introduceert failure modes die niet aansluiten op je bestaande Databricks monitoring.

Databricks job failures laten geen sporen achter, tenzij je die zelf aanlegt

Een Databricks job mislukt om 03:00 uur. Het cluster is beëindigd. De driver log is overschreven. Het downstream dbt model is gewoon uitgevoerd, op de data van gisteren. Zo bouw je het audit trail dat Databricks standaard niet geeft.

Databricks Snapshot Connectors retourneren verouderde gegevens zonder je hiervan op de hoogte te stellen.

Query-gebaseerde connectoren in Databricks zijn afhankelijk van Delta Lake-snapshots die ongemerkt kunnen verouderen, waardoor downstream-gebruikers gegevens lezen die er actueel uitzien, maar dat niet zijn.

Data Observability9 min lezen

Data Observability10 min

Power BI waarschuwingen: wat de standaardwaarschuwingsfunctie wel en niet kan.

Je hebt een melding ingesteld voor je Power BI omzetkaart. Drie weken later gaat de pipeline kapot, geeft de kaart het cijfer van gisteren weer en krijgt niemand een melding.

10 mei 2026→

Data Observability11 min

Fabric Capaciteit Statistieken Uitgelegd: Waar moet je op letten voordat je wordt afgeremd?

Je Fabric capaciteit bereikte vanochtend om 06:12 uur 100% benutting. De app Capaciteitsstatistieken zal dit pas over 15 minuten weergeven. Tegen die tijd zijn interactieve zoekopdrachten al vertraagd.

10 mei 2026→

Data Observability11 min

Monitoring van Microsoft Fabric: Wat native tools missen en hoe je die hiaten kunt opvullen

Je exemplaar van Lakehouse gaf een groene melding. De bezettingsgraad bedraagt 84%. Direct Lake heeft het rapport op tijd aangeleverd. De cijfers kloppen nog steeds niet en wegen €1,4 miljoen niet.

9 mei 2026→

Data Observability Tool: 5 mogelijkheden die de hype van de daadwerkelijke hulp onderscheiden

Leveranciers noemen vrijwel alles een observatietool. Dit zijn de vijf functionaliteiten die bepalen of een tool je team echt helpt of dat het gewoon weer een dashboard is dat je kunt negeren.

Data Observability8 min lezen

Azure Monitor alerts: wat het wel ziet, wat het mist en wat je daarna doet

Azure Monitor is uitstekend in één ding: het laat je weten wanneer het CPU-gebruik stijgt. De problemen die datateams 's nachts wakker maken, leven in de gaten tussen wat het bewaakt en wat de business ziet.

Data Observability9 min lezen

Gegevensmonitoringsysteem: wat het is, wat het niet is en hoe je er een bouwt die werkt.

De meeste systemen voor datamonitoring bestaan uit een Slack-kanaal, een paar cronjobs en een flinke dosis hoop. De teams die betrouwbare data leveren, zijn de teams die de vier onderstaande lagen bouwen – in deze volgorde.

Data Observability8 min lezen

Hulpmiddelen voor datakwaliteitsmonitoring: wat ze detecteren, wat ze missen en hoe je er een kiest.

Een tool voor het bewaken van de datakwaliteit laat je weten wanneer een kolom een door jou opgestelde regel overtreedt. Het is de goedkoopste en snelste verbetering die de meeste datateams kunnen doorvoeren. Maar hier houden de meeste teams het bij, en daar beginnen de problemen.

Data Observability7 min

Data-observabilityplatform voor de Microsoft Data Stack

Power BI meldt dat de refresh is geslaagd. ADF meldt dat de pipeline is uitgevoerd. Databricks toont alle voltooide taken. je gebruikers bekijken de cijfers van gisteren.

6 mei 2026→

Beste data observability tools en platforms in 2026 (vergeleken)

De meeste vergelijkingen missen de vraag die ertoe doet: dekt het platform daadwerkelijk jouw stack?

6 mei 2026→

Wat is een data-observability platform? (En waarom je moderne data-infrastructuur er een nodig heeft)

Je dbt-taak is voltooid. Je ADF-pipeline is uitgevoerd. Je Power BI dashboard toont de cijfers van vorige week. Niemand heeft een melding ontvangen.

5 mei 2026→

Data Observability10 min

Microsoft Fabric SLA-monitoring: Waarom je waarschuwingsarchitectuur het begeeft voordat je pipeline dat doet

Fabric biedt drie niveaus van pipeline-waarschuwingen: op activiteitsniveau, item niveau en werkruimteniveau. Geen van deze niveaus beantwoordt echter van nature de vraag "Is het bestand op tijd aangekomen?".

Data Observability14 min

Gegevensobservatie voor de Microsoft-stack: Power BI, ADF, Databricks, dbt en Fabric

Vijf faallagen, geen enkele standaardtool die ze allemaal afdekt, en een correlatieprobleem waardoor elk incident op drie lijkt.

Power BI monitoring voorbij refreshes: wat een data observability tool écht bewaakt

Je refresh zegt succeeded. Je gebruikers zien verkeerde data. Dit zijn de vier signalen die een data observability tool bewaakt en die de meeste Power BI-monitoring setups missen.

11 april 2026→

Data Observability7 min

Waarom stille datastoringen meer kosten dan echte uitval

Een mislukte refresh meldt zich. Onjuist geladen gegevens melden zich niet.

10 april 2026→

5 data observability practices voor Power BI teams (zonder zware tool)

Een praktische checklist voor teams die data-issues willen vangen voordat hun gebruikers ze zien — zonder direct een volledige data observability tool aan te schaffen.

9 april 2026→

Data Lineage

Data Lineage12 min

Data Lineage Tools: een praktische handleiding voor Microsoft Stack teams

Power BI meldt 'refresh geslaagd'. Het rapport toont lege data. Ergens tussen je ADF pipeline en de Fabric lakehouse is een kolom hernoemd. Je kunt niet achterhalen welke van je 32 datasets afhankelijk is van die kolom.

12 mei 2026→

Data Lineage9 min

Wijzigingen in kolomherkomst tijdens compilatie: wat je kunt opsporen vóór productie

De meeste lineage-tools laten zien wat er is gebeurd. Lineage tijdens het compileren laat zien wat er misgaat.

Data Lineage8 min

Kolomherkomst tijdens compilatie detecteert wat grafiekcrawls achteraf missen.

Rocky, een op Rust gebaseerd beheerplatform voor datawarehouses, berekent de kolomherkomst tijdens de compilatie in plaats van na de uitvoering. Dit verschil bepaalt of je een defecte join ontdekt voordat of nadat je stakeholders dat doen.

Data Lineage8 min

Volledige data lineage: van ADF naar Power BI

Zonder een overzicht van je dataketen moet elk onderzoek helemaal opnieuw beginnen.

8 april 2026→

Data Lineage7 min

Datapipelines hebben lineage nodig, geen losse datamonitoring software

Datamonitoringssoftware vertelt je wat er kapot is gegaan. Lineage vertelt je waarom en wat het allemaal meesleurt.

7 april 2026→

Cloud Migratie

Cloud Migratie8 min

Monitoring tijdens cloud migratie: waarom single-environment datamonitoring software tekort schiet

Tijdens migratie bewaak je niet één omgeving — je bewaakt er twee. Veel datamonitoring software is gebouwd om één stack te bewaken, niet twee stacks die naast elkaar draaien.

6 april 2026→

Cloud Migratie8 min

Van SSIS naar ADF naar Fabric: het overzicht behouden

Drie generaties ETL-tools, één datastack — behoud van overzicht, zelfs wanneer de tools voortdurend veranderen.

5 april 2026→

Best Practices

Je Databricks trainingsomgeving werkt prima — productie mislukt op dag één

Zes configuratieverschillen tussen Databricks trainingsworkspaces en productie die job failures veroorzaken zodra je echte pipelines deployed.

DISTINCT op 100 miljoen rijen forceert een volledige shuffle — en geen enkele Spark-configuratie elimineert dat

Globale deduplicatie vereist dat elke rij elke andere overeenkomende rij kan vinden. Dat betekent een volledige shuffle, hoeveel Spark-configuraties je ook aanpast. Dit zijn de alternatieven.

Azure Functions als Fabric REST API middleware: authenticatie, polling en de fouten waar niemand je voor waarschuwt

Microsoft Fabric biedt een volwaardige REST API voor job scheduling, item management en workspace automation. Azure Functions is de voor de hand liggende tussenlaag. Maar token-acquisitie, polling van langlopende operaties en timeouts van het consumption plan creëren failure modes die pas in productie opduiken.

8 juni 2026→

Databricks R-plots verdwijnen zonder foutmelding — het graphics device faalt stilzwijgend

Je R-code wordt foutloos uitgevoerd. De cell is klaar. Het plotgebied is leeg. Databricks vertelt je niet waarom — want vanuit het perspectief van de runtime is er niets fout gegaan.

25 mei 2026→

Je composite model is trager dan DirectQuery alleen — hier is waarom

SharePoint-lijsten importeren in een DirectQuery-model klinkt pragmatisch. De storage engine denkt daar anders over.

Het tabblad 'Databricks Compute' ontbreekt vanwege machtigingen, niet door een bug.

Het tabblad 'Compute' verdwijnt geruisloos wanneer de machtigingen onjuist zijn. Drie instellingen bepalen of je gebruikers het kunnen zien, en geen van deze instellingen geeft een foutmelding.

Databricks-leverancierstoegang: hoe je directe wijzigingen in de werkruimte kunt blokkeren zonder de levering te onderbreken

De consultant van je leverancier heeft op vrijdagmiddag om 16:00 uur per ongeluk een productienotebook overschreven. Zo voorkomt je met behulp van maprechten, service principals en Git-mappen dat dit nogmaals gebeurt.

Databricks kan je Iceberg-tabel niet vinden in Glue — De catalogus configuratie die stilzwijgend mislukt

Er zijn zes Spark-eigenschappen die de verbinding vormen tussen je Databricks-cluster en een Iceberg-tabel die is geregistreerd in AWS Glue. Als er één fout is, krijgt je de foutmelding TABLE_OR_VIEW_NOT_FOUND, zonder enige aanwijzing welke eigenschap de fout heeft veroorzaakt.

Delta MERGE vanuit meerdere brontabellen mislukt omdat UNION ALL niet voldoende is.

Een UNION ALL in de USING-clausule lijkt correct totdat twee brontabellen een rij voor dezelfde sleutel aanleveren. Delta verwerpt de ambiguïteit direct.

Best Practices7 min

PySpark split() verwijdert stilletjes gegevens wanneer je aanname over het scheidingsteken onjuist is.

Het splitsen en ophalen van items werkt perfect met voorbeeldgegevens. Productiestrings bevatten echter spaties aan het einde, ingesloten scheidingstekens en ontbrekende velden, waardoor je kolommen zonder waarschuwing null worden.

Delta MERGE vanuit meerdere brontabellen mislukt wanneer je de deduplicatie overslaat.

Als je al je bronnen samenvoegt tot één bron, zal Spark je straffen met een foutmelding over een onduidelijke overeenkomst, tenzij je eerst de duplicaten verwijdert.

Best Practices14 min

Vergelijking van Power BI monitoringtools: de koopgids voor 2026

Standaardmeldingen missen de fouten die daadwerkelijk problemen veroorzaken. Hieronder een vergelijking van de belangrijkste Power BI monitoringtools op het gebied van detectie, correlatie en implementatietijd.

Monitoring van ADF-pipeline fouten: waar native waarschuwingen niet meer werken

De native Azure Monitor detecteert fouten in de pipeline. Deze mist echter de copy activity die is geslaagd met een onjuist schema – en dat is nu juist de activiteit waarover je belanghebbenden contact zullen opnemen.

Spark-prestaties: Scala versus Python: waar het er echt toe doet

Het verschil in uitvoeringstijd tussen PySpark en Scala wordt niet gemeten door de meeste benchmarks. De echte kosten zitten hem in de serialisatiegrenzen, het procesmodel van de executor en de plek waar je UDF's worden uitgevoerd.

26 april 2026→

Microsoft Fabric-kopieertaak: Veelvoorkomende fouten die beginners in een productieomgeving tegenkomen

De tutorial toont een groen vinkje. In de productieomgeving is een halfvolle Lakehouse-tabel te zien en vraagt een belanghebbende waarom de omzet van gisteren ontbreekt.

26 april 2026→

Hoe ontvang ik een melding wanneer het refresh van een Power BI dataset mislukt?

Power BI heeft ingebouwde meldingen voor mislukte refreshen. Deze zijn echter niet voldoende voor de meeste productieomgevingen.

Handmatig refresh via planning in Power BI werkt niet: oorzaken en oplossingen

Als handmatige refresh werkt en geplande refresh mislukt, ligt het probleem niet bij de datasource. Het ligt aan de omgeving die de geplande uitvoering gebruikt.

Power BI On-Premises Gateway offline: oorzaken, diagnose en oplossingen

Een gateway die om 02:00 uur offline gaat en om 09:00 uur weer online is, kan tientallen geplande refreshen ongemerkt laten mislukken terwijl iedereen slaapt.

Incident response voor data pipeline failures: een data-pipeline-managementplaybook

Wat doe je als het 3 uur 's nachts is en je belangrijkste dataset net gefaald is in de refresh? Een data-pipeline-managementplaybook voor het moment dat monitoring zijn eerste alert afgeeft.

4 april 2026→

Probleemoplossing

Probleemoplossing8 min

Waarom Databricks Notebooks raw_input weigeren — en hoe je APIs authenticeert zonder terminal

StdinNotImplementedError breekt OAuth flows in Databricks omdat notebooks geen stdin hebben. De oplossing vereist dat je herstructureert hoe je tokens verkrijgt, niet dat je de prompt patcht.

Probleemoplossing8 min

Je Databricks-afstemmingstaak blijft oneindig draaien omdat er geen reden is om hem te stoppen.

Reconciliatietaken vergelijken twee grote datasets rij voor rij. Wanneer die vergelijking nooit convergeert, verbruikt je cluster onnodig veel rekenkracht totdat iemand het opmerkt of het budget op is.

dbt-productiefouten: een referentie-index van mislukte uitvoeringen

Je dbt-run is om 04:12 voltooid. Drie modellen zijn mislukt. Het foutenlogboek meldt 'huidige transactie is afgebroken'. Power BI heeft de gegevens van gisteren al bijgewerkt.

10 mei 2026→

Probleemoplossing12 min

Foutmeldingen in Azure Data Factory-pipelines: een overzicht van veelvoorkomende fouten

Je ADF-pipeline is om 03:42 mislukt met een UserError-code die op zichzelf niets zegt. De Power BI refresh die ervan afhankelijk is, vindt over twee uur plaats. Hier lees je hoe je de foutklasse kunt interpreteren en direct naar de oplossing kunt gaan.

9 mei 2026→

VBA- en ADODB-query's in Power BI verliezen rijen zonder dat dit wordt gemeld.

Je DAX-query retourneert 11.000 rijen in DAX Studio en 6.000 via VBA. Geen foutmelding. Geen waarschuwing. Alleen ontbrekende gegevens die je stakeholders eerder zullen ontdekken dan jij.

VBA-query's tegen Power BI XMLA-endpoints verwijderen rijen zonder waarschuwing.

Je DAX-query levert 11.000 rijen op in DAX Studio, maar slechts 6.000 via VBA. De query zelf is niet fout. De onderliggende ADODB-implementatie is dat wel.

Lakeflow Connect SQL Server: Waarom de database-configuratiestap steeds mislukt

De installatiewizard lijkt eenvoudig. Vier stappen, een paar opgeslagen procedures, klaar. Maar de database-installatie mislukt zonder aan te geven welke voorwaarde daadwerkelijk is gecontroleerd en afgewezen.

27 april 2026→

Probleemoplossing10 min

AADSTS-fouten bij geplande refresh in Power BI: oorzaken en oplossingen

Je geplande refresh is om 06:00 uur mislukt. Het foutbericht bevat een AADSTS-code. Hier lees je wat elke code betekent.

Foutmeldingen in Power BI Gateway: uitleg van DM_GWPipeline-codes

Een DM_GWPipeline-fout betekent dat de gateway een deel van het probleem is. Hier lees je hoe je kunt achterhalen welk deel precies.

ADF-pipelinetoegangsfouten: Oplossingen voor 'Toegang geweigerd', '401' en '403'.

De verbindingstest slaagt. De pipeline run mislukt met foutcode 403. Dat zijn niet dezelfde dingen.

Databricks-taakfouten: OOM, gegevensscheefheid en DRIVER_NOT_RESPONDING

DRIVER_NOT_RESPONDING is een symptoom. De oorzaak is bijna altijd geheugenoverbelasting of een GC-pauze. Hier lees je hoe je de oorzaak kunt opsporen en het probleem kunt oplossen.

Fouten bij het uitvoeren van dbt in een productieomgeving: Toestemmingsfouten, SQL-fouten en incrementele afwijkingen.

Het model werkt lokaal. De implementatie in productie mislukt. Het verschil zit hem bijna altijd in machtigingen, inloggegevens of de SQL-dialect.