MetricSign
NL|ENStart free →
Blog

Data Pipeline Monitoring

Diepgaande artikelen over data observability, lineage en incidentrespons — voor data engineers die Power BI, ADF, Databricks, Fabric en dbt beheren.

Read in English →
Data Observability20Data Lineage5Cloud Migratie2Best Practices16Probleemoplossing11

Data Observability

Data Observability8 min

Je afwijkingsvisual in Power BI liegt alleen als de refresh stilletjes mislukt

Custom visuals zoals PBIGenie's Hammerhead maken actual-versus-budget vergelijkingen leesbaar. Ze maken de onderliggende data nog niet betrouwbaar.

25 mei 2026
Data Observability9 min

AI-agents genereren queries die je pipeline monitoring niet kan traceren

Copilot schrijft een DAX-query die je dataset refresh laat time-outen. Het error log zegt timeout. Het zegt niet waarom die query überhaupt bestond.

18 mei 2026
Data Observability9 min

Databricks Lakebase introduceert een nieuw failure surface dat je pipeline monitoring mist

Synced tables, scale-to-zero session drops en metrics die nul rapporteren terwijl de data er nog is. Lakebase introduceert failure modes die niet aansluiten op je bestaande Databricks monitoring.

18 mei 2026
Data Observability9 min

Databricks job failures laten geen sporen achter, tenzij je die zelf aanlegt

Een Databricks job mislukt om 03:00 uur. Het cluster is beëindigd. De driver log is overschreven. Het downstream dbt model is gewoon uitgevoerd, op de data van gisteren. Zo bouw je het audit trail dat Databricks standaard niet geeft.

18 mei 2026
Data Observability8 min

Databricks Snapshot Connectors retourneren verouderde gegevens zonder je hiervan op de hoogte te stellen.

Query-gebaseerde connectoren in Databricks zijn afhankelijk van Delta Lake-snapshots die ongemerkt kunnen verouderen, waardoor downstream-gebruikers gegevens lezen die er actueel uitzien, maar dat niet zijn.

11 mei 2026
Data Observability10 min

Power BI waarschuwingen: wat de standaardwaarschuwingsfunctie wel en niet kan.

Je hebt een melding ingesteld voor je Power BI omzetkaart. Drie weken later gaat de pipeline kapot, geeft de kaart het cijfer van gisteren weer en krijgt niemand een melding.

10 mei 2026
Data Observability11 min

Fabric Capaciteit Statistieken Uitgelegd: Waar moet je op letten voordat je wordt afgeremd?

Je Fabric capaciteit bereikte vanochtend om 06:12 uur 100% benutting. De app Capaciteitsstatistieken zal dit pas over 15 minuten weergeven. Tegen die tijd zijn interactieve zoekopdrachten al vertraagd.

10 mei 2026
Data Observability11 min

Monitoring van Microsoft Fabric: Wat native tools missen en hoe je die hiaten kunt opvullen

Je exemplaar van Lakehouse gaf een groene melding. De bezettingsgraad bedraagt 84%. Direct Lake heeft het rapport op tijd aangeleverd. De cijfers kloppen nog steeds niet en wegen €1,4 miljoen niet.

9 mei 2026
Data Observability9 min lezen

Data Observability Tool: 5 mogelijkheden die de hype van de daadwerkelijke hulp onderscheiden

Leveranciers noemen vrijwel alles een observatietool. Dit zijn de vijf functionaliteiten die bepalen of een tool je team echt helpt of dat het gewoon weer een dashboard is dat je kunt negeren.

7 mei 2026
Data Observability8 min lezen

Azure Monitor alerts: wat het wel ziet, wat het mist en wat je daarna doet

Azure Monitor is uitstekend in één ding: het laat je weten wanneer het CPU-gebruik stijgt. De problemen die datateams 's nachts wakker maken, leven in de gaten tussen wat het bewaakt en wat de business ziet.

7 mei 2026
Data Observability9 min lezen

Gegevensmonitoringsysteem: wat het is, wat het niet is en hoe je er een bouwt die werkt.

De meeste systemen voor datamonitoring bestaan uit een Slack-kanaal, een paar cronjobs en een flinke dosis hoop. De teams die betrouwbare data leveren, zijn de teams die de vier onderstaande lagen bouwen – in deze volgorde.

7 mei 2026
Data Observability8 min lezen

Hulpmiddelen voor datakwaliteitsmonitoring: wat ze detecteren, wat ze missen en hoe je er een kiest.

Een tool voor het bewaken van de datakwaliteit laat je weten wanneer een kolom een door jou opgestelde regel overtreedt. Het is de goedkoopste en snelste verbetering die de meeste datateams kunnen doorvoeren. Maar hier houden de meeste teams het bij, en daar beginnen de problemen.

7 mei 2026
Data Observability7 min

Data-observabilityplatform voor de Microsoft Data Stack

Power BI meldt dat de refresh is geslaagd. ADF meldt dat de pipeline is uitgevoerd. Databricks toont alle voltooide taken. je gebruikers bekijken de cijfers van gisteren.

6 mei 2026
Data Observability9 min

Beste data observability tools en platforms in 2026 (vergeleken)

De meeste vergelijkingen missen de vraag die ertoe doet: dekt het platform daadwerkelijk jouw stack?

6 mei 2026
Data Observability9 min

Wat is een data-observability platform? (En waarom je moderne data-infrastructuur er een nodig heeft)

Je dbt-taak is voltooid. Je ADF-pipeline is uitgevoerd. Je Power BI dashboard toont de cijfers van vorige week. Niemand heeft een melding ontvangen.

5 mei 2026
Data Observability10 min

Microsoft Fabric SLA-monitoring: Waarom je waarschuwingsarchitectuur het begeeft voordat je pipeline dat doet

Fabric biedt drie niveaus van pipeline-waarschuwingen: op activiteitsniveau, item niveau en werkruimteniveau. Geen van deze niveaus beantwoordt echter van nature de vraag "Is het bestand op tijd aangekomen?".

4 mei 2026
Data Observability14 min

Gegevensobservatie voor de Microsoft-stack: Power BI, ADF, Databricks, dbt en Fabric

Vijf faallagen, geen enkele standaardtool die ze allemaal afdekt, en een correlatieprobleem waardoor elk incident op drie lijkt.

4 mei 2026
Data Observability8 min

Power BI monitoring voorbij refreshes: wat een data observability tool écht bewaakt

Je refresh zegt succeeded. Je gebruikers zien verkeerde data. Dit zijn de vier signalen die een data observability tool bewaakt en die de meeste Power BI-monitoring setups missen.

11 april 2026
Data Observability7 min

Waarom stille datastoringen meer kosten dan echte uitval

Een mislukte refresh meldt zich. Onjuist geladen gegevens melden zich niet.

10 april 2026
Data Observability9 min

5 data observability practices voor Power BI teams (zonder zware tool)

Een praktische checklist voor teams die data-issues willen vangen voordat hun gebruikers ze zien — zonder direct een volledige data observability tool aan te schaffen.

9 april 2026

Data Lineage

Data Lineage12 min

Data Lineage Tools: een praktische handleiding voor Microsoft Stack teams

Power BI meldt 'refresh geslaagd'. Het rapport toont lege data. Ergens tussen je ADF pipeline en de Fabric lakehouse is een kolom hernoemd. Je kunt niet achterhalen welke van je 32 datasets afhankelijk is van die kolom.

12 mei 2026
Data Lineage9 min

Wijzigingen in kolomherkomst tijdens compilatie: wat je kunt opsporen vóór productie

De meeste lineage-tools laten zien wat er is gebeurd. Lineage tijdens het compileren laat zien wat er misgaat.

4 mei 2026
Data Lineage8 min

Kolomherkomst tijdens compilatie detecteert wat grafiekcrawls achteraf missen.

Rocky, een op Rust gebaseerd beheerplatform voor datawarehouses, berekent de kolomherkomst tijdens de compilatie in plaats van na de uitvoering. Dit verschil bepaalt of je een defecte join ontdekt voordat of nadat je stakeholders dat doen.

4 mei 2026
Data Lineage8 min

Volledige data lineage: van ADF naar Power BI

Zonder een overzicht van je dataketen moet elk onderzoek helemaal opnieuw beginnen.

8 april 2026
Data Lineage7 min

Datapipelines hebben lineage nodig, geen losse datamonitoring software

Datamonitoringssoftware vertelt je wat er kapot is gegaan. Lineage vertelt je waarom en wat het allemaal meesleurt.

7 april 2026

Cloud Migratie

Cloud Migratie8 min

Monitoring tijdens cloud migratie: waarom single-environment datamonitoring software tekort schiet

Tijdens migratie bewaak je niet één omgeving — je bewaakt er twee. Veel datamonitoring software is gebouwd om één stack te bewaken, niet twee stacks die naast elkaar draaien.

6 april 2026
Cloud Migratie8 min

Van SSIS naar ADF naar Fabric: het overzicht behouden

Drie generaties ETL-tools, één datastack — behoud van overzicht, zelfs wanneer de tools voortdurend veranderen.

5 april 2026

Best Practices

Best Practices8 min

Databricks R-plots verdwijnen zonder foutmelding — het graphics device faalt stilzwijgend

Je R-code wordt foutloos uitgevoerd. De cell is klaar. Het plotgebied is leeg. Databricks vertelt je niet waarom — want vanuit het perspectief van de runtime is er niets fout gegaan.

25 mei 2026
Best Practices9 min

Je composite model is trager dan DirectQuery alleen — hier is waarom

SharePoint-lijsten importeren in een DirectQuery-model klinkt pragmatisch. De storage engine denkt daar anders over.

18 mei 2026
Best Practices8 min

Het tabblad 'Databricks Compute' ontbreekt vanwege machtigingen, niet door een bug.

Het tabblad 'Compute' verdwijnt geruisloos wanneer de machtigingen onjuist zijn. Drie instellingen bepalen of je gebruikers het kunnen zien, en geen van deze instellingen geeft een foutmelding.

11 mei 2026
Best Practices9 min

Databricks-leverancierstoegang: hoe je directe wijzigingen in de werkruimte kunt blokkeren zonder de levering te onderbreken

De consultant van je leverancier heeft op vrijdagmiddag om 16:00 uur per ongeluk een productienotebook overschreven. Zo voorkomt je met behulp van maprechten, service principals en Git-mappen dat dit nogmaals gebeurt.

11 mei 2026
Best Practices9 min

Databricks kan je Iceberg-tabel niet vinden in Glue — De catalogus configuratie die stilzwijgend mislukt

Er zijn zes Spark-eigenschappen die de verbinding vormen tussen je Databricks-cluster en een Iceberg-tabel die is geregistreerd in AWS Glue. Als er één fout is, krijgt je de foutmelding TABLE_OR_VIEW_NOT_FOUND, zonder enige aanwijzing welke eigenschap de fout heeft veroorzaakt.

11 mei 2026
Best Practices8 min

Delta MERGE vanuit meerdere brontabellen mislukt omdat UNION ALL niet voldoende is.

Een UNION ALL in de USING-clausule lijkt correct totdat twee brontabellen een rij voor dezelfde sleutel aanleveren. Delta verwerpt de ambiguïteit direct.

4 mei 2026
Best Practices7 min

PySpark split() verwijdert stilletjes gegevens wanneer je aanname over het scheidingsteken onjuist is.

Het splitsen en ophalen van items werkt perfect met voorbeeldgegevens. Productiestrings bevatten echter spaties aan het einde, ingesloten scheidingstekens en ontbrekende velden, waardoor je kolommen zonder waarschuwing null worden.

4 mei 2026
Best Practices8 min

Delta MERGE vanuit meerdere brontabellen mislukt wanneer je de deduplicatie overslaat.

Als je al je bronnen samenvoegt tot één bron, zal Spark je straffen met een foutmelding over een onduidelijke overeenkomst, tenzij je eerst de duplicaten verwijdert.

4 mei 2026
Best Practices14 min

Vergelijking van Power BI monitoringtools: de koopgids voor 2026

Standaardmeldingen missen de fouten die daadwerkelijk problemen veroorzaken. Hieronder een vergelijking van de belangrijkste Power BI monitoringtools op het gebied van detectie, correlatie en implementatietijd.

4 mei 2026
Best Practices9 min

Monitoring van ADF-pipeline fouten: waar native waarschuwingen niet meer werken

De native Azure Monitor detecteert fouten in de pipeline. Deze mist echter de copy activity die is geslaagd met een onjuist schema – en dat is nu juist de activiteit waarover je belanghebbenden contact zullen opnemen.

4 mei 2026
Best Practices9 min

Spark-prestaties: Scala versus Python: waar het er echt toe doet

Het verschil in uitvoeringstijd tussen PySpark en Scala wordt niet gemeten door de meeste benchmarks. De echte kosten zitten hem in de serialisatiegrenzen, het procesmodel van de executor en de plek waar je UDF's worden uitgevoerd.

26 april 2026
Best Practices9 min

Microsoft Fabric-kopieertaak: Veelvoorkomende fouten die beginners in een productieomgeving tegenkomen

De tutorial toont een groen vinkje. In de productieomgeving is een halfvolle Lakehouse-tabel te zien en vraagt een belanghebbende waarom de omzet van gisteren ontbreekt.

26 april 2026
Best Practices8 min

Hoe ontvang ik een melding wanneer het refresh van een Power BI dataset mislukt?

Power BI heeft ingebouwde meldingen voor mislukte refreshen. Deze zijn echter niet voldoende voor de meeste productieomgevingen.

25 april 2026
Best Practices8 min

Handmatig refresh via planning in Power BI werkt niet: oorzaken en oplossingen

Als handmatige refresh werkt en geplande refresh mislukt, ligt het probleem niet bij de datasource. Het ligt aan de omgeving die de geplande uitvoering gebruikt.

25 april 2026
Best Practices9 min

Power BI On-Premises Gateway offline: oorzaken, diagnose en oplossingen

Een gateway die om 02:00 uur offline gaat en om 09:00 uur weer online is, kan tientallen geplande refreshen ongemerkt laten mislukken terwijl iedereen slaapt.

25 april 2026
Best Practices9 min

Incident response voor data pipeline failures: een data-pipeline-managementplaybook

Wat doe je als het 3 uur 's nachts is en je belangrijkste dataset net gefaald is in de refresh? Een data-pipeline-managementplaybook voor het moment dat monitoring zijn eerste alert afgeeft.

4 april 2026

Probleemoplossing

Probleemoplossing8 min

Je Databricks-afstemmingstaak blijft oneindig draaien omdat er geen reden is om hem te stoppen.

Reconciliatietaken vergelijken twee grote datasets rij voor rij. Wanneer die vergelijking nooit convergeert, verbruikt je cluster onnodig veel rekenkracht totdat iemand het opmerkt of het budget op is.

11 mei 2026
Probleemoplossing9 min

dbt-productiefouten: een referentie-index van mislukte uitvoeringen

Je dbt-run is om 04:12 voltooid. Drie modellen zijn mislukt. Het foutenlogboek meldt 'huidige transactie is afgebroken'. Power BI heeft de gegevens van gisteren al bijgewerkt.

10 mei 2026
Probleemoplossing12 min

Foutmeldingen in Azure Data Factory-pipelines: een overzicht van veelvoorkomende fouten

Je ADF-pipeline is om 03:42 mislukt met een UserError-code die op zichzelf niets zegt. De Power BI refresh die ervan afhankelijk is, vindt over twee uur plaats. Hier lees je hoe je de foutklasse kunt interpreteren en direct naar de oplossing kunt gaan.

9 mei 2026
Probleemoplossing9 min

VBA- en ADODB-query's in Power BI verliezen rijen zonder dat dit wordt gemeld.

Je DAX-query retourneert 11.000 rijen in DAX Studio en 6.000 via VBA. Geen foutmelding. Geen waarschuwing. Alleen ontbrekende gegevens die je stakeholders eerder zullen ontdekken dan jij.

4 mei 2026
Probleemoplossing9 min

VBA-query's tegen Power BI XMLA-endpoints verwijderen rijen zonder waarschuwing.

Je DAX-query levert 11.000 rijen op in DAX Studio, maar slechts 6.000 via VBA. De query zelf is niet fout. De onderliggende ADODB-implementatie is dat wel.

4 mei 2026
Probleemoplossing9 min

Lakeflow Connect SQL Server: Waarom de database-configuratiestap steeds mislukt

De installatiewizard lijkt eenvoudig. Vier stappen, een paar opgeslagen procedures, klaar. Maar de database-installatie mislukt zonder aan te geven welke voorwaarde daadwerkelijk is gecontroleerd en afgewezen.

27 april 2026
Probleemoplossing10 min

AADSTS-fouten bij geplande refresh in Power BI: oorzaken en oplossingen

Je geplande refresh is om 06:00 uur mislukt. Het foutbericht bevat een AADSTS-code. Hier lees je wat elke code betekent.

25 april 2026
Probleemoplossing9 min

Foutmeldingen in Power BI Gateway: uitleg van DM_GWPipeline-codes

Een DM_GWPipeline-fout betekent dat de gateway een deel van het probleem is. Hier lees je hoe je kunt achterhalen welk deel precies.

25 april 2026
Probleemoplossing9 min

ADF-pipelinetoegangsfouten: Oplossingen voor 'Toegang geweigerd', '401' en '403'.

De verbindingstest slaagt. De pipeline run mislukt met foutcode 403. Dat zijn niet dezelfde dingen.

25 april 2026
Probleemoplossing9 min

Databricks-taakfouten: OOM, gegevensscheefheid en DRIVER_NOT_RESPONDING

DRIVER_NOT_RESPONDING is een symptoom. De oorzaak is bijna altijd geheugenoverbelasting of een GC-pauze. Hier lees je hoe je de oorzaak kunt opsporen en het probleem kunt oplossen.

25 april 2026
Probleemoplossing9 min

Fouten bij het uitvoeren van dbt in een productieomgeving: Toestemmingsfouten, SQL-fouten en incrementele afwijkingen.

Het model werkt lokaal. De implementatie in productie mislukt. Het verschil zit hem bijna altijd in machtigingen, inloggegevens of de SQL-dialect.

25 april 2026

Stop met problemen ontdekken via uw gebruikers

MetricSign monitort uw Power BI-datasets, ADF-pipelines, Databricks-jobs, Fabric Pipelines en dbt-modellen — en meldt incidenten met context vóórdat uw stakeholders het merken.

Gratis aan de slag →