Het traceren van een Power BI-rapport naar de brongegevens is de belangrijkste onderzoeksrichting bij dataherkomstanalyse. u begint bij het probleem (het rapport dat onjuiste gegevens weergeeft) en traceert terug naar de oorsprong van het probleem.
Stap 1: Identificeer de dataset
Elk Power BI-rapport is gebaseerd op een of meer datasets. Open het rapport in Power BI Service, ga naar de rapportinstellingen of de dataherkomstweergave (beschikbaar in Premium-workspaces) en identificeer de dataset(s) die het rapport opvraagt.
Stap 2: Onderzoek de gegevensbronnen van de dataset
Het Power BI REST API-eindpunt getDatasources retourneert de configuratie van de gegevensbronnen voor een dataset: de hostnaam van de server, de databasenaam en (indien van toepassing) de schema- en tabelnaam. Dit geeft u precies aan welke gegevens de dataset opvraagt.
Voor complexe datasets met meerdere gegevensbronnen (bijvoorbeeld een dataset die een SQL Server-tabel combineert met een SharePoint-lijst) worden alle gegevensbronnen geretourneerd.
Stap 3: Zoek de pipeline die de gegevensbron laadt
Hier verlaat u Power BI. U kent de databasetabel – zoek nu wat erin schrijft. Opties:
- In ADF: Zoek in ADF pipelineactiviteiten naar kopieeractiviteiten of gegevensstromen die naar de geïdentificeerde server en tabel schrijven.
- In dbt: Zoek in het manifest naar modellen die uitvoer leveren naar het geïdentificeerde schema en de tabelnaam.
- In Databricks: Zoek in taaknotitieboekpaden of Delta-tabelschrijfbewerkingen naar de tabelnaam.
Stap 4: Traceer de pipeline naar de invoer
Zodra u de pipeline hebt geïdentificeerd, traceert u de invoer. Een ADF pipeline die naar een stagingtabel schrijft, leest van een bronsysteem – dat bronsysteem is uw uiteindelijke kandidaat voor de hoofdoorzaak.
Stap 5: Controleer de uitvoeringsgeschiedenis op elk niveau
Nu de volledige keten in kaart is gebracht, controleert u of elk onderdeel succesvol en volgens schema is uitgevoerd:
- Is de ADF pipeline uitgevoerd? Heeft deze het verwachte aantal rijen gekopieerd?
- Is de dbt job succesvol uitgevoerd? Heeft het uitvoer gegenereerd van alle modellen?
- Is de Power BI refresh uitgevoerd nadat de pipeline was voltooid?
Automatisering van de herkomsttracering
Dit handmatige proces werkt voor het onderzoeken van een specifiek incident, maar is niet schaalbaar naar een grote omgeving met honderden datasets. Speciaal ontwikkelde tools voor herkomsttracering bouwen deze kaart vooraf op basis van metadata van pijplijnuitvoeringen, dbt-manifesten en Power BI-gegevensbronconfiguraties. Het onderzoekspad is dus altijd vooraf berekend in plaats van handmatig te worden getraceerd tijdens een incident.