Power Query SDK Testframework Teil 2 – Testdaten
Diese mehrteilige Referenz behandelt das Einrichten und Ausführen einer Standardsuite von Tests für Power Query-Konnektorentwickler. Der Verweis soll sequenziell befolgt werden, um sicherzustellen, dass Ihre Umgebung zum Testen des Erweiterungskonnektors eingerichtet ist.
In diesem Abschnitt führen Sie folgende Schritte aus:
- Erfahren Sie mehr über das Dataset, das in der Standardsammlung der Tests verwendet wird
- Herunterladen einer Kopie der Testdaten
- Laden Sie die Daten für den Connector, den Sie testen möchten, in Ihre Datenbank hoch
In diesem Abschnitt werden die Testdaten behandelt, die von der Testsammlung verwendet werden, um Ihren Connector zu überprüfen.
Übersicht über das DataSet
Die für das Framework verwendeten Testdaten sind eine modifizierte Version der NewYork City Taxi & Limousine Commission (TLC) Green Trip Record-Daten.
Die Greentrip-Daten vom Februar 2023 wurden in die CSV-Datei „NycTaxiGreen“ konvertiert, und 10.000 Zeilen wurden aus ihr entnommen. Ebenso enthält die CSV-Datei „TaxiZoneLookup“ 265 Zeilen aus der Nachschlagetabelle der Taxizone. Das CSV-Datenformat wurde aufgrund seiner großen Anwendbarkeit auf fast alle anderen Datenquellen ausgewählt, wodurch es einfacher zu importieren ist.
Die Definition für jedes Feld unterscheidet sich möglicherweise geringfügig von den Informationen in NYC Taxi und Limousine grünes Dataset – Azure Open Datasets und data_dictionary_trip_records_green.pdf (nyc.gov).
Das Dataset für unsere Tests wird in zwei CSV-Dateien aufgeteilt: NycTaxiGreen und TaxiZoneLookup.
Abrufen der Testdaten
Die Testdaten werden im Git-Repository Datenconnectors abgelegt. Testdaten werden in Form von CSV zusammen mit der Schemadefinition für die Tabellen NycTaxiGreen und TaxiZoneLookup bereitgestellt. Diese Daten sollten als separate Tabellen in Ihre Datenquelle geladen werden und Sie müssen sicherstellen, dass das Schema den in Ihrer Datenquelle definierten Datentypen entspricht.
Hinweis
Beim Hochladen in die Datenquelle sollten alle Dezimalwerte eine Skalierung von 2 aufweisen. Das heißt, die Anzahl der Ziffern nach dem Dezimalkomma sollte 2 sein.
Alle Zeitstempelwerte sollten im MM/DD/YYYY HH24:MI:SS
-Format in die Daten hochgeladen werden.
Sie können auch die Details zu den Testdaten überprüfen.
Ressourcen:
Beschreibung der NycTaxiGreen-Tabelle
Die folgende Tabelle enthält weitere Informationen zu den einzelnen Feldern in der Tabelle „NycTaxiGreen“:
Name | Typ | Beschreibung |
---|---|---|
RecordID | Ganzzahl | Die ursprüngliche Datensatz-ID-Reihenfolge. Die CSV beginnt mit dieser in ungeordneten Reihenfolge aufgrund des zufälligen Samplings. Dieses Feld kann als Primärschlüssel der Tabelle verwendet werden. |
vendorid | Ganzzahl | Code, der den Anbieter angibt. |
lpep_pickup_datetime | Timestamp | Zeitzoneninformationen sind nicht enthalten. Wenn für die Datenquelle eine erforderlich ist, sollte UTC verwendet werden. |
lpep_dropoff_datetime | Timestamp | Zeitzoneninformationen sind nicht enthalten. Wenn für die Datenquelle eine erforderlich ist, sollte UTC verwendet werden. |
store_and_fwd_flag | Boolean | Ein wahr/falsch-Feld. Einige Datenquellen importieren dieses Feld möglicherweise als Zeichen oder Zeichenfolge, wenn der Feldtyp nicht angegeben ist. Zu Testzwecken sollte dieses Feld als Boole'sche angegeben werden. |
RatecodeID | Ganzzahl | Der geltende Tarifode am Ende der Fahrt. |
PULocationID | Ganzzahl | TLC-Taxizone,wenn das Taxameter aktiviert wurde. |
DOLocationID | Ganzzahl | TLC-Taxizone, wenn das Taxameter abgeschalten wurde. |
passenger_count | Ganzzahl | Anzahl der Mitfahrer im Fahrzeug. |
trip_distance | Double | Verstrichene Reisestrecke in Meilen. |
fare_amount | Double | Zeit- und Fernfahrtspreise. Zwei Dezimalstellen. |
extra | Double | Sonstige Gebühren. Zwei Dezimalstellen. |
mta_tax | Double | MTA-Steuer hinzugefügt. Zwei Dezimalstellen. |
tip_amount | Double | Trinkgeldbetrag. Zwei Dezimalstellen. |
tolls_amount | Double | Die Gesamtzahl der Gebühren für die Reise. Zwei Dezimalstellen. |
improvement_surcharge | Double | Ein Verbesserungsaufpreis. Zwei Dezimalstellen. |
total_amount | Double | Dem Kunden berechneter Gesamtpreis. Außer Trinkgeld. Zwei Dezimalstellen. |
payment_type | Ganzzahl | Ein numerischer Code, der angibt, wie der Kunde bezahlt hat. |
trip_type | Ganzzahl | Ein numerischer Code, um zu bestimmen, ob das Taxi angehalten oder versendet wurde. |
congestion_surcharge | Double | Eine Zusätzliche Gebühr für Staus. Zwei Dezimalstellen. |
Beschreibung der TaxiZoneLookup-Tabelle
Die folgende Tabelle enthält weitere Informationen zu den einzelnen Feldern in der Tabelle „TaxiZoneLookup“:
Name | Typ | Beschreibung |
---|---|---|
LocationId | Ganzzahl | Standort-ID für einen beliebigen Speicherort. Es wird PULocationID und DOLocationID in der Tabelle „NycTaxiGreen“ zugeordnet. Dieses Feld kann als Primärschlüssel der Tabelle verwendet werden. |
Borough | String | Borough für den Standort. |
Zone | String | Name der Zone für den Standort. |
service_zone | String | Name der Dienstzone für den Standort. |
Zusammenfassung
In diesem Abschnitt werden die Testdaten beschrieben, die in der standardisierten Testsuite und dem zugehörigen Schema verwendet werden. Ihre Datenbank sollte nun mit Tabellen auf der Grundlage der angegebenen CSV-Dateien mit dem richtigen Schema aufgefüllt werden.
Im nächsten Abschnitt erhalten Sie ein Verständnis von verschiedenen Abschnitten der Testsuite, mit der Sie das Einrichten des Datasets und des Erweiterungsconnectors überprüfen können.