Teilen über


Power Query SDK Testframework Teil 2 – Testdaten

Diese mehrteilige Referenz behandelt das Einrichten und Ausführen einer Standardsuite von Tests für Power Query-Konnektorentwickler. Der Verweis soll sequenziell befolgt werden, um sicherzustellen, dass Ihre Umgebung zum Testen des Erweiterungskonnektors eingerichtet ist.

In diesem Abschnitt führen Sie folgende Schritte aus:

  • Erfahren Sie mehr über das Dataset, das in der Standardsammlung der Tests verwendet wird
  • Herunterladen einer Kopie der Testdaten
  • Laden Sie die Daten für den Connector, den Sie testen möchten, in Ihre Datenbank hoch

In diesem Abschnitt werden die Testdaten behandelt, die von der Testsammlung verwendet werden, um Ihren Connector zu überprüfen.

Übersicht über das DataSet

Die für das Framework verwendeten Testdaten sind eine modifizierte Version der NewYork City Taxi & Limousine Commission (TLC) Green Trip Record-Daten.

Die Greentrip-Daten vom Februar 2023 wurden in die CSV-Datei „NycTaxiGreen“ konvertiert, und 10.000 Zeilen wurden aus ihr entnommen. Ebenso enthält die CSV-Datei „TaxiZoneLookup“ 265 Zeilen aus der Nachschlagetabelle der Taxizone. Das CSV-Datenformat wurde aufgrund seiner großen Anwendbarkeit auf fast alle anderen Datenquellen ausgewählt, wodurch es einfacher zu importieren ist.

Die Definition für jedes Feld unterscheidet sich möglicherweise geringfügig von den Informationen in NYC Taxi und Limousine grünes Dataset – Azure Open Datasets und data_dictionary_trip_records_green.pdf (nyc.gov).

Das Dataset für unsere Tests wird in zwei CSV-Dateien aufgeteilt: NycTaxiGreen und TaxiZoneLookup.

Abrufen der Testdaten

Die Testdaten werden im Git-Repository Datenconnectors abgelegt. Testdaten werden in Form von CSV zusammen mit der Schemadefinition für die Tabellen NycTaxiGreen und TaxiZoneLookup bereitgestellt. Diese Daten sollten als separate Tabellen in Ihre Datenquelle geladen werden und Sie müssen sicherstellen, dass das Schema den in Ihrer Datenquelle definierten Datentypen entspricht.

Hinweis

Beim Hochladen in die Datenquelle sollten alle Dezimalwerte eine Skalierung von 2 aufweisen. Das heißt, die Anzahl der Ziffern nach dem Dezimalkomma sollte 2 sein. Alle Zeitstempelwerte sollten im MM/DD/YYYY HH24:MI:SS-Format in die Daten hochgeladen werden.

Sie können auch die Details zu den Testdaten überprüfen.

Ressourcen:

Beschreibung der NycTaxiGreen-Tabelle

Die folgende Tabelle enthält weitere Informationen zu den einzelnen Feldern in der Tabelle „NycTaxiGreen“:

Name Typ Beschreibung
RecordID Ganzzahl Die ursprüngliche Datensatz-ID-Reihenfolge. Die CSV beginnt mit dieser in ungeordneten Reihenfolge aufgrund des zufälligen Samplings. Dieses Feld kann als Primärschlüssel der Tabelle verwendet werden.
vendorid Ganzzahl Code, der den Anbieter angibt.
lpep_pickup_datetime Timestamp Zeitzoneninformationen sind nicht enthalten. Wenn für die Datenquelle eine erforderlich ist, sollte UTC verwendet werden.
lpep_dropoff_datetime Timestamp Zeitzoneninformationen sind nicht enthalten. Wenn für die Datenquelle eine erforderlich ist, sollte UTC verwendet werden.
store_and_fwd_flag Boolean Ein wahr/falsch-Feld. Einige Datenquellen importieren dieses Feld möglicherweise als Zeichen oder Zeichenfolge, wenn der Feldtyp nicht angegeben ist. Zu Testzwecken sollte dieses Feld als Boole'sche angegeben werden.
RatecodeID Ganzzahl Der geltende Tarifode am Ende der Fahrt.
PULocationID Ganzzahl TLC-Taxizone,wenn das Taxameter aktiviert wurde.
DOLocationID Ganzzahl TLC-Taxizone, wenn das Taxameter abgeschalten wurde.
passenger_count Ganzzahl Anzahl der Mitfahrer im Fahrzeug.
trip_distance Double Verstrichene Reisestrecke in Meilen.
fare_amount Double Zeit- und Fernfahrtspreise. Zwei Dezimalstellen.
extra Double Sonstige Gebühren. Zwei Dezimalstellen.
mta_tax Double MTA-Steuer hinzugefügt. Zwei Dezimalstellen.
tip_amount Double Trinkgeldbetrag. Zwei Dezimalstellen.
tolls_amount Double Die Gesamtzahl der Gebühren für die Reise. Zwei Dezimalstellen.
improvement_surcharge Double Ein Verbesserungsaufpreis. Zwei Dezimalstellen.
total_amount Double Dem Kunden berechneter Gesamtpreis. Außer Trinkgeld. Zwei Dezimalstellen.
payment_type Ganzzahl Ein numerischer Code, der angibt, wie der Kunde bezahlt hat.
trip_type Ganzzahl Ein numerischer Code, um zu bestimmen, ob das Taxi angehalten oder versendet wurde.
congestion_surcharge Double Eine Zusätzliche Gebühr für Staus. Zwei Dezimalstellen.

Beschreibung der TaxiZoneLookup-Tabelle

Die folgende Tabelle enthält weitere Informationen zu den einzelnen Feldern in der Tabelle „TaxiZoneLookup“:

Name Typ Beschreibung
LocationId Ganzzahl Standort-ID für einen beliebigen Speicherort. Es wird PULocationID und DOLocationID in der Tabelle „NycTaxiGreen“ zugeordnet. Dieses Feld kann als Primärschlüssel der Tabelle verwendet werden.
Borough String Borough für den Standort.
Zone String Name der Zone für den Standort.
service_zone String Name der Dienstzone für den Standort.

Zusammenfassung

In diesem Abschnitt werden die Testdaten beschrieben, die in der standardisierten Testsuite und dem zugehörigen Schema verwendet werden. Ihre Datenbank sollte nun mit Tabellen auf der Grundlage der angegebenen CSV-Dateien mit dem richtigen Schema aufgefüllt werden.

Im nächsten Abschnitt erhalten Sie ein Verständnis von verschiedenen Abschnitten der Testsuite, mit der Sie das Einrichten des Datasets und des Erweiterungsconnectors überprüfen können.

Nächste Schritte

PowerQuery SDK-Testframework Teil 3 – Testsammlung