Partager via


Cadre de test du Kit de développement logiciel (SDK) Power Query partie 2 - Données de test

Cette référence en plusieurs parties couvre l’installation et l’exécution d’une suite standard de tests pour les développeurs de connecteurs Power Query. La référence est destinée à être suivie de manière séquentielle pour vous assurer que votre environnement est configuré pour tester votre connecteur d’extension.

Dans cette section, vous allez :

  • En savoir plus sur le jeu de données utilisé dans la suite standard des tests
  • Télécharger une copie des données de test
  • Charger les données dans votre choix de base de données pour le connecteur que vous envisagez de tester

Cette section décrit les données de test utilisées par la suite de tests pour vérifier votre connecteur.

Vue d'ensemble du jeu de données

Les données de test utilisées pour l’infrastructure sont une version modifiée des données de l’enregistrement de voyage vert NewYork City Taxi & Limousine Commission (TLC).

Les données de voyage vert de février 2023 ont été converties en fichier CSV « NycTaxiGreen » et 10 000 lignes ont été échantillonnés. De même, le fichier CSV « TaxiZoneLookup » contient 265 lignes de la table de choix de zone de taxi. Le format de données CSV a été choisi en raison de sa grande applicabilité à presque toutes les autres sources de données, ce qui facilite l’importation.

La définition de chaque champ peut être légèrement différente des informations trouvées dans le jeu de données vert NYC Taxi et Limousine - Azure Open Datasets et data_dictionary_trip_records_green.pdf (nyc.gov).

Le jeu de données de notre test est divisé en deux fichiers csv : NycTaxiGreen et TaxiZoneLookup.

Obtention des données de test

Les données de test sont placées dans le référentiel git des connecteurs de données. Les données de test sont fournies sous la forme de CSV, ainsi que la définition de schéma pour les tables NycTaxiGreen et TaxiZoneLookup. Ces données doivent être chargées dans votre source de données en tant que tables distinctes et vous devez vous assurer que le schéma correspond aux types de données définis dans votre source de données.

Remarque

Lors du chargement vers la source de données, toutes les valeurs décimales doivent avoir une échelle de 2. Autrement dit, le nombre de chiffres après la virgule décimale doit être de 2. Toutes les valeurs d’horodatage doivent être chargées dans l’objet datasouce au format MM/DD/YYYY HH24:MI:SS.

Vous pouvez également consulter les détails relatifs aux données de test.

Ressources :

Description de la table NycTaxiGreen

Le tableau suivant fournit des informations supplémentaires sur chaque champ de la table « NycTaxiGreen » :

Nom Type Description
RecordID Entier Ordre d’ID d’enregistrement d’origine. Le fichier CSV commence par celui-ci hors ordre en raison de l’échantillonnage aléatoire. Ce champ peut être utilisé comme clé primaire de la table.
ID fournisseur Entier Code indiquant le fournisseur.
lpep_pickup_datetime Horodateur Les informations de fuseau horaire ne sont pas incluses. Si la source de données nécessite une source de données, l’heure UTC doit être utilisée.
lpep_dropoff_datetime Horodateur Les informations de fuseau horaire ne sont pas incluses. Si la source de données nécessite une source de données, l’heure UTC doit être utilisée.
store_and_fwd_flag Boolean Champ vrai/faux. Certaines sources de données peuvent importer ce champ en tant que caractère ou chaîne si le type de champ n’est pas spécifié. À des fins de test, ce champ doit être spécifié en tant que booléen.
RatecodeID Entier Code tarifaire final en vigueur à la fin du trajet.
PULocationID Entier Zone de taxi TLC où le compteur a été lancé.
DOLocationID Entier Zone de taxi TLC où le compteur a été arrêté.
passenger_count Entier Nombre de passagers dans le véhicule.
trip_distance Double Distance de trajet écoulée en miles.
fare_amount Double Tarif de temps et de distance. Deux décimales.
extra Double Frais divers. Deux décimales.
mta_tax Double Taxe MTA ajoutée. Deux décimales.
tip_amount Double Montant du pourboire. Deux décimales.
tolls_amount Double Nombre total de péages payés lors du voyage. Deux décimales.
improvement_surcharge Double Surcharge d’amélioration. Deux décimales.
total_amount Double Prix total facturé aux clients. Ne comprend pas des astuces. Deux décimales.
payment_type Entier Code numérique indiquant le mode de paiement du passager.
trip_type Entier Code numérique indiquant si le taxi a été salué ou distribué.
congestion_surcharge Double Frais supplémentaires pour la congestion. Deux décimales.

Description de la table TaxiZoneLookup

Le tableau suivant fournit des informations supplémentaires sur chaque champ de la table « TaxiZoneLookup » :

Nom Type Description
LocationId Entier ID d’emplacement pour n’importe quel emplacement. Il est mappé à PULocationID et DOLocationID dans la table « NycTaxiGreen ». Ce champ peut être utilisé comme clé primaire de la table.
Arrondissement Chaîne Arrondissement pour l’emplacement.
Zone Chaîne Nom de la zone pour l’emplacement.
service_zone Chaîne Nom de la zone de service pour l’emplacement.

Conclusion

Cette section décrit les données de test utilisées dans la suite de tests standardisée et son schéma. Votre base de données doit maintenant être remplie avec des tables basées sur les fichiers CSV spécifiés avec le schéma approprié.

Dans la section suivante, vous comprenez différentes sections de la suite de tests qui vous aident à valider la configuration du jeu de données et de votre connecteur d’extension.

Étapes suivantes

Cadre de test du Kit de développement logiciel (SDK) PowerQuery partie 3 - Suite de tests