Cadre de test du Kit de développement logiciel (SDK) Power Query partie 2 - Données de test
Cette référence en plusieurs parties couvre l’installation et l’exécution d’une suite standard de tests pour les développeurs de connecteurs Power Query. La référence est destinée à être suivie de manière séquentielle pour vous assurer que votre environnement est configuré pour tester votre connecteur d’extension.
Dans cette section, vous allez :
- En savoir plus sur le jeu de données utilisé dans la suite standard des tests
- Télécharger une copie des données de test
- Charger les données dans votre choix de base de données pour le connecteur que vous envisagez de tester
Cette section décrit les données de test utilisées par la suite de tests pour vérifier votre connecteur.
Vue d'ensemble du jeu de données
Les données de test utilisées pour l’infrastructure sont une version modifiée des données de l’enregistrement de voyage vert NewYork City Taxi & Limousine Commission (TLC).
Les données de voyage vert de février 2023 ont été converties en fichier CSV « NycTaxiGreen » et 10 000 lignes ont été échantillonnés. De même, le fichier CSV « TaxiZoneLookup » contient 265 lignes de la table de choix de zone de taxi. Le format de données CSV a été choisi en raison de sa grande applicabilité à presque toutes les autres sources de données, ce qui facilite l’importation.
La définition de chaque champ peut être légèrement différente des informations trouvées dans le jeu de données vert NYC Taxi et Limousine - Azure Open Datasets et data_dictionary_trip_records_green.pdf (nyc.gov).
Le jeu de données de notre test est divisé en deux fichiers csv : NycTaxiGreen et TaxiZoneLookup.
Obtention des données de test
Les données de test sont placées dans le référentiel git des connecteurs de données. Les données de test sont fournies sous la forme de CSV, ainsi que la définition de schéma pour les tables NycTaxiGreen et TaxiZoneLookup. Ces données doivent être chargées dans votre source de données en tant que tables distinctes et vous devez vous assurer que le schéma correspond aux types de données définis dans votre source de données.
Remarque
Lors du chargement vers la source de données, toutes les valeurs décimales doivent avoir une échelle de 2. Autrement dit, le nombre de chiffres après la virgule décimale doit être de 2.
Toutes les valeurs d’horodatage doivent être chargées dans l’objet datasouce au format MM/DD/YYYY HH24:MI:SS
.
Vous pouvez également consulter les détails relatifs aux données de test.
Ressources :
Description de la table NycTaxiGreen
Le tableau suivant fournit des informations supplémentaires sur chaque champ de la table « NycTaxiGreen » :
Nom | Type | Description |
---|---|---|
RecordID | Entier | Ordre d’ID d’enregistrement d’origine. Le fichier CSV commence par celui-ci hors ordre en raison de l’échantillonnage aléatoire. Ce champ peut être utilisé comme clé primaire de la table. |
ID fournisseur | Entier | Code indiquant le fournisseur. |
lpep_pickup_datetime | Horodateur | Les informations de fuseau horaire ne sont pas incluses. Si la source de données nécessite une source de données, l’heure UTC doit être utilisée. |
lpep_dropoff_datetime | Horodateur | Les informations de fuseau horaire ne sont pas incluses. Si la source de données nécessite une source de données, l’heure UTC doit être utilisée. |
store_and_fwd_flag | Boolean | Champ vrai/faux. Certaines sources de données peuvent importer ce champ en tant que caractère ou chaîne si le type de champ n’est pas spécifié. À des fins de test, ce champ doit être spécifié en tant que booléen. |
RatecodeID | Entier | Code tarifaire final en vigueur à la fin du trajet. |
PULocationID | Entier | Zone de taxi TLC où le compteur a été lancé. |
DOLocationID | Entier | Zone de taxi TLC où le compteur a été arrêté. |
passenger_count | Entier | Nombre de passagers dans le véhicule. |
trip_distance | Double | Distance de trajet écoulée en miles. |
fare_amount | Double | Tarif de temps et de distance. Deux décimales. |
extra | Double | Frais divers. Deux décimales. |
mta_tax | Double | Taxe MTA ajoutée. Deux décimales. |
tip_amount | Double | Montant du pourboire. Deux décimales. |
tolls_amount | Double | Nombre total de péages payés lors du voyage. Deux décimales. |
improvement_surcharge | Double | Surcharge d’amélioration. Deux décimales. |
total_amount | Double | Prix total facturé aux clients. Ne comprend pas des astuces. Deux décimales. |
payment_type | Entier | Code numérique indiquant le mode de paiement du passager. |
trip_type | Entier | Code numérique indiquant si le taxi a été salué ou distribué. |
congestion_surcharge | Double | Frais supplémentaires pour la congestion. Deux décimales. |
Description de la table TaxiZoneLookup
Le tableau suivant fournit des informations supplémentaires sur chaque champ de la table « TaxiZoneLookup » :
Nom | Type | Description |
---|---|---|
LocationId | Entier | ID d’emplacement pour n’importe quel emplacement. Il est mappé à PULocationID et DOLocationID dans la table « NycTaxiGreen ». Ce champ peut être utilisé comme clé primaire de la table. |
Arrondissement | Chaîne | Arrondissement pour l’emplacement. |
Zone | Chaîne | Nom de la zone pour l’emplacement. |
service_zone | Chaîne | Nom de la zone de service pour l’emplacement. |
Conclusion
Cette section décrit les données de test utilisées dans la suite de tests standardisée et son schéma. Votre base de données doit maintenant être remplie avec des tables basées sur les fichiers CSV spécifiés avec le schéma approprié.
Dans la section suivante, vous comprenez différentes sections de la suite de tests qui vous aident à valider la configuration du jeu de données et de votre connecteur d’extension.
Étapes suivantes
Cadre de test du Kit de développement logiciel (SDK) PowerQuery partie 3 - Suite de tests