Поделиться через


Платформа тестирования пакета SDK Power Query 2. Тестовые данные

Эта многокомпонентная ссылка охватывает настройку и выполнение стандартного набора тестов для разработчиков соединителей Power Query. Ссылка должна выполняться последовательно, чтобы убедиться, что среда настроена для тестирования соединителя расширения.

В этом разделе выполняются следующие действия:

  • Сведения о наборе данных, используемом в стандартном наборе тестов
  • Скачивание копии тестовых данных
  • Отправка данных в выбор базы данных для соединителя, который планируется протестировать

В этом разделе рассматриваются тестовые данные, используемые набором тестов для проверки соединителя.

Обзор набора данных

Тестовые данные, используемые для платформы, являются измененной версией новой версии NewYork City Taxi & Limousine Commission (TLC) данных о зеленой записи поездки.

Данные о зеленой поездке за февраль 2023 года были преобразованы в CSV-файл NycTaxiGreen, а из него были выбраны 10 000 строк. Аналогичным образом CSV-файл TaxiZoneLookup содержит 265 строк из таблицы подстановки зоны такси. Формат данных CSV был выбран из-за его большой применимости почти ко всем другим источникам данных, что упрощает импорт.

Определение каждого поля может немного отличаться от сведений, найденных в NYC Taxi и зеленом наборе данных Limousine — Открытых наборов данных Azure и data_dictionary_trip_records_green.pdf (nyc.gov).

Набор данных для нашего тестирования разделен на два CSV-файла: NycTaxiGreen и TaxiZoneLookup.

Получение тестовых данных

Тестовые данные помещаются в репозиторий Git data Подключение ors. Тестовые данные предоставляются в виде CSV-файла вместе с определением схемы для таблиц NycTaxiGreen и TaxiZoneLookup . Эти данные должны быть загружены в источник данных в виде отдельных таблиц, и необходимо убедиться, что схема соответствует типам данных, определенным в источнике данных.

Примечание.

При передаче в источник данных все десятичные значения должны иметь масштаб 2. То есть число цифр после десятичной запятой должно быть 2. Все значения метки времени должны быть отправлены в объект datasouce в MM/DD/YYYY HH24:MI:SS формате.

Вы также можете просмотреть сведения о тестовых данных.

Ресурсы:

Описание таблицы NycTaxiGreen

В следующей таблице приведены дополнительные сведения о каждом поле в таблице NycTaxiGreen:

Имя. Тип Описание
RecordID Целое Исходный порядок идентификатора записи. CSV начинается с него вне порядка из-за случайной выборки. Это поле можно использовать в качестве первичного ключа таблицы.
Идентификатор поставщика Целое Код, указывающий поставщик.
lpep_pickup_datetime Метка времени Сведения о часовом поясе не включены. Если для источника данных требуется один, следует использовать utc.
lpep_dropoff_datetime Метка времени Сведения о часовом поясе не включены. Если для источника данных требуется один, следует использовать utc.
store_and_fwd_flag Логический Поле true/false. Некоторые источники данных могут импортировать это поле как символ или строку, если тип поля не указан. В целях тестирования это поле должно быть указано как логическое.
RatecodeID Целое Код скорости в конце поездки.
PULocationID Целое Зона такси TLC, когда таксиметр занят.
DOLocationID Целое Зона такси TLC при отключении таксиметра.
passenger_count Целое Количество пассажиров в транспортном средстве.
trip_distance Двойной Прошлое расстояние поездки в милях.
fare_amount Двойной Тариф между временем и расстоянием. Два десятичных разряда .
extra Двойной Неправильная плата. Два десятичных разряда .
mta_tax Двойной Добавлен налог MTA. Два десятичных разряда .
tip_amount Двойной Сумма подсказки. Два десятичных разряда .
tolls_amount Двойной Общее количество платных платежей по поездке. Два десятичных разряда .
improvement_surcharge Двойной Повышение платы. Два десятичных разряда .
total_amount Двойной Общая цена взимается клиентам. Не включает советы. Два десятичных разряда .
payment_type Целое Числовое код для оплаты пассажиром.
trip_type Целое Числовый код для того, был ли такси градирован или отправлен.
congestion_surcharge Двойной Дополнительная плата за перегрузку. Два десятичных разряда .

Описание таблицы TaxiZoneLookup

В следующей таблице приведены дополнительные сведения о каждом поле в таблице TaxiZoneLookup:

Имя. Тип Описание
LocationId Целое Идентификатор расположения для любого расположения. Он сопоставляется с PULocationID и DOLocationID в таблице NycTaxiGreen. Это поле можно использовать в качестве первичного ключа таблицы.
Borough Строка Район для расположения.
Зона Строка Имя зоны для расположения.
service_zone Строка Имя зоны обслуживания для расположения.

Заключение

В этом разделе описаны тестовые данные, используемые в стандартизованном наборе тестов и его схеме. Теперь база данных должна заполняться таблицами на основе указанных CSV-файлов с правильной схемой.

В следующем разделе вы получите представление о различных разделах набора тестов, которые помогают проверить настройку набора данных и соединителя расширения.

Следующие шаги

Платформа тестирования пакета SDK Для PowerQuery 3. Набор тестов