Пакетное вывод с помощью API-интерфейсов модели Foundation
В этой статье приведены примеры записных книжек, которые выполняют пакетное вывод в подготовленной конечной точке пропускной способности с помощью API модели Foundation. Для выполнения пакетного вывода с помощью API модели Foundation требуются обе записные книжки.
В примерах показано пакетное вывод с помощью модели инструкций DBRX для задач чата.
Требования
- Рабочая область в поддерживаемом регионе API модели Foundation
- Databricks Runtime 14.0 ML или более поздней версии
- Записная книжка и
chat-batch-inference-api
записная книжкаprovisioned-throughput-batch-inference
должны существовать в том же каталоге в рабочей области.
Настройка входной таблицы, пакетного вывода
Следующая записная книжка выполняет следующие задачи с помощью Python:
- Считывает данные из входной таблицы и входного столбца
- Создает запросы и отправляет их в конечную точку API модели Foundation
- Сохраняет входные строки вместе с данными ответа в выходную таблицу
Задачи пакетного вывода модели чата с помощью записной книжки Python
Следующая записная книжка выполняет те же задачи, что и указанная выше записная книжка, но с помощью Spark:
- Считывает данные из входной таблицы и входного столбца
- Создает запросы и отправляет их в конечную точку API модели Foundation
- Сохраняет входную строку вместе с данными ответа в выходной таблице
Задачи пакетного вывода модели чата с помощью записной книжки UDF PySpark Pandas
Создание подготовленной конечной точки пропускной способности
Если вы хотите использовать записную книжку Spark вместо записной книжки Python, обязательно обновите команду, которая вызывает записную книжку Python.
- Создает подготовленную конечную точку обслуживания пропускной способности
- Отслеживайте конечную точку, пока не достигнет готового состояния
- Вызывает записную книжку
chat-batch-inference-api
для выполнения задач пакетного вывода параллельно с подготовленной конечной точкой. Если вы предпочитаете использовать Spark, измените эту ссылку на вызов записной книжкиchat-batch-inference-udf
. - Удаляет подготовленную конечную точку обслуживания пропускной способности после завершения пакетного вывода
Выполнение пакетного вывода в подготовленной записной книжке конечной точки пропускной способности
Дополнительные ресурсы
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по