Сохранение обогащенных данных в хранилище знаний

Завершено

Хранилище знаний — это постоянное хранилище для хранения обогащенного содержимого. Оно предназначено для хранения данных, созданных в результате обогащения с помощью ИИ, в контейнере. Например, может потребоваться сохранить результаты применения набора навыков ИИ, создающего подписи по изображениям.

Infographic of knowledge store.

Напомним, что наборы навыков проводят документ через последовательность обогащений, вызывающих преобразования, такие как распознавание сущностей или перевод текста. Результатом этого процесса могут быть индекс поиска или проекции документа в хранилище знаний. Два набора выходных данных, индекс поиска и хранилище знаний — это взаимоисключающие результаты работы одного и того же конвейера. Их источником являются одни и те же входные данные, а в итоге формируются структурированные, хранимые и используемые в разных приложениях выходные данные.

Хотя основное внимание решения поиска ИИ Azure обычно уделяется созданию индексов, доступных для поиска, вы также можете воспользоваться преимуществами его возможностей извлечения и обогащения для сохранения обогащенных данных в хранилище знаний для дальнейшего анализа или обработки.

Хранилище знаний может содержать один или несколько из трех типов проекций извлеченных данных:

  • Проекции таблиц используются для структурирования извлеченных данных в реляционной схеме для выполнения запросов и визуализации.
  • Проекции объектов — это документы JSON, представляющие каждую сущность данных.
  • Проекции файлов используются для хранения извлеченных изображений в формате JPG.