Что такое Azure Cognitive Service для языковой службы?
Azure Cognitive Service для языковой службы — это облачная служба, которая предоставляет функции обработки естественного языка для понимания и анализа текста. Используйте эту службу для создания интеллектуальных приложений, использующих Language Studio на основе веб-интерфейса, REST API и клиентские библиотеки.
Доступные функции
Эта языковая служба объединяет следующие ранее доступные службы Cognitive Services: Анализ текста, QnA Maker и LUIS. Если вам нужно выполнить миграцию из этих служб, см. раздел миграции ниже.
Языковая служба также предоставляет несколько новых функций, которые могут быть:
- Предварительно настроенными — модели ИИ, используемые компонентом, не настраиваются. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.
- Настраиваемыми — вы обучаете модель ИИ, используя наши средства для точной подгонки данных.
Совет
Не знаете, какую функцию использовать? Сведения о выборе см. в статье Какую языковую службу следует использовать?
Language Studio позволяет использовать описанные ниже функции службы без написания кода.
Распознавание именованных сущностей (NER)
Распознавание именованных сущностей — это предварительно настроенная функция, которая классифицирует сущности (слова или фразы) в неструктурированном тексте в нескольких предварительно определенных группах категорий. Например: люди, события, места, даты и другое.
Обнаружение персональных данных (PII) и сведений о состоянии здоровья (PHI)
Обнаружение персональных данных — это предварительно настроенная функция, которая определяет, классифицирует и редактирует конфиденциальную информацию как в неструктурированных текстовых документах, так и в расшифровках бесед. Например: номера телефонов, адреса электронной почты, удостоверения личности и другое.
Определение языка
Распознавание языка — это предварительно настроенная функция, которая позволяет определять, на каком языке написан документ, и возвращает код языка. Функция поддерживает широкий спектр языков, их вариантов и диалектов, а также некоторые региональные языки и культурные особенности.
Анализ тональности и интеллектуальный анализ мнений
Анализ тональности и интеллектуальный анализ мнений — это предварительно настроенные функции, которые помогают узнать, что пользователи думают о торговой марке или теме. Они основаны на интеллектуальном анализе текста, который выявляет положительную или отрицательную тональность и может связать ее с конкретными аспектами текста.
Сводка
Формирование сводных данных — это предварительно настроенная функция, которая извлекает текст для создания сводки документов и расшифровок бесед. Она извлекает предложения, в сочетании содержащие наиболее важную или релевантную информацию из исходного содержимого.
Извлечение ключевой фразы
Извлечение ключевых фраз — это предварительно настроенная функция, которая оценивает основные понятия в неструктурированном тексте и возвращает их в виде списка.
Связывание сущностей
Связывание сущностей — это предварительно настроенная функция, которая устраняет неоднозначное определение сущностей (слов или фраз), найденных в неструктурированном тексте, и возвращает ссылки на Википедию.
Анализ текста для сферы здравоохранения
Анализ медицинских текстов — это предварительно настроенная функция, которая извлекает и маркирует соответствующую медицинскую информацию из неструктурированных текстов, таких как записи врача, выписные листы, медицинские документы и электронные медицинские карты.
Пользовательская классификация текстов
Пользовательская классификация текста позволяет создавать пользовательские модели ИИ для классификации неструктурированных текстовых документов в определяемые вами пользовательские классы.
Пользовательское распознавание именованных сущностей (пользовательское NER)
Custom NER позволяет создавать пользовательские модели ИИ для извлечения пользовательских категорий сущностей (меток для слов или фраз) с помощью предоставленного неструктурированного текста.
Распознавание разговорной речи
Распознавание устной речи (CLU) позволяет пользователям создавать настраиваемые модели распознавания естественного языка для прогнозирования общего намерения входящего речевого фрагмента и извлечения из него важных сведений.
Рабочий процесс оркестрации
Рабочий процесс оркестрации — это пользовательская функция, которая позволяет подключать распознавание устной речи (CLU), ответы на вопросы и приложения LUIS.
Ответы на вопросы
Ответы на вопросы — это пользовательская функция, которая находит наиболее подходящий ответ на входные данные от пользователей. Функция часто используется для создания клиентских приложений для общения, таких как приложения социальных сетей, чат-боты и классические приложения с поддержкой речи.
Какую языковую службу следует использовать?
Этот раздел поможет вам решить, какую функцию языковой службы следует использовать для приложения:
Выбор действия | Формат документа | Лучшее решение | Можно ли настроить это решение?* |
---|---|---|---|
Обнаруживайте и /или редактировать конфиденциальную информацию, такую как piI и PHI. | Неструктурированный текст, транскрибированные беседы |
Обнаружение PII | |
Извлечение категорий информации без создания пользовательской модели. | Неструктурированный текст | Предварительно настроенная функция NER | |
Извлеките категории информации, используя модель, специфичную для ваших данных. | Неструктурированный текст | Пользовательское Распознавание именованных сущностей | ✓ |
Извлечение основных тем и важных фраз. | Неструктурированный текст | Пример. Как извлечь ключевые фразы с помощью Анализа текста | |
Определите тональность и мнения, выраженные в тексте. | Неструктурированный текст | Анализ тональности и интеллектуальный анализ мнений | |
Суммирование длинных фрагментов текста или бесед. | Неструктурированный текст, транскрибированные беседы. |
Сводка | |
Неоднозначные сущности и получение ссылок на Википедию. | Неструктурированный текст | Связывание сущностей | |
Классифицируйте документы по одной или нескольким категориям. | Неструктурированный текст | Пользовательская классификация текстов | ✓ |
Извлечение медицинской информации из клинических или медицинских документов. | Неструктурированный текст | Анализ текста для сферы здравоохранения | |
Создайте приложение для общения, которое реагирует на входные данные пользователя. | Неструктурированные входные данные пользователя | Ответы на вопросы | ✓ |
Определение языка, на который был написан текст. | Неструктурированный текст | Пример. Как определить язык с помощью Анализа текста | |
Прогнозирование намерения входных данных пользователем и извлечение информации из них. | Неструктурированные входные данные пользователя | Распознавание разговорной речи | ✓ |
Подключение приложений из распознавания устной речи, LUIS и ответов на вопросы. | Неструктурированные входные данные пользователя | Рабочий процесс оркестрации | ✓ |
* Если функция настраивается, вы можете обучить модель ИИ с помощью наших инструментов в соответствии с вашими данными. В противном случае функция предварительно настроена, то есть модели ИИ, которые она использует, нельзя изменить. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.
Миграция из служб "Анализ текста", QnA Maker или "Распознавание речи" (LUIS)
Azure Cognitive Services для Языковой службы объединяет три отдельные языковые службы в Cognitive Services: "Анализ текста", QnA Maker и "Распознавание речи" (LUIS). Если вы использовали эти три службы, вы можете легко перейти на новую службу Cognitive Services Azure для Языковых служб. Инструкции см. в статье Миграция в Azure Cognitive Services для Языковых служб.
Руководства
После того как вы начнете использовать языковую службу, просмотрите наше руководство с описанием разных сценариев.
- Извлечение ключевых фраз из текста, хранящегося в Power BI
- Использование Power Automate для сортировки информации в Microsoft Excel
- Использование Flask для перевода текста, анализа тональности и синтезирования речи
- Использование Cognitive Services в приложениях на основе холста
- Создание бота для ответов на часто задаваемые вопросы
Дополнительные примеры кода
Дополнительные примеры кода можно найти на GitHub для следующих языков:
Развертывание в локальной среде с помощью контейнеров Docker
Для развертывания функций API в локальной среде используйте контейнеры языковой службы. Эти контейнеры Docker позволяют разместить службу ближе к данным для обеспечения безопасности, соответствия требованиям и других эксплуатационных преимуществ. Для языковой службы предлагаются следующие контейнеры:
- Пример. Как определить тональность с помощью Анализа текста
- Пример. Как определить язык с помощью Анализа текста
- Пример. Как извлечь ключевые фразы с помощью Анализа текста
- Анализ текста для сферы здравоохранения
Ответственный подход к использованию ИИ
Система ИИ — это не только технология, но и ее пользователи, люди, на которых она повлияет, а также среда, в которой она будет развернута. Ознакомьтесь с приведенными ниже статьями, чтобы узнать больше об ответственном использовании и развертывании искусственного интеллекта в своих системах.