Введение

Завершено

Хотите узнать, как работает голосовой помощник? Как они понимают слова, которые мы произносим? Первый этап — преобразование речи в текст, затем обработка естественного языка (преобразование слов в цифры), и наконец преобразование речевого фрагмента (что человек говорит) в намерение (что человек хочет от голосового помощника). Если вы проходите эту схему обучения по порядку, вы уже знаете, как работает обработка естественного языка (NLP). Сейчас мы рассмотрим, как получить текст из звукозаписи речи. Классификация звуковых фрагментов полезна не только для голосовых помощников, но и для многого другого. Например, она позволяет классифицировать музыкальные жанры, выявлять заболевание по голосу человека и может применяться для таких задач, о которых мы еще даже не догадываемся.

В этом учебном модуле мы будем изучать классификацию звука с помощью TensorFlow. Есть несколько способов создания модели для классификации звука. Вы можете использовать звукозаписи, разделы тегов WAV-файла или даже использовать компьютерное зрение в изображении спектрограмм. В этом учебнике сначала рассматривается распознавание звуковых данных, от аналоговых до цифровых. Затем мы создадим модель с помощью компьютерного зрения на изображениях спектрограмм. Правильно, вы можете превратить звук в изображение, а затем с помощью компьютерного зрения классифицировать произнесенное слово! Будет построена простая модель, которая может понимать yes и no. Набор данных, который мы будем использовать, — это команды речевого ввода в открытых наборах данных, встроенные в наборы данных TensorFlow. Этот набор данных содержит всего 36 различных слов и звуков, используемых для классификации. Каждый речевой фрагмент хранится в виде файла звукозаписи в формате WAVE длительностью в одну секунду (или менее). Для двоичной классификации мы будем использовать yes и no.

Цели обучения

  • Общие сведения о ключевых функциях звуковых данных.
  • Введение в создание моделей машинного обучения.
  • Узнайте, как создать модель двоичной классификации из волновых файлов.

Необходимые компоненты

  • Знание Python
  • Основные сведения о машинном обучении