Учебники

Распознавание голоса

Биометрическая модальность распознавания голоса представляет собой комбинацию как физиологических, так и поведенческих модальностей. Распознавание голоса — это не что иное, как распознавание звука. Он опирается на особенности под влиянием —

  • Физиологический компонент — физическая форма, размер и здоровье голосовой связки человека, а также губ, зубов, языка и полости рта.

  • Поведенческий компонент — эмоциональный статус человека во время разговора, акценты, тон, тон, темп речи, бормотание и т. Д.

Физиологический компонент — физическая форма, размер и здоровье голосовой связки человека, а также губ, зубов, языка и полости рта.

Поведенческий компонент — эмоциональный статус человека во время разговора, акценты, тон, тон, темп речи, бормотание и т. Д.

Система распознавания голоса

Распознавание голоса также называется распознаванием динамика. Во время регистрации пользователю необходимо произнести слово или фразу в микрофон. Это необходимо для приобретения образца речи кандидата.

Электрический сигнал с микрофона преобразуется в цифровой сигнал с помощью аналого-цифрового преобразователя (АЦП). Он записывается в память компьютера в виде оцифрованного образца. Затем компьютер сравнивает и пытается сопоставить входной голос кандидата с сохраненным оцифрованным голосовым образцом и идентифицирует кандидата.

Распознавание голоса

Методы распознавания голоса

Существует два варианта распознавания голоса — зависимый от говорящего и независимый от говорящего .

Зависимое от говорящего распознавание голоса опирается на знание конкретных характеристик голоса кандидата. Эта система изучает эти характеристики посредством голосового обучения (или регистрации).

  • Система должна быть обучена пользователям, чтобы она привыкла к определенному акценту и тону, прежде чем использовать ее для распознавания того, что было сказано.

  • Это хороший вариант, если только один пользователь будет использовать систему.

Система должна быть обучена пользователям, чтобы она привыкла к определенному акценту и тону, прежде чем использовать ее для распознавания того, что было сказано.

Это хороший вариант, если только один пользователь будет использовать систему.

Системы, независимые от говорящего, могут распознавать речь от разных пользователей, ограничивая контексты речи, такие как слова и фразы. Эти системы используются для автоматизированных телефонных интерфейсов.

  • Они не требуют обучения системы каждому отдельному пользователю.

  • Они являются хорошим выбором для использования разными людьми, когда не требуется распознавать речевые характеристики каждого кандидата.

Они не требуют обучения системы каждому отдельному пользователю.

Они являются хорошим выбором для использования разными людьми, когда не требуется распознавать речевые характеристики каждого кандидата.

Разница между распознаванием голоса и речи

Распознавание говорящего и распознавание речи ошибочно воспринимаются как одно и то же; но это разные технологии. Давайте посмотрим, как —

Он чувствителен к качеству микрофона и шуму.

Неспособность контролировать факторы, влияющие на систему ввода, может значительно снизить производительность.

Некоторые системы проверки динамиков также подвержены подделке атак с помощью записанного голоса.

Выполнение телефонных и интернет транзакций.

Работа с банковскими системами и системами здравоохранения на основе интерактивного голосового ответа (IRV).

Применение звуковых подписей для цифровых документов.

В сфере развлечений и экстренных служб.

В системах онлайн-образования.