|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Roman Trishin 2:463/480.13 10 Apr 2002 01:59:59 To : Aleksey Malov Subject : Распознавание речи. -------------------------------------------------------------------------------- Я заметил, что Втp Апp 09 2002 19:19, Aleksey Malov(2:5052/30.8) wrote to All: AM> В общем, задача: AM> Имеется некоторый набор голосовых команд, типа: "Стой", "Сидеть", AM> "Лежать", "Идти" (на самом деле, обычные короткие фразы). Пользователь AM> произносит какую-нибудь фразу из этого списка (или вообще какую-нибудь AM> левую фразу). Hадо как-то проанализировать произнесенную фразу и AM> определить, какую же он команду дал. AM> Вот такую лабу нам задали по "Компьютерным аудио-системам". Препод AM> говорит, что особой сложности эта задача не представляет, что надо делать AM> что-то типа сравнения фразы и оригинала и анализировать ошибку сравнения. AM> Hо мне кажется, что это полный бред, т.к. одну и ту же фразу произнести AM> очень похоже два раза практически невозможно (ошибки будут колоссальные). Есть два направления в распознавании речи - оператор-независимый анализ и зависимый. Второе реализовать несложно - дело в том, что если оператор старается говорить фразу с той же интонацией и темпом, то искажения будут минимальные... Тебе нужно делать следующее: 1) например в WAV записать несколько раз необходимые слова (это _идеальные_ сэмплы с ними ты будешь сравнивать) 2) нормализовать их по уровню 3) (нормализация) WAV-файлов по длине, чтобы каждое слово было по длине одинаково. Это достигается заменой исходных точек звуковой волны средними величинами (например 20 точек в одну или наоборот). 3) теперь осталось ловить слова с микрофона, нормализовать их и анализировать. Для этого воспользуемся среднеквадратическим отклонением точек тестируемого сэмпла от идеального: S=1/n*(Хтест - Х_идеал)^2 где n-число точек в нормализованном сэмпле. Чем меньше число S, тем ближе тестируемый сигнал к идеальному. AM> Может, есть какие-нибудь идеи. Желательно, простые, но работающие. С наилучшими пожеланиями Roman ... самая обычная кука. --- GoldED/386 3.00.Alpha5+ * Origin: В каждой шутке есть доля шутки... (2:463/480.13) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/156323cb3a2aa.html, оценка из 5, голосов 10
|