Frozen Fido : RU.ALGORITHMS : Распознавание речи.

ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Roman Trishin                        2:463/480.13   10 Apr 2002  01:59:59
 To : Aleksey Malov
 Subject : Распознавание речи.
 --------------------------------------------------------------------------------

 Я заметил, что Втp Апp 09 2002 19:19, Aleksey Malov(2:5052/30.8) wrote to All:
 
  AM> В общем, задача:
  AM> Имеется некоторый набор голосовых команд, типа: "Стой", "Сидеть",
  AM> "Лежать", "Идти" (на самом деле, обычные короткие фразы). Пользователь
  AM> произносит какую-нибудь фразу из этого списка (или вообще какую-нибудь
  AM> левую фразу). Hадо как-то проанализировать произнесенную фразу и
  AM> определить, какую же он команду дал.
 
  AM> Вот такую лабу нам задали по "Компьютерным аудио-системам". Препод
  AM> говорит, что особой сложности эта задача не представляет, что надо делать
  AM> что-то типа сравнения фразы и оригинала и анализировать ошибку сравнения.
  AM> Hо мне кажется, что это полный бред, т.к. одну и ту же фразу произнести
  AM> очень похоже два раза практически невозможно (ошибки будут колоссальные).
 
      Есть два направления в распознавании речи - оператор-независимый анализ и
 зависимый. Второе реализовать несложно - дело в том, что если оператор старается
 говорить фразу с той же интонацией и темпом, то искажения будут минимальные...
 Тебе нужно делать следующее:
 1) например в WAV записать несколько раз необходимые слова (это _идеальные_
 сэмплы с ними ты будешь сравнивать) 2) нормализовать их по уровню 3)
 (нормализация) WAV-файлов по длине, чтобы каждое слово было по длине одинаково. 
 Это достигается заменой исходных точек звуковой волны средними величинами
 (например 20 точек в одну или наоборот). 3) теперь осталось ловить слова с
 микрофона, нормализовать их и анализировать. Для этого воспользуемся
 среднеквадратическим отклонением точек тестируемого сэмпла от идеального:
 S=1/n*(Хтест - Х_идеал)^2 где n-число точек в нормализованном сэмпле. Чем меньше
 число S, тем ближе тестируемый сигнал к идеальному.
 
  AM>  Может, есть какие-нибудь идеи. Желательно, простые, но работающие.
 
 С наилучшими пожеланиями Roman
 
 ... самая обычная кука.
 --- GoldED/386 3.00.Alpha5+
  * Origin: В каждой шутке есть доля шутки... (2:463/480.13)

Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор

Тема:	Автор:	Дата:
Распознавание речи.	Aleksey Malov	09 Apr 2002 19:19:26
Распознавание речи.	Alexey Vasilyev	09 Apr 2002 23:43:55
Распознавание речи.	Roman Trishin	10 Apr 2002 01:59:59
Распознавание речи.	Nickita A Startcev	10 Apr 2002 14:05:32
Распознавание pечи.	Alexander V. Lushnikov	18 Apr 2002 12:30:56
Распознавание pечи.	Nickita A Startcev	21 Apr 2002 15:40:40
Распознавание речи.	Alex Astafiev	10 Apr 2002 00:07:46
Re: Распознавание речи.	Sergey Kovalev	10 Apr 2002 18:17:04
Распознавание речи.	Alex Astafiev	11 Apr 2002 05:32:52
[+] Распознавание речи.	Comoderator Of Ru Algorithms	13 Apr 2002 09:35:38
Распознавание речи.	Aleksey Malov	10 Apr 2002 17:51:04
Распознавание pечи.	Alexander Grischuk	15 Apr 2002 12:55:36
Распознавание pечи.	Alexander Grischuk	15 Apr 2002 12:48:10
Распознавание pечи.	Sasha Smirnov	16 Apr 2002 13:29:24
Распознавание pечи.	Alexander Grischuk	23 Apr 2002 23:27:00
Распознавание pечи.	Alex Astafiev	16 Apr 2002 07:25:47
Распознавание pечи.	Vladislav Scherbakov	19 Apr 2002 16:21:49
Re: Распознавание речи.	Sergey Andrianov	11 Apr 2002 21:56:18
Hа: Распознавание речи.	Ђ«ҐЄбҐ© „.	17 Apr 2002 09:57:04
Распознавание pечи.	Alexander V. Lushnikov	18 Apr 2002 12:38:50

Архивное /ru.algorithms/156323cb3a2aa.html, оценка 2 из 5, голосов 10