Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Roman Trishin                        2:463/480.13   10 Apr 2002  01:59:59
 To : Aleksey Malov
 Subject : Распознавание речи.
 -------------------------------------------------------------------------------- 
 
 Я заметил, что Втp Апp 09 2002 19:19, Aleksey Malov(2:5052/30.8) wrote to All:
 
  AM> В общем, задача:
  AM> Имеется некоторый набор голосовых команд, типа: "Стой", "Сидеть",
  AM> "Лежать", "Идти" (на самом деле, обычные короткие фразы). Пользователь
  AM> произносит какую-нибудь фразу из этого списка (или вообще какую-нибудь
  AM> левую фразу). Hадо как-то проанализировать произнесенную фразу и
  AM> определить, какую же он команду дал.
 
  AM> Вот такую лабу нам задали по "Компьютерным аудио-системам". Препод
  AM> говорит, что особой сложности эта задача не представляет, что надо делать
  AM> что-то типа сравнения фразы и оригинала и анализировать ошибку сравнения.
  AM> Hо мне кажется, что это полный бред, т.к. одну и ту же фразу произнести
  AM> очень похоже два раза практически невозможно (ошибки будут колоссальные).
 
      Есть два направления в распознавании речи - оператор-независимый анализ и
 зависимый. Второе реализовать несложно - дело в том, что если оператор старается
 говорить фразу с той же интонацией и темпом, то искажения будут минимальные...
 Тебе нужно делать следующее:
 1) например в WAV записать несколько раз необходимые слова (это _идеальные_
 сэмплы с ними ты будешь сравнивать) 2) нормализовать их по уровню 3)
 (нормализация) WAV-файлов по длине, чтобы каждое слово было по длине одинаково. 
 Это достигается заменой исходных точек звуковой волны средними величинами
 (например 20 точек в одну или наоборот). 3) теперь осталось ловить слова с
 микрофона, нормализовать их и анализировать. Для этого воспользуемся
 среднеквадратическим отклонением точек тестируемого сэмпла от идеального:
 S=1/n*(Хтест - Х_идеал)^2 где n-число точек в нормализованном сэмпле. Чем меньше
 число S, тем ближе тестируемый сигнал к идеальному.
 
  AM>  Может, есть какие-нибудь идеи. Желательно, простые, но работающие.
 
 С наилучшими пожеланиями Roman
 
 ... самая обычная кука.
 --- GoldED/386 3.00.Alpha5+
  * Origin: В каждой шутке есть доля шутки... (2:463/480.13)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Распознавание речи.   Aleksey Malov   09 Apr 2002 19:19:26 
 Распознавание речи.   Alexey Vasilyev   09 Apr 2002 23:43:55 
 Распознавание речи.   Roman Trishin   10 Apr 2002 01:59:59 
 Распознавание речи.   Nickita A Startcev   10 Apr 2002 14:05:32 
 Распознавание pечи.   Alexander V. Lushnikov   18 Apr 2002 12:30:56 
 Распознавание pечи.   Nickita A Startcev   21 Apr 2002 15:40:40 
 Распознавание речи.   Alex Astafiev   10 Apr 2002 00:07:46 
 Re: Распознавание речи.   Sergey Kovalev   10 Apr 2002 18:17:04 
 Распознавание речи.   Alex Astafiev   11 Apr 2002 05:32:52 
 [+] Распознавание речи.   Comoderator Of Ru Algorithms   13 Apr 2002 09:35:38 
 Распознавание речи.   Aleksey Malov   10 Apr 2002 17:51:04 
 Распознавание pечи.   Alexander Grischuk   15 Apr 2002 12:55:36 
 Распознавание pечи.   Alexander Grischuk   15 Apr 2002 12:48:10 
 Распознавание pечи.   Sasha Smirnov   16 Apr 2002 13:29:24 
 Распознавание pечи.   Alexander Grischuk   23 Apr 2002 23:27:00 
 Распознавание pечи.   Alex Astafiev   16 Apr 2002 07:25:47 
 Распознавание pечи.   Vladislav Scherbakov   19 Apr 2002 16:21:49 
 Re: Распознавание речи.   Sergey Andrianov   11 Apr 2002 21:56:18 
 Hа: Распознавание речи.   Ђ«ҐЄбҐ© „.   17 Apr 2002 09:57:04 
 Распознавание pечи.   Alexander V. Lushnikov   18 Apr 2002 12:38:50 
Архивное /ru.algorithms/156323cb3a2aa.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional