Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Sergey Andrianov                     2:5020/1507.400 11 Apr 2002  21:56:18
 To : Aleksey Malov
 Subject : Re: Распознавание речи.
 -------------------------------------------------------------------------------- 
 
 
 Однажды 09-Apr-02  в 19:19   Aleksey Malov (2:5052/30.8)
 написал       All    по поводу
 -=-   Распознавание речи.  -=-
 AM> В общем, задача:
 AM> Имеется некоторый набор голосовых команд, типа: "Стой", "Сидеть", "Лежать", 
 
 AM> "Идти" (на самом деле, обычные короткие фразы).
 AM> Пользователь произносит какую-нибудь фразу из этого списка (или вообще 
 AM> какую-нибудь левую фразу). Hадо как-то проанализировать произнесенную 
 AM> фразу и определить, какую же он команду дал.
 
 AM> Вот такую лабу нам задали по "Kомпьютерным аудио-системам". Препод 
 AM> говорит, что особой сложности эта задача не представляет, что надо делать 
 AM> что-то типа сравнения фразы и оригинала и анализировать ошибку сравнения. 
 AM> Hо мне кажется, что это полный бред, т.к. одну и ту же фразу произнести 
 AM> очень похоже два раза практически невозможно (ошибки будут колоссальные).
 
 AM> Может, есть какие-нибудь идеи. Желательно, простые, но работающие. 
    
    Думаю, побайтное сравнение...
    1. Слишком ресурсоемко.
    2. Hе приведет к каким-либо положительным результатам, вследствие влияния 
 разброса фазы.
 
    Скорее всего, сначала следует существенно редуцировать данные. В качестве 
 одного их возможных вариантов могу предложить построить зависимость уровня 
 звука от времени (напрмер, возвести все отсчеты в квадрат, а затем пропустить 
 через фильтр с частотой среза 20-50 Гц), найти начало и конец и произвести 
 передискретизацию на гораздо более низкую частоту или даже вообще растянуть 
 равномено на всю длительность сигнала с сотню точек и уже только после этого 
 искать корреляцию. Да, частоту фильтра следует согласовать с частотой 
 последующей передискретизации, а крутизну брать побольше. И только потом искать 
 корреляцию.
    В качестве варианта того же самого, но только более надежного и 
 ресурсоемкого можно провести аналогичный анализ в нескольких спектральных 
 полосах. Правда, в этом случае, думаю, алгоритм обработки будет несколько 
 другой: Сначала также найти начало и конец, затем разбить сигнал на 
 определенное количество интервалов (дкмаю, здесь их будет нужно поменьше сотни, 
 штук 30, не больше). В каждом из интервалов произвести Фурье-анализ и получить 
 уже двумерный массив, по одной оси которого будет частота, а по другой время. И 
 уже здесь искать корреляцию.
 
                   До свидания,  в  21:01 MSK
                                  Sergey
 
 ---
  * Origin: Sergiev Posad (2:5020/1507.400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Распознавание речи.   Aleksey Malov   09 Apr 2002 19:19:26 
 Распознавание речи.   Alexey Vasilyev   09 Apr 2002 23:43:55 
 Распознавание речи.   Roman Trishin   10 Apr 2002 01:59:59 
 Распознавание речи.   Nickita A Startcev   10 Apr 2002 14:05:32 
 Распознавание pечи.   Alexander V. Lushnikov   18 Apr 2002 12:30:56 
 Распознавание pечи.   Nickita A Startcev   21 Apr 2002 15:40:40 
 Распознавание речи.   Alex Astafiev   10 Apr 2002 00:07:46 
 Re: Распознавание речи.   Sergey Kovalev   10 Apr 2002 18:17:04 
 Распознавание речи.   Alex Astafiev   11 Apr 2002 05:32:52 
 [+] Распознавание речи.   Comoderator Of Ru Algorithms   13 Apr 2002 09:35:38 
 Распознавание речи.   Aleksey Malov   10 Apr 2002 17:51:04 
 Распознавание pечи.   Alexander Grischuk   15 Apr 2002 12:55:36 
 Распознавание pечи.   Alexander Grischuk   15 Apr 2002 12:48:10 
 Распознавание pечи.   Sasha Smirnov   16 Apr 2002 13:29:24 
 Распознавание pечи.   Alexander Grischuk   23 Apr 2002 23:27:00 
 Распознавание pечи.   Alex Astafiev   16 Apr 2002 07:25:47 
 Распознавание pечи.   Vladislav Scherbakov   19 Apr 2002 16:21:49 
 Re: Распознавание речи.   Sergey Andrianov   11 Apr 2002 21:56:18 
 Hа: Распознавание речи.   Ђ«ҐЄбҐ© „.   17 Apr 2002 09:57:04 
 Распознавание pечи.   Alexander V. Lushnikov   18 Apr 2002 12:38:50 
Архивное /ru.algorithms/52053CB60682.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional