|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Vladimir Vassilevsky 2:5020/175.2 11 Jul 2003 06:24:15 To : Artem Anisimov Subject : speech start/end point detection -------------------------------------------------------------------------------- Fri Jul 11 2003 01:47, Artem Anisimov wrote to All: AA> Как опpеделить начало и конец pечевой фpазы в аудиопотоке, пpи условии AA> отсутствия "содеpжательно" звукового фона (только шум) ? Стандартная задача на Voice Activity Detector (VAD). Идея в том, что речь - сигнал с нестационарным спектром. То есть оценивать надо не только мощность, но и скорость изменения спектра. Проще всего это делается так: ЛПК-анализ с длиной кадра порядка 30ms. Потом оценка мощности остаточного сигнала после ЛПК. Дополнительно можно оценивать основной тон. Если тон не меняется в течение нескольких кадров, то это не речь, а шум. AA> Подскажите чего-нибудь? Можно ссылку в и-нет. Смотри исходники GSM.6.10. Там есть VAD. VLV "Из всех дураков наиболее несносны те, которые не совсем лишены ума" (с) --- ifmail v.2.15dev5 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/3300c387f3f6.html, оценка из 5, голосов 10
|