Проект дистанционного обучения нейролингвистике

Глава 9 - Восприятие речи

9.4.8. Модель "перцептивной стрелки"

А.В. Венцов, В.Б. Касевич *

Назад    Наверх    Вперед


Введение

Содержание

Глоссарий

Библиография

Разработчики

Настоящая модель отражена в нескольких публикациях Дж. Миллера и его соавторов [Miller, 1982; Miller, 1980; Miller, Jongman, 1987]. Модель содержит три основных компонента.

Первый компонент моделирует слуховую систему человека, его задача - устанавливать спектральные характеристики речевого сигнала. Результатом выступает лоцирование ("расположение") сигнала в n-мерном пространстве. Для гласных это пространство трехмерно, где в качестве трех его осей используются отношения формант: FI/kF0; F3/F2; F2/F1.

Второй компонент представлен механизмом, основной принцип работы которого реализуется как вращение "перцептивной стрелки" в указанном n-мерном пространстве. Стрелка пробегает значения, соответствующие данному сигналу, реагируя на них с постоянной времени 60-180 мс. Обладая инерцией и упругостью, "стрелка" при внезапной смене направления изменения параметров входного сигнала еще продолжает движение в прежнем направлении и "проскакивает" положение, соответствующее моменту этого внезапного изменения. Так, повышение F2 после взрыва в слоге [bа] приведет к тому, что "стрелка" укажет на большее, чем на стационарном участке гласного, значение F2, тогда как понижение F2 в слоге [da] приведет к обратному результату. После усреднения на интервале гласного (за счет большой постоянной времени) эффект коартикуляции будет нейтрализован; вернее, таково намерение автора модели, однако нет уверенности в том, что этот результат достижим столь простыми средствами.

Третий компонент модели ответствен за принятие решения относительно характера речевого сегмента; для гласных такой сегмент считается детектированным, когда движение "перцептивной стрелки" характеризуется медленной скоростью или сменой направления. По существу, как можно понять, речь идет о том, чтобы "отстроиться" от возмущений в сигнале и определить параметры квазистационарного участка с использованием избранной метрики. Вызывает, однако, сомнения возможность установить надежные численные константы, позволяющие различать события, относящиеся к коартикуляции, от информационно независимых его изменений. Кроме того, сомнительна и сама по себе абсолютность этого различия. Хорошо известно, например, что для губных мягких согласных русского языка сигналом мягкости выступает именно коартикуляционный эффект - [i]-образный тип формантного перехода от согласного к гласному. Утрата этой информации, будучи невосстановимой, сделает невозможной идентификацию согласного - хотя идентификация гласного без такой "помехи" окажется более простой задачей.

Назад    Наверх    Вперед


* А.В. Венцов, В.Б. Касевич Современные модели восприятия речи: критический обзор
Проблемы восприятия речи // Издательство Санкт-Петербургского университета, Санкт-Петербург, 1994