Проект дистанционного обучения нейролингвистике

Глава 9 - Восприятие речи

9.5.3. Основные характеристики новой модели

Ю.И. Кузьмин *

Назад    Наверх    Вперед


Введение

Содержание

Глоссарий

Библиография

Разработчики

Формулируя основные свойства новой модели, мы исходили из того, что она должна базироваться исключительно на экспериментальных данных и объяснять предельно широкий круг явлений, а именно: данные о структуре речевого сигнала на артикуляторном уровне; данные о распределении информации в акустическом сигнале; эффекты, характерные для обычной речи, такие как оговорки и паузы-хезитации; особенности строения специальных текстов - стихов, скороговорок и т. п.; закономерности ошибок при восприятии искаженной речи; закономерности становления речи у детей; сведения о процессах письма и чтения; закономерности звуковых и других нарушений при патологии речи.

Узловыми в любой модели мы считали допущения относительно субъективного описания звуковой структуры слов, поскольку эти допущения предопределяют алгоритмы анализа акустического сигнала при восприятии речи, принципы организации субъективного словаря, возможные алгоритмы образования производных грамматических форм и возможные способы взаимодействия систем восприятия и образования речи.

Учитывая перечисленные требования, мы остановились на модели, основные допущения которой сводятся к следующему:

1. В процессе восприятия речи человек распознает единицы порядка слова или морфемы, т. е. такие единицы, которые необходимы для последующего грамматического анализа фраз.

2 Описания звукового состава распознаваемых единиц в долговременной памяти являются структурированными, т.е. основанными на некоторой системе признаков, которые должны детектироваться в процессе звукового анализа воспринимаемых речевых сообщений.

3. Система признаков, используемых при распознавания слов, является иерархически организованной и включает как интегральные характеристики слова (в частности, признаки ударенности), так и признаки, трактуемые обычно как признаки фонем.

4. Временная последовательность признаков в структуре слова задается путем их привязки друг к другу, что исключает необходимость "стягивания" информации в "пучки" типа фонем. При этом признаки меньшей размерности, характеризующие отдельные сегменты (участки слова), привязаны к признакам большей размерности, таким как просодические характеристики. В этом смысле сегментные характеристики являются вторичными, надпросодическими.

5. Информация о звуковой структуре речевых сигналов (слов или логотомов), полученная при анализе воспринимаемых сообщений, по крайней мере, в общих чертах соответствует структуре артикуляторных программ и может непосредственно передаваться в систему речеобразования.

По существу, изложенная модель предусматривает аналоговый способ описания звуковых структур и не требует сегментации сигнала на однотипные элементы. Признаки, трактуемые обычно как дифференциальные признаки фонем, представлены в ней как признаки более крупных единиц. Предусматривая взаимное согласование признаков, модель исключает необходимость какой-то внешней нумерации акустических и артикуляторных событий в пределах слова или фразы, что требуется при дискретном описании звукового состава этих единиц. Существенной особенностью модели является также то, что она устраняет двойное кодирование звукового состава слов - их кодирование в виде последовательности фонем и кодирование фонем в системе акустических признаков.

В дальнейшем оказалось возможным представить отдельные элементы модели более конкретно. Во-первых, мы учли сходство между артикуляторными ошибками и ошибками восприятия, а именно тот факт, что ошибки того и другого типа могут быть описаны как определенные преобразования звуковых структур - как выпадения, перемещения и взаимные замены акустических или артикуляторных признаков. Это привело к следующей идее. Видимо, контрасты между слуховыми образами слов и контрасты между артикуляторными программами можно считать идентичными, если контрастирующие объекты при том и другом способе их описания связаны идентичными преобразованиями. Из этой идеи вытекает возможность представить взаимодействие системы образования и восприятия речи как соотношения типа изоморфизма. Иными словами, можно предположить, что эти системы обмениваются информацией не о конкретных признаках сигнала, а о характере текущих его изменений. На наш взгляд, такая трактовка полезна для понимания целого ряда явлений, включая процессы освоения звукового состава речи в онтогенезе и механизмы акустической обратной связи у взрослых лиц. Конкретным проявлением предполагаемого взаимодействия между системами восприятия и образования речи можно считать случаи необычной реализации звуковых контрастов у детей, когда звуковые противопоставления одного типа воспроизводятся детьми как контрасты другого типа.

Далее мы обратили внимание на то, что изменения звуковой структуры слов при образовании производных грамматических форм также могут быть представлены в виде преобразований (трансформаций), сходных с теми, которые имеют место при артикуляторных ошибках. В силу такого сходства артикуляторные ошибки, наблюдающиеся при оговорках, зачастую трудно отличить от тех, которые связаны с неправильными словоизменениями. Если предположить, что производные формы можно рассматривать как результат некоторого преобразования основной формы, возникает возможность сблизить во времени процессы звукового анализа слов при их восприятии и процессы морфологического их анализа. А именно, можно представить, что человек, воспринимая некоторую звуковую структуру, может интерпретировать ее либо как основную форму (элемент словаря), либо как производную форму, полученную из основной применением определенного преобразования. В этом случае основную форму можно рассматривать как носитель лексического значения, а использованное ее преобразование - как носитель информации о грамматической функции. Отметим, что такой механизм при отсутствии достаточной информации в сигнале позволяет принимать конкурирующие решения.
Рис. 1
Рис. 1. Схема, иллюстрирующая выделение признаков согласного слога в отдельном информационном канале (в одном параметре сигнала). По горизонтали - время. Вертикальные смещения кривых характеризуют выраженность признака. Остальные пояснения - в тексте.


Близкий механизм можно предложить для объяснения сходства временных задержек при опознании звуковых элементов разной размерности, в частности, звуков и слогов. В нашей модели в соответствии с принципом иерархической организации звуковых структур конкретный звук (напр., согласный) оказывается результатом дополнительной спецификации акустических признаков слога или слова. При этом наличие согласного может деформировать те акустические признаки, которые характеризуют данный слог или слово в целом. Такие деформации сами по себе характеризуют присутствие определенного звука или определенного его признака. Например, звонкие и глухие согласные по-разному деформируют контур основного тона, а также акустические признаки, характеризующие степень раскрытия рта [Кузьмин, 1966]. Однако чтобы выделить соответствующую информацию, необходимо определить, какие изменения регистрируемого параметра связаны с реализацией слога (слова) в целом и какие его изменения вызваны артикуляциями конкретного согласного. Рационально предположить, что система восприятия речи решает эту задачу, разлагая сигнал в каждом информационном канале на составляющие, как это показано на рис.1. Верхняя кривая на этом рисунке характеризует реальные изменения некоторого признака в анализируемом сигнале; средняя кривая - возможные его изменения при отсутствии деформаций; нижняя кривая - изменения признака, обусловленные деформациями, т.е. артикуляциями конкретного звука. Если такой механизм действительно имеет место, решения о признаках разной размерности могут приниматься одновременно, что согласуется с данными о задержках опознания звуков и слогов.

Назад    Наверх    Вперед


* Ю.И. Кузьмин Модели нормального процесса речи и механизмы речевых нарушений// Механизм речевого процесса и реабилитация больных с речевыми нарушениями. - М., 1989.