Проект дистанционного обучения нейролингвистике

Глава 9 - Восприятие речи

9.4.10. Кортежные модели

А.В. Венцов, В.Б. Касевич *

Назад    Наверх    Вперед


Введение

Содержание

Глоссарий

Библиография

Разработчики

Под данным условным наименованием мы объединили модели, авторы которых разрабатывают систематические процедуры последовательного сужения класса поиска. Вероятно, наиболее известна модель когорты [Marslen-Wilson, Welsh, 1978]. Согласно соответствующим авторам, распознавание слов производится "слева направо": начальная цепочка входного сигнала проверяется на совпадение с аналогичными цепочками имеющихся словарных единиц. В разных работах по-разному оценивается, каким должен быть объем цепочки, с которой начинается процесс распознавания слова: иногда это минимум в одну-две фонемы [Tyier, Wessels, 1983], иногда такая цепочка описывается как состоящая из 3-5 фонем или приравнивается к первому слогу слова [Taft, Hambly, 1986; Segui, 1990; Shillcock, 1990], иногда же длительность цепочки оценивается во временных параметрах.

Перцептивная система активирует все слова словаря, содержащие данную начальную цепочку, которые и формируют класс выбора (поиска). Одна из возможностей ограничить класс - в идеале свести его к единице, т.е. распознать слово, заключается в продолжении анализа: если оказывается, что цепочка становится уникальной, решение принимается без дальнейшего обращения к фонетическим характеристикам слова; такую точку, после которой принимается решение о данном слове, называют "точкой распознавания". Установление точки распознавания может основываться и на отрицательном материале. Например, при восприятии фразы Tell the gardener to plant some more tulips точка распознавания для /tel/ устанавливается при формировании цепочки /teld/, поскольку а английском языке нет слова, начинающегося на /teld/ [Cole, Jakimik, 1980].

Положение о том, что перцептивная обработка слов осуществляется именно в направлении "слева направо", проверялось в экспериментах по семантической активации (semantic priming). Оказалось, что начальная цепочка capt английского языка активирует одновременно лексемы guard и ship, поскольку capt может быть началом как слова captive, так и слова captain. В отличие от этого, если испытуемым предъявляют конечную цепочку, например, attle, ср. battle, активации лексем типа war не происходит.

В более поздней версии модели Марслен-Вильсона [Marslen-Wilson, 1987; 1990] допускается вероятностная оценка совпадения анализируемой начальной цепочки с соответствующими цепочками словарных единиц; это делает стратегию более гибкой и не приводит к ситуации, когда неверная оценка одной-единственной начальной фонемы или ее вырожденная, ошибочная реализация делают идентификацию слова невозможной - при том, что, согласно имеющимся данным, ошибочное произнесение, например, grocodile, отнюдь не исключает адекватного восприятия слова crocodile [Taft, Hambly, 1986]. Учитываются также частотность слова и контекст: сужение класса поиска осуществляется за счет отбрасывания низкочастотных слов и слов, не соответствующих контексту.

В ряде работ показано, что обязательное прекращение фонетического анализа после точки распознавания является слишком сильным условием. Соглашаясь с ним, невозможно, в частности, объяснить распознавание незнакомых слов, уже начало которых характеризуется уникальным фонемным составом. Кроме того, при данном подходе оказывается, что суффиксы и окончания, нормально находящиеся "справа" от точки распознавания, выпадают из анализа, и идентификация многих, даже большинства, дериватов и словоформ становится невозможной [Shillcock, 1990]. Соответственно М. Тафт и Г. Хамбли, Р. Шиллкок предлагают свои модифицированные модели [Taft, Наmbly, 1986; Shillcock, 1990].

Другие авторы используют понятия, близкие к кортежу (когорте) Марслен-Вильсона, имея в виду классы поиска, организованные по другим принципам - не по совпадению начальной цепочки в экспонентах слов. Так, Дж. Худ и Дж. Пул [Hood, Poole, 1980] в экспериментах по восприятию на фоне шума обнаружили, что высокочастотные слова вопреки ожиданиям не всегда характеризуются лучшей разборчивостью. Д. Пизони и его соавторы [Pisoni, 1985] обследовали список слов, использовавшихся в экспериментах Худа и Пула, с точки зрения фонетических характеристик соответствующих лексических единиц. Было установлено, что 25 слов экспериментальной программы, которые отличала самая низкая разборчивость, в словаре объемом 20 тыс. слов имеют максимальное число квазиомонимов. Этот аспект, вообще говоря, обращал на себя внимание исследователей довольно давно: чем больше у слова квазиомонимов, тем хуже оно воспринимается. Из чего следует, очевидно, что классом поиска, кортежем (когортой) может быть и множество квазиомонимов.

Те же авторы [Luce, 1990] расширяют этот принцип, предлагая окрестностную модель (Neighborhood-Activation Model). В данной модели также происходит параллельное использование информации, относящейся к сигналу и характеристикам словарных единиц. Здесь, однако, кортеж составляется словами, совпадающими не обязательно начальными цепочками, но любыми характеристиками с точки зрения "фонетического сходства". Другая важная особенность заключается в том, что идентификация слова ставится в зависимость от объема класса поиска - в отличие от модели когорты, где этот параметр считается иррелевантным. Э. Бард предполагает, что полученный в экспериментах эффект объема когорты (кортежа) может в действительности объясняться влиянием частотности: в более обширном классе поиска вероятнее наличие высокочастотных слов, которые выступают "сильными соперниками" идентифицируемого слова [Bard, 1990, р.200].

Назад    Наверх    Вперед


* А.В. Венцов, В.Б. Касевич Современные модели восприятия речи: критический обзор
Проблемы восприятия речи // Издательство Санкт-Петербургского университета, Санкт-Петербург, 1994