Каталог Рефератов - Компьютерная лингвистика как прикладная лингвистическая дисциплина

	Информационно-образоательный портал
	Рефераты, курсовые, дипломы, научные работы,



МЕНЮ\|

поиск

Компьютерная лингвистика как прикладная лингвистическая дисциплина

p align="left">Тесно связано с категорией фрейма понятие сцены. Категория сцены преимущественно используется в литературе как обозначение концептуальной структуры для декларативного представления актуализованных в речевом акте и выделенных языковыми средствами (лексемами, синтаксическими конструкциями, грамматическими категориями и пр) ситуаций и их частей5). Будучи связана с языковыми формами, сцена часто актуализуется определенным словом или выражением. В грамматиках сюжетов (см. ниже) сцена предстает как часть эпизода или повествования. Характерные примеры сцен - совокупность кубиков, с которыми работает система ИИ, место действия в рассказе и участники действия и т.д. В искусственном интеллекте сцены используются в системах распознавания образов, а также в программах, ориентированных на исследование (анализ, описание) проблемных ситуаций. Понятие сцены получило широкое распространение в теоретической лингвистике, а также логике, в частности в ситуационной семантике, в которой значение лексической единицы непосредственно связывается со сценой.

3. Некоторые направления компьютерной лингвистики
Обратимся к тем областям компьютерной лингвистики, которые непосредственно связаны с оптимизацией когнитивной функции языка. Ниже в качестве примера рассматриваются три сферы компьютерного моделирования, в которых используются знания о функционировании языковой системы: моделирование общения, моделирование структуры сюжета и гипертекстовые технологии представления текста.

Моделирование общения. В узком смысле проблематика компьютерной лингвистики часто связывается с моделированием общения, в частности, с обеспечением общения человека с ЭВМ на естественном или ограниченном естественном языке. Это относится к оптимизации языка как средства общения. Впрочем, компьютерные модели общения часто используются для изучения самого процесса общения. Остановимся подробнее на опыте создания и использования именно таких моделей.

Изучение уже накопившегося опыта эксплуатации компьютерных систем, требовавших обеспечения взаимодействия с ЭВМ на естественном языке, позволило исследователям по-новому взглянуть на функции и структуру естественной коммуникации. В центр внимания попали вопросы, которые ранее были на периферии теории диалога, дискурс-анализа и теории коммуникации. Что обеспечивает естественность общения? Каковы условия связности беседы? Когда общение оказывается успешным? В каких случаях возникают коммуникативные неудачи и можно ли их избежать? Какие стратегии общения используют участники коммуникативного взаимодействия при достижении своих коммуникативных целей? Это далеко не исчерпывающий список теоретических проблем, обнаружившихся в связи с функционированием компьютерных моделей общения.

Одной из наиболее интересных компьютерных моделей диалога, вызвавшей оживленные теоретические дискуссии, была программа Джозефа Вейценбаума "Элиза", первый вариант которой появился в 1966 г. Изначально "Элиза" создавалась как игрушка, как учебный образец программы-имитатора, целью которой является не моделирование мышления в точном смысле, а моделирование речевого поведения. Программа поддерживала разговор с собеседником в реальном масштабе времени, однако при ее разработке были использованы ограниченные программистские ресурсы, лингвистический анализ и синтез также были сведены к минимуму. Тем не менее программа функционировала столь успешно, что фактически опровергла известный тест Тьюринга на создание искусственного интеллекта. Как известно, Тьюринг вместо софистицированного обсуждения философского вопроса о том, может ли машина мыслить, предложил игровую задачу следующего типа. Пусть есть три участника: мужчина Л, женщина В и спрашивающий С. Спрашивающий не знает, кто мужчина, а кто - женщина. Задавая вопросы участникам игры, С должен попытаться определить, кто является мужчиной, а кто - женщиной, при этом участник пытается мистифицировать спрашивающего, выдавая ему не ложную, но искаженную информацию, а участник В - наоборот, стремится помочь С. Понятно, что общение происходит не напрямую, а через телетайп или с помощью записок, отпечатанных на пишущей машинке. Что произойдет, если в качестве А будет выступать система ИИ? Будет ли спрашивающий ошибаться столь же часто? [Turing 1950, р.434]. Более простой вариант этого теста сводится к тому, что несколько участников беседуют с некоторым другим участником X. Проблема построения искусственного интеллекта решена, если большинство участников не сможет установить, с кем они беседуют - с человеком или машиной.

Программа "Элиза" была использована группой исследователей во главе с М. Макгайром для изучения структуры диалога и особенностей естественноязыковой коммуникации [McGuire 1971]. В проводившемся эксперименте с "Элизой" беседовали в течение часа 24 испытуемых. Общение происходило с помощью телетайпа. За время беседы каждый участник ввел от 10 до 65 реплик и получил на них ответы. По окончании 15 участников (62%) были уверены, что им отвечал человек, 5 испытуемых (21%) обнаружили определенные колебания и лишь четверо участников (17%) были абсолютно уверены, что общались с ЭВМ. С лингвистической точки зрения алгоритмы программы "Элиза" включают минимум лингвистической информации. Во-первых, это комплекс ключевых слов, которые актуализуют некоторые устойчивые коммуникативные формулы (шаблоны), во-вторых, способность относительно несложно трансформировать предшествующее высказывание.

Интересно, что существенная тематическая ограниченность коммуникации и значительное количество ошибок и неточностей в ответе (порядка 19% неточных или выпадающих из контекста реплик "Элизы" в упоминавшемся эксперименте М. Макгайра), не помешали испытуемым признать партнера по коммуникации человеком. Дело здесь совсем не в патологической глупости испытуемых. Это проявление важнейшей особенности коммуникации на естественном языке: естественноязыковой дискурс очень терпим по отношению к сбоям и ошибкам - он избыточен и помехоустойчив. Реплики "Элизы", выпадавшие из нормального общения, испытуемые легко объясняли обычными сбоями в понимании своей предшествующей реплики, не вполне нормальными условиями общения, шутливым настроением партнера. Устойчивость естественного дискурса объясняется также способностями человека к интерпретации речевых действий: человек, принимающий роль участника диалога, ведет себя соответствующим образом. Имея установку на общение, он стремится включать в коммуникацию все то, что по форме напоминает речевой акт, реплику. Иными словами, он склонен наделять смыслом то, что часто смысла не имеет. В этом случае испытуемые сами порождают смысл диалога, сами обеспечивают его связность, сами приписывают партнеру коммуникативные интенции.

Второй важный вывод эксперимента: испытуемые довольно быстро принимали решение о том, кто перед ними - компьютер или человек.22 участника из 24 уяснили для себя ситуацию не более, чем за пять обменов репликами, и далее не меняли своего решения. Определение ролей в коммуникации относится к метауровню общения, поскольку это составляет одну из предпосылок успешной коммуникации, предохраняющей общение от многочисленных коммуникативных неудач.

Понятно, что определение ролей участников во многом определяет выбор стратегии коммуникативного поведения. Действительно, лучше сразу определить, с кем мы разговариваем по телефону - с давним другом или чиновником налоговой инспекции. Выяснение того, кем является собеседник - машиной или человеком, также относится к метауровню общения, и испытуемые старались установить ролевые характеристики партнера как можно раньше.

Это свойство естественноязыковой коммуникации можно назвать принципом приоритета метакоммуникативных параметров ситуации общения.

Третье важное следствие из эксперимента М. Макгайра связано с существованием различных типов коммуникативного взаимодействия между людьми. Успешное взаимодействие между человеком и программой типа "Элиза" возможно только в ситуации, когда происходит так называемое "ассоциативное общение", при котором реплики диалога связаны не столько логическими отношениями типа "причина-следствие", "посылка-заключение", а ассоциациями. Ассоциативное общение не имеет конкретной направленности; само поддержание беседы может служить ее оправданием. Собеседники не преследуют цели решить какую-то проблему или выработать единую точку зрения на какой-то вопрос. В классификации Р. Якобсона для коммуникации такого типа предложен термин "фатическое общение" [Якобсон 1975]. Заметим, что беседа врача-психиатра с пациентом по форме также имеет вид фатического общения, хотя и преследует вполне определенные цели сбора данных о заболевании пациента и последующем вербальном и невербальном воздействии на его психику для достижения лечебного эффекта. "Элиза" не смогла бы успешно имитировать общение в коммуникативной ситуации, названной М. Макгайром "решение задач", поскольку она не способна понять проблемную ситуацию, то есть построить модель мира дискурса, определить альтернативы выхода из проблемы, выбрать одну из альтернатив и т.д. Одна из типичных стратегий "ухода от непонимания", реализованная в программе "Элиза" - смена темы беседы. Очевидно, что такая стратегия ведения беседы вряд ли приведет к успеху при совместном поиске решения проблемы.

Наконец, четвертый вывод можно сформулировать как неуниверсальность правил коммуникативного взаимодействия. Он касается самих закономерностей общения на естественном языке. Каждый тип коммуникации обслуживается своим набором относительно простых правил, обеспечивающих связность дискурса, его осмысленность для участников. Типология видов общения задается соответствующими наборами правил. Из экспериментов М. Макгайра с программой "Элиза" следует, что кроме ассоциативного (= фатического) способа общения, выделяется еще "решение задач", "задавание вопросов" и "уточнение понимания". С лингвистической точки зрения эти типы, скорее всего, неоднородны, пересекаются и даже находятся на разных уровнях дискурса. Так, "уточнение понимания" относится к метауровню коммуникации, "задавание вопросов" может быть частью стратегии "решение задач" и "уточнения понимания" и т.д. Существенно, что компьютерный эксперимент с программой, моделирующей поведение участника коммуникации, позволяет экспериментально подтвердить или опровергнуть многие положения теории диалога, разработанные как в лингвистике, так и в смежных дисциплинах - в дискурс-анализе, теории коммуникации, психологии и социологии общения.

Моделирование структуры сюжета. Изучение структуры сюжета относится к проблематике структурного литературоведения (в широком смысле), психологии творчества и культурологии. Имеющиеся компьютерные программы моделирования сюжета основываются на трех базовых формализмах представления сюжета - морфологическом и синтаксическом направлениях представления сюжета, а также на когнитивном подходе.

"Морфология" сюжета. Идеи о морфологическом устройстве структуры сюжета восходят к известным работам В.Я. Проппа о русской волшебной сказке [Пропп 1928; Пропп 1986]. Пропп заметил, что при обилии персонажей и событий волшебной сказки количество функций персонажей ограничено: "Постоянными, устойчивыми элементами сказки служат функции действующих лиц, независимо от того, кем и как они выполняются. Они образуют основные составные части сказки" [Пропп 1928, с.31]. К числу базовых относятся, например, следующие функции:

отлучение персонажа сказки из дома;

запрет герою на действие;

нарушение запрета;

получение вредителем информации о жертве;

обман жертвы вредителем;

невольное пособничество жертвы вредителю и т.д.

Идеи Проппа легли в основу компьютерной программы TALE, моделирующей порождение сюжета сказки. В основу алгоритма программы TALE положена последовательность функций персонажей сказки. Фактически функции Проппа задавали множество типизированных ситуаций, упорядоченных на основе анализа эмпирического материала. Возможности сцепления различных ситуаций в правилах порождения определялись типичной последовательностью функций - в том виде, в котором это удается установить из текстов сказок. В программе типичные последовательности функций описывались как типовые сценарии встреч персонажей.

В дальнейшем система была усложнена за счет введения модели мира сказки, география которого состоит из обычного мира, промежуточного (среднего) мира и иного мира [Гаазе-Рапопорт, Поспелов, Семенова 1984]. Каждый мир состоит из локусов, связанных между собой определенными отношениями. Отношения связывают не только локусы внутри каждого мира, но и локусы различных миров. Обычный мир состоит из следующих локусов: место проживания героя (локус 1), место получения задания (локус Г), место дарения волшебных предметов, помогающих выполнить задание. Первый локус и локус штрих часто совпадают (ср. сказки о Падчерице и злой Мачехе). К обычному миру относятся также локусы 3 (их может быть много), в которых преодолеваются препятствия с помощью волшебных предметов. Количество препятствий, как правило, совпадает с количеством волшебных предметов. После преодоления препятствий герой оказывается в промежуточном мире, стражем которого является Баба-Яга. Средний мир отделяет мир героев от мира антигероев. Функции Бабы-Яги различаются - она может выступать как дарительница информации или очередного волшебного средства, а может выступать на стороне антигероев (например, при акценте на людоедском поведении Бабы-Яги). Иной мир включает место обитания антигероя (локус 5), место битвы между героем и антигероем (локус 6) и, наконец, локус 7 - место награды или цели, которой добивается герой. Локусы связаны отношениями перехода, которые представляют возможные последовательности развертывания сюжета.

Модифицированная версия программы TALE имеет следующую блок-схему [Гаазе-Рапопорт, Поспелов, Семенова 1984, с.52]:

Блок-схема программы TALE

Работа программы начинается с первого блока, в котором выбирается тип сюжета сказки и ее персонажи. Здесь же формируется экспозиция сказки (setting). Во втором блоке хранятся описания, связанные с персонажами, а в четвертом - постоянные характеристики персонажей. Описания даются во фреймоподобных структурах представления знаний. С помощью второго и третьего блоков формируются мотивы и поступки персонажей. Третий блок задает последовательность движения персонажей по локусам. В последнем (шестом) блоке происходит сборка порожденных фрагментов сказки.

Страницы: 1, 2, 3

© 2003-2013
Рефераты бесплатно, курсовые, рефераты биология, большая бибилиотека рефератов, дипломы, научные работы, рефераты право, рефераты, рефераты скачать, рефераты литература, курсовые работы, реферат, доклады, рефераты медицина, рефераты на тему, сочинения, реферат бесплатно, рефераты авиация, рефераты психология, рефераты математика, рефераты кулинария, рефераты логистика, рефераты анатомия, рефераты маркетинг, рефераты релиния, рефераты социология, рефераты менеджемент.