на тему рефераты Информационно-образоательный портал
Рефераты, курсовые, дипломы, научные работы,
на тему рефераты
на тему рефераты
МЕНЮ|
на тему рефераты
поиск
Компьютерная лингвистика как прикладная лингвистическая дисциплина
лок-схема модифицированного варианта программы TALE показывает, что чисто "морфологического" подхода к структуре сюжета сказки явно недостаточно. "Морфемы" сказочного сюжета должны не только определенным образом сочетаться между собой, но и иметь специфические ограничения на сочетаемость. Фиксация одного типичного порядка следования функций персонажей волшебной сказки существенно ограничивает имеющиеся возможности сочетаемости. Более адекватное решение этой проблемы дает синтаксический подход к структуре сюжета.

"Синтаксис" сюжета. Теоретическую основу синтаксического подхода к сюжету текста составили "сюжетные грамматики" (story grammars). Сюжетные грамматики появились в середине 70-х гг. в результате переноса идей порождающей грамматики Н. Хомского на описание макроструктуры текста. Если важнейшими составляющими синтаксической структуры в порождающей грамматике были глагольные и именные группы, то в большинстве сюжетных грамматик в качестве базовых выделялись экспозиция (setting), событие и эпизод. В теории сюжетных грамматик широко обсуждались условия минимальности: ограничения, определявшие статус последовательности из элементов сюжета как нормальный сюжет. Оказалось, однако, что чисто лингвистическими методами это сделать невозможно. Многие ограничения носят социокультурный характер. Сюжетные грамматики, существенно различаясь набором категорий в дереве порождения, допускали весьма ограниченный набор правил модификации нарративной структуры. В подавляющем большинстве случаев эти правила заимствованы из той же порождающей грамматики. Потенциал варьирования структуры сюжета обеспечивается в первую очередь трансформациями передвижения и опущения. Например, текст признания преступника, фиксирующий реальную последовательность развертывания событий в преступлении, можно с помощью перестановок и опущений преобразовать в детективный сюжет: {преступник > замысел > орудие убийства > место > убийство > обнаружение трупа > поиски преступника} > {обнаружение трупа > обнаружение орудия убийства > поиски преступника}.

Использование сюжетных грамматик в компьютерном моделировании оказалось не вполне удачным. Синтактический компонент сюжета, описываемый грамматиками, отражает чисто внешние особенности текста. Не удается обнаружить операциональные критерии выделения различных составляющих сюжета.

Основной вывод дискуссии о недостатках сюжетных грамматик свелся к необходимости описания сюжета в рамках структуры целесообразной деятельности, то есть с привлечением категорий "цель", "проблема", "план" и т.д. Иными словами, метаязыка, учитывающего только внешние особенности сюжета, явно недостаточно. Необходимо обращение к когнитивным состояниям персонажей.

Когнитивный подход к сюжету. В начале 80-х гг. одной из учениц Р. Шенка - В. Ленерт - в рамках работ по созданию компьютерного генератора сюжетов был предложен оригинальный формализм аффективных сюжетных единиц (АСЕ - Affective Plot Units), оказавшийся мощным средством представления структуры сюжета [Lehnert 1982]. При том, что он был изначально разработан для системы ИИ, этот формализм использовался в чисто теоретических исследованиях. Сущность подхода Ленерт заключалась в том, что сюжет описывался как последовательная смена когнитивно-эмоциональных (аффективных) состояний персонажей. Тем самым в центре внимания формализма Ленерт стоят не внешние компоненты сюжета - экспозиция, событие, эпизод, мораль - а его содержательные характеристики. В этом отношении формализм Ленерт отчасти оказывается возвращением к идеям Проппа.

Каждая аффективная сюжетная единица представляет собой бинарное отношение, связывающее некоторые события, оцениваемые персонажами положительно (+) или отрицательно (-), и когнитивно-эмоциональные состояния персонажей (в различных комбинациях - событие & состояние; событие & событие и т.д.). Бинарное отношение не однородно. Всего выделяется пять типов бинарных отношений, специфицируемых в каждой аффективной сюжетной единице. Бинарное отношение может быть мотивацией (обозначение - т), актуализацией (а), прекращением одного действия другим (t), эквивалентностью (е), а также аффективной каузальной связью между персонажами. Каждая аффективная сюжетная единица получает название, например, УСПЕХ, НЕУДАЧА, УПОРСТВО, ПРОБЛЕМА и т.д.

4. Гипертекстовые технологии представления текста

Феномен гипертекста можно обсуждать с нескольких точек зрения. С одной стороны, это особый способ представления, организации текста, с другой - новый вид текста, противопоставленный по многим своим свойствам обычному тексту, сформированному в гутенберговской традиции книгопечатания. И, наконец, это новый способ, инструмент и новая технология понимания текста.

Теоретические основания гипертекста. Многие исследователи рассматривают создание гипертекста как начало новой информационной эпохи, противопоставленной эре книгопечатания. Линейность письма, внешне отражающая линейность речи, оказывается фундаментальной категорией, ограничивающей мышление человека и понимание текста. Мир смысла нелинеен, поэтому сжатие смысловой информации в линейном речевом отрезке требует использования специальных "коммуникативных упаковок" - членение на тему и рему, разделение плана содержания высказывания на эксплицитные (утверждение, пропозиция, фокус) и имплицитные (пресуппозиция, следствие, импликатура дискурса) слои. Отказ от линейности текста и в процессе его представления читателю (чтения и понимания), и в процессе синтеза, по мнению теоретиков, способствовал бы "освобождению" мышления и даже возникновению его новых форм.

Прототипический текст - это монолог. Между тем многие лингвисты (и среди них М. Бахтин и Л. Якубинский) указывали на вторичность монолога по сравнению с диалогом. Гипертекст с этой точки зрения позволяет устранить искусственную монологичность текста.

Обычный текст, как правило, имеет автора. Гипертекст автора в традиционном понимании не имеет - у него множество авторов, причем для постоянно изменяющегося гипертекста авторский коллектив также постоянно меняется. Изменение статуса автора меняет и статус читателя: в гипертекстовой системе понимание часто сопровождается изменением компонентов гипертекста или, как минимум, выбором пути просмотра, что опять-таки акт творческий, авторский.

Множественность авторства имеет и еще одно следствие: в гипертексте представлено много точек зрения на проблему, а в обычном тексте - только одна. Именно поэтому гипертекст более объективен и более толерантен к читателю, чем классический текст.

Гипертекстовые технологии позволяют легко сочетать различные виды информации - обычный текст, рисунок, график, таблицу, схему, звук и движущееся изображение. Как традиционный текст, так и гипертекст - феномены, порожденные новыми технологиями. В первом случае технология позволила легко тиражировать и распространять знания самых различных типов, а во втором - компьютерные технологии дали возможность изменить сам внешний вид текста и его структуру. Разнородность гипертекста - это первое технологическое свойство гипертекста, технологическое в том смысле, что оно непосредственно следует из используемой компьютерной технологии. Второе технологическое свойство гипертекста - его нелинейность. Гипертекст не имеет стандартной, обычной последовательности чтения. Прочие свойства гипертекста в той или иной степени являются следствиями из этих двух технологических свойств.

Суммировать различия текста и гипертекста можно следующим образом:

конечность, законченность традиционного текста vs. бесконечность, незаконченность, открытость гипертекста;

линейность текста vs. нелинейность гипертекста;

точное авторство текста vs. отсутствие авторства (в традиционном понимании) у гипертекста;

снятие противопоставления между автором и читателем;

субъективность, односторонность обычного текста vs. объективность, многосторонность гипертекста;

однородность обычного текста vs. неоднородность гипертекста.

Компоненты гипертекста. Структурно гипертекст может быть представлен как граф, в узлах которого находятся традиционные тексты или их фрагменты, изображения, таблицы, видеоролики и т.д. Узлы связаны разнообразными отношениями, типы которых задаются разработчиками программного обеспечения гипертекста или самим читателем. Отношения задают потенциальные возможности передвижения или навигации по гипертексту. Отношения могут быть однонаправленными или двунаправленными. Соответственно, двунаправленные стрелки позволяют двигаться пользователю в обе стороны, а однонаправленные - только в одну. Цепочка узлов, через которые проходит читатель при просмотре компонентов текста, образует путь или маршрут.

Элементы типологии гипертекста. Первое противопоставление относится к структуре гипертекста. Гипертекст может быть иерархическим или сетевым. Иерархическое - древовидное - строение гипертекста существенно ограничивает возможности перехода между его компонентами. В таком гипертексте отношения между компонентами напоминают структуру тезауруса, основанного на родо-видовых связях. Иерархический гипертекст не реализует всех возможностей технологии гипертекста. В среде разработчиков гипертекстовых систем он не пользуется популярностью (хотя и довольно часто реализуется в работающих системах).

Второе противопоставление характеризует не саму структуру гипертекста, а возможности программного обеспечения. Здесь различаются простые и сложные гипертексты. Примером простого программного обеспечения гипертекста может служить электронное оглавление документа, которое позволяет перейти к любой части оглавления, минуя этап просмотра всего текста. К простому гипертексту относится и система, которая дает возможность просматривать отсылки к литературе, содержащиеся в тексте, не обращаясь непосредственно к списку литературы. Сложные гипертексты обладают богатой системой переходов между компонентами гипертекста, в них отсутствует представление о базовом тексте, с которым связаны второстепенные по значимости тексты. В некотором смысле нормальный, обычный гипертекст и является сложным гипертекстом.

По способу существования гипертекста выделяются статические и динамические гипертексты. Статический гипертекст не меняется в процессе эксплуатации; в нем пользователь может фиксировать свои комментарии, однако они не меняют существо дела. Для динамического гипертекста изменение является нормальной формой существования. Обычно динамические гипертексты функционируют там, где необходимо постоянно анализировать поток информации, то есть в информационных службах различного рода. Гипертекстовой является, например, Аризонская информационная система (AAIS), которая ежемесячно пополняется на 300-500 рефератов в месяц.

Отношения между элементами гипертекста могут изначально фиксироваться создателями, а могут порождаться всякий раз, когда происходит обращение пользователя к гипертексту. В первом случае речь идет о гипертекстах жесткой структуры, а во втором - о гипертекстах мягкой структуры. Жесткая структура технологически вполне понятна. Технология организации мягкой структуры должна основываться на семантическом анализе близости документов (или других источников информации) друг к другу. Это нетривиальная задача компьютерной лингвистики. В настоящее время широко распространено использование технологий мягкой структуры на ключевых словах. Переход от одного узла к другому в сети гипертекста осуществляется в результате поиска ключевых слов. Поскольку набор ключевых слов каждый раз может различаться, каждый раз меняется и структура гипертекста. Жесткость или мягкость архитектуры гипертекста зависит и от количества информации, которая в нем содержится. Если узлов в сети гипертекста порядка одной-трех тысяч, то чаще всего используется жесткая архитектура, если же количество узлов достигает нескольких десятков тысяч или даже миллионов единиц, то мягкая структура оказывается более предпочтительной, поскольку кодировка жестких связей отнимает слишком много времени. Заметим, что структура Интернета часто функционирует как гипертекст мягкой архитектуры.

Технология построения гипертекстовых систем не делает различий между текстовой и нетекстовой информацией. Между тем включение визуальной и звуковой информации (видеороликов, картин, фотографий, звукозаписей и т.п.) требует существенного изменения интерфейса с пользователем и более мощной программной и компьютерной поддержки. Такие системы получили название гипермедиа или мультимедиа. Наглядность мультимедийных систем предопределила их широкое использование в обучении, в создании компьютерных вариантов энциклопедий. Известны, например, прекрасно выполненные CD-ромы с мультимедийными системами по детским энциклопедиям издательства "Дорлинг Киндерсли".

Некоторые гипертекстовые системы. Технологически в основе гипертекста лежат компьютерные программы, которые поддерживают следующие базовые функции:

обеспечение быстрого просмотра информационного массива (браузинг);

обработка ссылочных отношений (обращение и вызов фрагмента текста или другой информации, на которую производится отсылка);

навигация по гипертексту, запоминание маршрута движения; представление пути движения в легко воспринимаемой форме;

возможность формирования обычного линейного текста как результата движения по гипертексту;

дополнение гипертекста новой информацией;

введение новых отношений в структуру гипертекста (для систем с жесткой структурой).

Программные оболочки гипертекста, как правило, универсальны. Они могут использоваться в различных областях для создания тематически разных гипертекстов. Таковы, например, оболочка ZOG и разработанная на ее основе промышленная гипертекстовая система KMS (университет Карнеги-Меллон, США). Сферы применения этих гипертекстовых систем необычайно разнообразны - от работы с документацией и поддержки электронной почты до гипертекстов, предназначенных для экспертов, работающих над бюджетом. Имеются и специализированные системы. Так, система NoteCards (продукт компании "Xerox PARC") предназначена для аналитической работы, а система WE, моделирующая особенности получения нового знания - для помощи в авторской работе. Наиболее популярны в настоящее время программные пакеты HyperCard компании "Apple". Они относительно просты в использовании. Гипертекст в оболочке HyperCard представляется в виде каталожных карточек. Пользователь с помощью довольно простого интерфейса организует структуру карточки и устанавливает связи между карточками. Пакеты HyperCard позволяют сочетать различные типы информации, в частности карточки могут включать графическую, звуковую и др. информацию. Следует отметить, что современные базы данных также включают поля для визуальной и звуковой формы данных (ср., например, базу данных ACCESS 7, работающую в среде Windows). Близка к HyperCard по своим свойствам и программа SuperCard фирмы "Silicon Beach". Некоторые системы гипертекста содержат специальные средства ориентации пользователя в гиперпространстве - карты или закладки, отмечающие наиболее посещаемые узлы гипертекста. Комплексом средств ориентации обладает система Hypergate Writer фирмы "Eastgate Systems Inc".

Литература

1. Баранов А.Н. Категории искусственного интеллекта в лингвистической семантике. Фреймы и сценарии. М., 1987.

2. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения // Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. М., 1989. С.5-31.

3. Войскунский А.Е. Моделирование мышления // Речевое общение: проблемы и перспективы. М., 1983. С.16-60.

4. Олкер X.Р. Волшебные сказки, трагедии и способы изложение мировой истории // Язык и моделирование социального взаимодействия. М., 1987. С.408-440.

5. Поспелов Д.А. Ситуационное управление. Теория и практика. М., 1986. С.71-83; 99-106.

6. Субботин М.М. Гипертекст. Новая форма письменной коммуникации // ВИНИТИ. Сер. Информатика. Т.18. М., 1994.

Страницы: 1, 2, 3



© 2003-2013
Рефераты бесплатно, курсовые, рефераты биология, большая бибилиотека рефератов, дипломы, научные работы, рефераты право, рефераты, рефераты скачать, рефераты литература, курсовые работы, реферат, доклады, рефераты медицина, рефераты на тему, сочинения, реферат бесплатно, рефераты авиация, рефераты психология, рефераты математика, рефераты кулинария, рефераты логистика, рефераты анатомия, рефераты маркетинг, рефераты релиния, рефераты социология, рефераты менеджемент.