Моделирование языковой деятельности
Языковая деятельность сопровождает практически любой вид интеллектуальной деятельности человека. Попытки формализации (компьютеризации) интеллектуальной деятельности человека привели к постановке фундаментальной лингвистической задачи - задачи моделирования его языковой деятельности.
Вербализация и понимание
Обобщая все разнообразные функции, в которых выступает язык: Язык служит нам
(1) для формирования и выражения собственных мыслей и
(2) для понимания мыслей других людей.
Вербализация и понимание - 2 механизма, составляющих основу языковой деятельности. С точки зрения моделирования (с определенной долей огрубления оставляя за кадром участие языка в формировании смысла) можно считать, что первому виду языковой деятельности соответствует порождение на ЕЯ текста для выражения некоторого смысла, а второму - извлечение смысла из текста на ЕЯ.
Если {Т} - множество текстов, а {С} - множество выражаемых ими смыслов, то модель ЕЯ можно определить как транслятор, устанавливающий соответствие между этими двумя множествами:
{Т} <-> {С}
О сложности языка как объекта моделирования
Понятие ЗНАКА
Знак — минимальный носитель языковой информации. Совокупность знаков образует знаковую систему, или язык (Семиотика наука о знаковых системах).
Знак по Фреге
Знак представляет собой двустороннюю сущность. С одной стороны, он материален (имеет план выражения, или денотат), с другой — он является носителем нематериального смысла (план содержания). Структуру знака удобно представлять в виде так называемого треугольника Фреге (Готлиб Фреге — немецкий философ и логик, один из основателей логической семантики). Выглядит треугольник Фреге так:
знак | |
смысл (план выражения) | денотат (план содержания) |
Наиболее простым языковым знаком естественного языка является слово. Так, у слова «дом» смыслом будет само это понятие «дом», а денотатом — некий абстрактный дом (у словосочетания «этот дом» денотатом будет конкретный дом, на который указывают, говоря «этот дом»).
Но знаком является также и предложение. Согласно Фреге, смыслом предложения является высказанное в нем суждение, а денотатов у предложения может быть только два — «истина» и «ложь», то есть соответствие или несоответствие высказанного в предложении суждения реальному положению вещей. Вот пример истинного знака-предложения, изображенного в виде треугольника Фреге:
знак-предложение | |
смысл (план выражения) Г.Фреге — немецкий философ | денотат (план содержания) истина |
А вот пример ложного знака-предложения:
знак-предложение | |
смысл (план выражения) Г.Фреге — французский поэт | денотат (план содержания) ложь |
Американский философ Чарлз Сандерс Пирс еще в конце ХIХ в. создал классификацию З. Он разделил их на три группы:
1. Иконические З. — такие, план выражения которых похож на план содержания (примером может служить портрет или фотография).
2. Конвенциональные (условные) З. — такие, план выражения которых не имеет ничего общего с планом содержания. Это большинство слов любого языка. Слово «кошка» не похоже на кошку в отличие от изображения кошки.
3. Индексальные З.— такие, план содержания которых связан с планом выражения по смежности, то есть похож, но отчасти. Примерами индексов могут служить З. дорожной сигнализации. Знак, запрещающий проезд, «кирпич» действительно напоминает некую преграду, но он означает не саму преграду, а инструкцию «сюда въезд запрещен». Если на щите нарисованы черные очки, то это означает, что здесь следует пропускать слепых. З., представляющий собой две параллельные линии, сужающиеся к концу наподобие бутылки, означает, что дорога впереди сужается.
Знак имеет две стороны: “означающее” — физическая оболочка, и “означаемое” — смысл, значение.
Знак по Соссюру (Язык VSРечь)
Фердинанд де Соссюр
Язык (langue) — есть система, набор единиц языка и правил;
Речь (parole) — система языка в действии.
Соссюр сравнивает язык — с шахматами: фигурами и правилами, речь же— с отдельной разыгранной партией. Тем самым знак в языке — есть шахматная фигура и правила ее поведения на доске.
Знак имеет две стороны: “означающее” — физическая оболочка, и “означаемое” — смысл, значение.
СЛОЖНОСТЬ 1 - Ассимметрический дуализм языкового знака
КАРЦЕВСКИЙ, СЕРГЕЙ ИОСИФОВИЧ (1884–1955)
Всякий знак языка, по его мнению, тяготеет к омонимии, с одной стороны, и к синонимическому ряду – с другой. «Большинство слов предназначено не к тому, чтобы определять и называть, но к тому, чтобы описывать, взывать к нашему воображению, быть экспрессивными. Поэтому слова [не термины] имеют по нескольку значений <...>. .. И обратно: любое значение может быть выражено несколькими способами».
омонимия (шире – многозначность) и синонимия – имманентные свойства языка (языковых единиц разных уровней)
Примеры омонимии, многозначности (неоднозначностей):
лексическая:
Голова– 1) часть тела живого существа
2) (полноправный) хозяин каждый сам себе голова
3) передняя часть, начало чего-либо голова колонны
4) счетная единица (скота) голова скота
5) голова сахара, сыра
6) идиом. потерять голову
Тяжелый (груз, день, пример,,больной, воздух etc.)
синтаксическая:
Мать любит дочь.
лексико-синтаксическая (и, соответственно, семантическая):
Моих сыновей зовут Иван и Петр.
Rice flies like sand.
морфологическая:
суффикс «ИК»
дом –> домик `маленький дом'
час –> часик *`маленький час'
Жора –> Жорик (отношение говорящего к самому называемому объекту) Но: Жора, дай огурчик (ксеноденотатная переадресация).
Примеры синонимии:
лексическая
морфологическая: уменьшительные суффиксы
Одна и та же ситуация (денотативно):
Петр – отец Ивана Иван – сын Петра
Петр – отец Ивану Иван – сын Петру
Петр – Иванов отец Иван – Петров сын
+ еще масса способов (вплоть до Он мой сын).
СЛОЖНОСТЬ 2 - принципиальная нечеткость языковых значений (в т.ч. в деловой сфере, в терминологии)
«Мы понимаем и высказываемся „приблизительно“; лица говорящие этого не замечают». Тем самым языковой знак оказывается зыбким, а сам язык является «приблизительным» по своей семантике. Иначе язык бы превратился в совокупность этикеток: «то, что „мертво“ может быть опознано численно, и обратно: то, что можно пересчитать, уже непродуктивно. Напротив, все, что живо, неисчислимо». (Карцевский)
Примеры:
Уступайте место в транспорте женщинам и лицам старшего возраста.
много, мало, близко, далеко
СЛОЖНОСТЬ 3 - образность номинации (метафоричность)
Примеры:
выпить 3 чашки, съесть 2 тарелки, нос корабля режет воду, к концу первой сигареты у нее закружилась голова
СЛОЖНОСТЬ 4 - гибкость в передаче не только эксплицитной, но и имплицитной информации
Средства естественного языка предоставляют гибкость в передаче не только эксплицитной (явной), но и имплицитной (неявной, подразумеваемой) информации. При этом используются пресуппозиции и импликатуры дискурса.
пресуппозиция
Пресуппозиция— компонент смысла предложения, который должен быть истинным для того, чтобы предложение не воспринималось как семантически аномальное или неуместное в данном контексте. Или, неформально,пресуппозиция— это информация, диктуемая здравым смыслом и характеризующая предусловия ситуаций, описываемых в тексте.
Он вернул мне учебник. (пресуппозиция: «Учебник у меня уже был раньше»)
Я знал, что он вернулся. Я не знал, что он вернулся (пресуппозиция «я вернулся» сохраняется) – у фактивных глаголов
импликатуры дискурса
Импликатура дискурса— компонент смысла на уровне связного текста (дискурса), позволяющий однозначно интерпретировать отдельные фрагменты текста. Неформально — то, что становится ясным из контекста.
Дискурс— связный текст в совокупности с экстралингвистическими — прагматическими, социокультурными, психологическими и другими факторами; или же текст, взятый в событийном аспекте.
Примеры:
Рассказывай! Tell me about it! (просьба или выражение недоверия?)
Купи мороженое! (просьба или разрешение?).
СЛОЖНОСТЬ 5 - динамичность языковой системы
СЛОЖНОСТЬ 6 - специфическая системность
(членение на уровни, деление на подъязыки)
С одной стороны язык представляет собой сочетание набора подсистем: язык может рассматриваться на разных уровнях абстракции. С другой стороны, язык неоднороден по содержанию, наличие диалектов, жаргонов, профессиональной лексики.
СЛОЖНОСТЬ 7 - бесконечный потенциал в освоении новых знаний
СЛОЖНОСТЬ 8 - разнообразие функций
(коммуникативная, когнитивная, планирующая, обучающая, метаязыковая и др.)
коммуникативная: служит общению;
информационная (описательная): передача фактической информации;
когнитивная: служит для познания окружающего мира;
планирующая: служит для планирования деятельности;
обучающая: служит целям обучения и приспособления к функционированию среди себе подобных;
метаязыковая: язык служит для описания других языков.
Вывод
Таким образом ЕЯ может быть оценен как сложнейший объект для моделирования.
Прикладные модели вынужденно упрощают и огрубляют языковую реальность.
Понимание
Понимание в человеческом смысле
[Вильгельм фон Гумбольдт] «Никто не понимает слово в точности так, как другой, и это различие, пускай самое малое, пробегает, как круг по воде, через всю толщу языка. Всякое понимание поэтому всегда есть вместе и непонимание, всякое согласие в мыслях и чувствах – вместе и расхождение»
[Городецкий] Понимание = извлечение ("вычисление") из текста некоторой совокупности знаний.
При понимании человек использует 2 основных класса когнитивных средств:
собственно языковые. Языковые знания = знания, закрепленные в семантике языка.
прагматические.
Прагматика— практические цели человека, которые направляют использование неязыковых (экстралингвистических) знаний в сочетании с языковыми.
Понимание происходит на разных уровнях и характеризуется разной степенью приблизительности (в зависимости от целеустановки). Интегральный процесс понимания управляется механизмом «интереса».
Понимание в компьютерном смысле
(можно говорить только в смысле некоторой практической задачи).
[Апресян et al.] Понимание текста в слабом и в сильном смысле.
В слабом: обрабатываемый текст может быть перефразирован средствами того же или другого языка. Эта модель реализуется при МП. Перевод = пересказ содержания текста, написанного на одном языке, средствами другого языка.
В сильном смысле: понимание = (правильная) реакция на текст. Общение с БД (ответ на обращенный к базе запрос). Или реакция робота в ответ на команду.
Для моделирования пониманияв любом из этих смыслов в системе, претендующей на глубокую обработку ЕЯ-текста, необходимо иметь особыйуровень представления высказывания - семантический. Этот уровень задается формальнымсемантическим языком(метаязыком). Такой семантический метаязык должен обладатьвыразительными средствами, достаточными для отражения содержания исходного текста на ЕЯ в рамках практической задачи. Имея такой семантический метаязык, можно формально описать понимание и вербализацию:
процесс понимания (анализа) текста = перевод с ЕЯ на СемЯ.
процесс производства (синтеза) текста = перевод с СемЯ на ЕЯ.
- Что такое компьютерная лингвистика?
- История
- Терминология (Предикаты, субъекты, переменные, понятия, признаки)
- Поднауки лингвистики
- Язык исчисления предикатов первого порядка
- Язык и грамматика (формы Бэкуса-Наура)
- Природа языка
- Моделирование языковой деятельности
- Автоматическая обработка текста и ее место среди различных дисциплин
- Анализ текстов на естественном языке
- Этапы автоматического анализа текста
- Синтез текстов на естественном языке
- Понимание текстов
- Оживление текста
- Модели коммуникации
- Морфологический анализ
- 1. Флективные языки:
- 2. Изолирующие (аморфные) языки:
- 3. Агглютинативные (агглютинирующие) языки:
- 4. Полисинтетические (инкорпорирующие) языки:
- Синтаксический анализ
- Валентность
- Семантический анализ
- Тезаурусы
- Словари ролевых моделей
- Базы знаний
- Информационно-поисковые системы Internet
- Принципы построения поисковых систем (на примере Google)