Модель смысл текст кратко

Обновлено: 07.07.2024

Одним из возможных направлений получения достаточно детального описания языка, пригодного для использования в компьютерных системах, является построение моделей типа “Смысл Текст”. В статье предлагается новый язык репрезентации общих закономерностей поверхностного кодирования семантических признаков. Развиваемый подход призван универсализировать модель Мельчука, повысить уровень ее абстрактности.

Ключевые слова: модель “Смысл Текст”, когнитивные модели, математические модели, маркировка.

Разработанная в 70-ых годах модель “Смысл Текст” Мельчука [1] (на английском языке частично изложена в [2]) содержит тщательно проработанные семантическую, синтаксическую, морфологическую компоненты и представляет собой хороший образец компьютерно-ориентированного описания языка (на примере русского языка). Она оказала значительное влияние на развитие лингвистики в России, но осталась малоизвестной на Западе, не оказав особого влияния на “mainstream” современной лингвистики.

Включаясь в обсуждение роли модели Мельчука на современном этапе, начатое в [3], в работе анализируется одна из причин малой распространенности этой модели на Западе – недостаточная степень языковой независимости.

Для обеспечения большей универсальности (языковой независимости) синтаксической компоненты модели вводится новый аппарат – кодирования ассоциированных со словами когнитивных признаков. Введено понятие конфликта кодирования и предложена математическая модель разрешения конфликтов.

Хотя в [1] об этом не сказано явно, но, по сути, Мельчуком построена модель русского языка. И до сих пор было предпринято лишь немного попыток (одна из них [4]) применить эту модель к другим языкам.

Разумеется, русскоязычными являются синтаксическая и морфологическая компоненты модели – а это очень значительная и наиболее законченная часть модели. Для применения модели к другому языку потребуется фактически заново разработать синтаксический и морфологический блоки. В модели ясно не сказано, что в ней является универсальным, а что языково-специфическим. Выделение и формальное описание универсальной части модели позволило бы ей повысить свой ранг в континууме общетеоретических моделей. Конечно, языково-независимым является семантическое представление, но хотелось бы также вычленить и языково-независимую часть синтаксической компоненты.

Исходя из общей точки зрения, что морфосинтаксические средства нужны для кодирования смысла фразы, обратим внимание на то, что кодируется и как кодируется.

Из выделенных в типологических исследованиях [см. 5] основных семантических (в широком смысле) структур рассмотрим следующие:

1) семантическая роль именной группы (ИГ) в предложении,

2) коммуникативное членение,

3) не/определенность ИГ.

В русском языке они кодируются (в основном) различными средствами. Структура 1 кодируется морфологически (окончаниями и предлогами), структура 2 - порядком слов и интонацией, структура 3 – лексически (с помощью местоимений типа какой-то и этот). В русском языке механизмы поверхностного кодирования упомянутых семантических структур независимы и взаимодействуют между собой весьма слабо. В смысле независимости маркировок основных семантических структур русский язык может быть назван языком с раздельным кодированием. Видимо, это одна из причин того, что в модели Мельчука различные уровни (семантический, синтаксический, морфологический) обрабатываются последовательно и независимо. Хотя циклы в алгоритмах обработки допускаются, все же она носит, в основном последовательный характер.

Воспроизведем (с сокращением некоторых, не относящихся к обсуждаемому вопросу, деталей) схему взаимосвязей между подструктурами русского языка из [6].

Семантика Лексика Словоформы

Синтаксис Порядок слов

Актуальное членение Пунктуация

На этом рисунке стрелки показывают, какая информация необходима для построения соответствующей подструктуры при синтезе предложения. Из него видно, что актуальное (= коммуникативное) членение совершенно не влияет на морфологический состав слова, а морфологический состав – на порядок слов. Аналогично выглядит и структура английского языка (также из [6]), с той разницей, что актуальное членение там связано стрелкой не с порядком слов, а с синтаксисом. Для других языков схема связей может оказаться более сложной. На рисунке 2 приведена аналогичная схема для тюркских языков

Семантика Лексика Словоформы

Синтаксис Порядок слов

Актуальное членение Пунктуация

Разница рис. 1 и 2 состоит в следующем. Рисунок 1 не несет сведений о том, как сочленяется информация, поступающая по каждой из стрелок. Информационные потоки могут либо просто суммироваться, не влияя друг на друга, (“аддитивный” случай), либо вступать в противоречие (“конфликтный” случай). В то время, как для русского и английского языков конфликтный случай достаточно редкое явление, в тюркских языках он встречается значительно чаще. На рисунке 2 стрелки, несущие конфликтующие информационные потоки, связаны дугой. Конкретный языковый пример, поясняющий возможный вид конфликтов, будет приведен в разделе 2. Вероятно, модели типа “Смысл Текст” для тюркских языков по своей архитектуре могут заметно отличаются от модели для русского и английского языков.

Проблема разрешения возникающих конфликтов, как представляется, имеет самостоятельный теоретический интерес и может быть вычленена из модели “Смысл Текст”.

Сравним модель Мельчука с генеративной грамматикой с точки зрения ориентации на применение к различным языкам. Хотя первоначально Хомский и строил генеративную грамматику на материале одного английского языка, однако в дальнейшем, как последователями теории, так и самим Хомским были предприняты значительные усилия по применению генеративного подхода к описанию грамматики других языков. При этом сама генеративная грамматика претерпела радикальные изменения. Достаточно упомянуть программную работу Хомского “Принципы и параметры” [7], прямо ориентированную на поиск универсальных способов описания любых естественных языков. Эта тенденция к универсализации и отходу от англо- и европоцентризма продолжается и в минималистской программе [8]. Хотя теории Мельчука и Хомского существенно различаются, все же определенные аспекты хомскианства заимствуются моделью “Смысл Текст”. Главное в подходе Хомского, что следует использовать, на наш взгляд, это методологическая ориентация на создание математически точного аппарата для формулировки гипотез о природе языка и строгой проверки их на материале различных языков. Такая ориентация позволит повысить теоретический статус модели типа “Смысл Текст”.

Таким образом, по нашему мнению, “русско-центризм” модели Мельчука явился серьезным препятствием распространению ее на Западе.

  1. Универсализация генерирования синтаксических структур

При переходе от семантического представления к синтаксическому должны быть не только выбраны лексемы, но и установлены между ними определенные синтаксические отношения. Представляется целесообразным перейти от языково-специфических средств описания синтаксических отношений, свойственных модели “Смысл Текст” Мельчука, к универсальным средствам. Это позволит сформулировать теоретическое ядро модели, содержащее описание общих закономерностей поверхностного кодирования семантических отношений. Причем это ядро должно обладать не только описательной, но и предсказательной, и объяснительной силой.

В данной работе предлагается когнитивно-алгоритмический подход к описанию механизмов разрешения возникающих при генерации поверхностно-синтаксического представления противоречий, о которых говорилось в разделе 1. В этом подходе минимизируется число промежуточных уровней, а также число когнитивных механизмов (в духе последних модификаций теории Хомского) и напрямую соотносятся семантические признаки и поверхностные маркеры.

Объектами, с которыми работает механизм поверхностного кодирования, являются семантические признаки (“быть ремой”, “быть агентом” и т. д.) и поверхностные маркеры (предлоги, аффиксы, интонация, порядок слов и т. д.). Термин семантические признаки трактуется здесь расширительно и, возможно, его следует заменить на “когнитивные признаки”, имея в виду объединение семантических, коммуникативных, прагматических аспектов, а также признаков типа “фокус внимания” [9], характеризующих общепсихологические механизмы.

Основными проблемами в этом подходе будут: выбор признаков и описание механизмов кодирования. Рассмотрим пример из татарского языка (группа тюркских языков), демонстрирующий конфликт между различными механизмами кодирования.

Пациенс маркируется в соответствии со следующими правилами.

  1. Пациенс кодируется предглагольной позицией (глагол всегда стоит на последнем месте).
  2. Если некоторая ИГ помечена в предложении как рема, то она занимает предглагольную позицию, вытесняя пациенса (т.е. возникает конфликт маркировок).
  3. Если пациенс занимает не предглагольную позицию, то он маркируется аффиксом –ны.
  4. Если пациенс определенный, то он маркируется аффиксом –ны и (возможно) лексемой бу “этот”.

Здесь мы видим достаточно сложное взаимодействие (нехарактерное для индоевропейских языков) маркировок всех трех основных семантических структур: семантической роли, коммуникативного членения и референциального статуса, при этом используются общие средства - предглагольная позиция и аффикс -ны. Возможные связи между семантическими признаками и поверхностными маркерами в этом примере могут быть выражены следующим графом.

Пациенс Предглагольная позиция

Определенность Лексема бу

Конфликт маркировок появляется, когда различные механизмы пытаются присвоить некоторой ИГ разные (и несовместимые) маркировки или, наоборот, присвоить разным ИГ одну и ту же маркировку, не допускающую дублирования (маркеры “предглагольная позиция” и “-ны” на рисунке 3).

Проблема разрешения конфликта маркировок возникает на завершающих стадиях синтеза поверхностного представления, когда требуется определить порядок слов на основе синтаксической информации и информации о коммуникативном членении предложения и совместить его с уже сгенерированными морфологическими маркерами. Конкретные компьютерные реализации для конкретных языков могут разрешать эту проблему на несколько более раннем или более позднем этапе, или разделить ее на части и обрабатывать их по отдельности. С точки зрения общей проблемы организации языка представляется целесообразным рассмотреть разрешение конфликта маркировок в общей абстрактной форме и с типологических позиций проанализировать механизмы, используемые конкретными языками.

Можно предложить следующую математическую модель конфликта маркировок.

Пусть А = < >– множество слов в предложении. Пусть В = < >– множество маркеров. На множестве BB задано бинарное отношение совместимости маркеров. () означает, что маркеры могут быть применены к одному слову. Пусть каждому слову соответствует множество семантических признаков и . Пусть R бинарное отношение. > интерпретируется, как “признак слова может быть закодирован маркером ”. Тогда маркировка именных групп в предложении сводится к следующей математической задаче.

Найти подотношение , удовлетворяющее следующим требованиям.

  1. (полнота маркировки) Проекция на первую координату есть P , т.е. должны быть закодированы все признаки.
  2. (корректность маркировки) , т.е. никакое слово не может быть маркировано несовместимыми маркерами.
  3. (не дублирование маркеров) , т.е. один и тот же маркер не может маркировать разные слова.

Замечание 1. Требования 1 и 3 могут быть ослаблены сужением их до подмножества признаков и маркеров соответственно.

Замечание 2. Конкретные языки или семейства языков могут содержать и дополнительные требования.

Предложенная формализация показывает, что задача построения маркировки слов в предложении является обобщением известной задачи нахождения паросочетаний в двудольном графе. Как известно, последняя решается за полиномиальное (от числа вершин в графе) время [10], но алгоритм требует, все же, определенного перебора. Очевидно, язык использует дополнительную информацию, позволяющую элиминировать перебор. Анализ языковых примеров показывает, что в качестве таковой, видимо, выступает определенная система приоритетов и иерархий. Хорошим примером является иерархия доступности Комри SUB > DO > IO > OBL, используемая, в частности, для определения маркировки каузируемого в каузативных конструкциях [11, 12]. Вообще широкое использование иерархий при описании различных фрагментов языков является признаком их релевантности когнитивным языковым механизмам человека.

Маркировка пациенса в тюркских языках дает простой пример приоритетов. (Далее приводится формализация фрагмента рисунка 3.) Пусть - “быть пациенсом”, - “быть ремой”, - предглагольная позиция, - аффикс –ны. Тогда имеют место отношения: R (, ), R (, ) и R ( , ). В татарском языке действует приоритет > , что позволяет удовлетворить требования, выбрав подотношение , так что (, ) и ( , ).

Введение в математическую формулировку системы приоритетов приближает ее к задаче о женитьбе. В [13] предложен алгоритм решающий задачу о женитьбе за время nlog ( n ), где n – число женихов (в нашей задаче – мощность множества Р). Кажется, однако, что когнитивные механизмы человека справляются с задачей кодирования (и декодирования) слов еще быстрее. Это выдвигает задачу описания систем приоритетов, действующих в естественных языках. Видимо, они должны быть достаточно жесткими, чтобы исключить (или очень сильно ограничить) необходимость перебора при выборе маркеров.

Можно надеяться, что на этом пути может быть получен универсальный язык описания синтаксиса, включающий его динамическую компоненту – процессы выбора поверхностной маркировки.

Заключение

В работе начата разработка универсального когнитивного метаязыка описания кодирования семантических признаков. Предложена математическая модель маркирования, близкая к хорошо известным задачам на графах, и предполагающая иной математический аппарат, чем генеративная грамматика Хомского. Одно из ключевых понятий вводимой модели является конфликт маркировок, иллюстрируемый на примере маркировки прямого дополнения в татарском языке.

Работа выполнена при финансовой поддержке программы “Университеты России”.

Описание единицы словаря ведется по четырем уровням: семантическому, синтаксическому (дается глубинное и поверхностное представление), морфологическому и фонетико-орфографическому.

Словарная статья ТКС состоит из трех частей: аналитической дефиниции, модели управления, которая описывает синтаксическое окружение, и списка лексических функций, в которых участвует данное слово.

Пример аналитической дефиниции:


Еще один пример аналитической дефиниции:


В данном случае представлены отсылки на близкие по значению слова (квазисинонимы).




Переход от заданного смысла к тексту (или наоборот, от текста к смыслу) – это процесс, состоящий из нескольких этапов. Нас в наибольшей степени интересует та часть словарного описания, которая формализует парадигматические и синтагматические отношения между словами – лексические функции. Общий список функций – около 60-ти.


Из этого фрагмента текста видно, что лексические функции неоднородны, поэтому они разделяются на группы. Первая группа характеризует хорошо знакомые нам синонимические отношения (функция SYN), точнее, отношения, которые позволяют подбирать близкие по смыслу слова. Квази-синонимы могут иметь более широкое или более узкое значение, могут пересекаться с ключевым словом. Полные синонимы имеют идентичное описание, близкие по значению слова – сходные, но не тождественные описания.

Функция ANTI идентифицирует антонимы, CONV – конверсивы (победить – проиграть). Для указания на роль актантов Мельчук использует числовые индексы: 1 – это агенс, 2 – объект действия, обозначенного ключевым словом.

Функции Syn, Anti, Conv и некоторые другие функции описывают парадигматические отношения между словами (с таким описанием мы уже встречались в модели WordNet).

Второй тип отношений – синтагматический – указывает на сочетаемость слова, т.е. описывает варианты синтаксического окружения слова. Фактически мы имеем дело с моделью управления, в которой устанавливается соответствие между семантической и синтаксической ролями, дается информация о поверхностной реализации синтаксических актантов (например, падежи для существительных), а также указываются ограничения на сочетаемость, т.е. указывается, какие синтаксические актанты не могут употребляться при данном предикате.





Недостатком данной модели является громоздкость и трудоемкость описания лексики. Существующий словарь для русского языка охватывает только 250 слов. Это ограничивает прикладные возможности модели.

Анализ синтаксической сочетаемости как источник информации о семантике

Сейчас мы кратко охарактеризуем подходы, в которых основное внимание уделяется синтагматическим отношениям. На основе анализа синтаксической информации делаются выводы о семантических свойствах лексики.

Синтагматический подход лучше всего описывается знаменитой фразой Дж. Фёрса “You shall know the word by the company it keeps”. Идея описания сочетаемости корнями уходит в дистрибутивный анализ – один из основных методов структурализма. Очевидно, лучший способ узнать окружение слова – это посмотреть на то, что делают носители языка в повседневной коммуникации. Именно такую информацию предоставляют нам корпусы.

Толчком к развитию синтагматического подхода послужила практическая лексикография. Анализ реального употребления был необходимым этапом в описании многозначных слов и подборе контекстов, иллюстрирующих реализацию того или иного значения. Снова на помощь пришли корпусы – их появление избавило лексикографию от значительной доли субъективизма и опоры только на собственную интуицию лексикографов.

Для описания сочетаемости было введено несколько терминов. Коллокация – это сочетание двух слов в высказывании, такое, в котором регулярно встречающиеся слова синтаксически связаны друг с другом отношениями зависимости. Коллокации можно изучать, составляя конкордансы для интересующего нас слова и анализируя его окружение (левый и правый контексты). Коллигация – это определенный синтаксический паттерн, в котором встречается слово (например, так сопоставляются переходные и непереходные употребления глаголов). Это несколько более широкое понятие, чем модель управления. Наконец, семантическая просодия – это тенденция встречаться в окружении слов с определенной коннотацией, положительной или отрицательной.

В любом варианте описание сочетаемости ведется в терминах частотности. С одной стороны, ясно, что наиболее частотные употребления отражают определенную тенденцию в поведении носителей языка. С другой стороны, статистический анализ позволяет нам проверить объективность полученных результатов, убедиться, что данные действительно отражают тенденцию, а не являются случайным совпадением.

Для статистического анализа данных используются различные индексы. Одним из таких индексов является Индекс Взаимной Информации – он отражает степень ожидаемости того, что некоторые два слова встретятся в тексте рядом. Подсчет индекса может вестись по очень простой формуле:

Ожидаемая частота также вычисляется легко: это произведение частот встречаемости двух слов в корпусе. Положительное значение индекса показывает, что встречаемость двух слов рядом не случайна, отрицательное значение свидетельствует скорее о том, что мы не можем говорить о какой-либо тенденции.

Есть и другие методики анализа частотности, однако они используются чаще в рамках корпусной лингвистики и до сих пор являются предметом дискуссий.

При всем разнообразии используемых формальных методов и методик (дистрибутивный, трансформационный, компонентный ана­лиз и т. д.) современные исследования в области синтаксиса ха­рактеризуются некоторыми общими тенденциями.

Далее, в современных синтаксических исследованиях, как можно заметить и по предыдущим разделам, возрастает роль семан­тического компонента (значения, функции). В частности, одним из важнейших достижений порождающей грам­матики является разграничение в языке глубинных и поверхностных структур. Глубинная структура — это тот аспект синтаксического

Так, упомянутая выше стратификационная грамматика С. М. Лэма — это модель языка, состоящая из многочисленных взаимо­связанных уровней (стратумов). Среди них занимает свое место и

синтаксис. Число элементов в самом низком стратуме языка равно 15, в то время как количество элементов в самом высоком стратуме достигает тысяч (Лэм 1977: 12). При производстве или восприятии текста от элемента к элементу и соответственно от уровня к уровню движутся импульсы, имеющие аналоги в психофизиологической деятельности человека (возбуждение нервных волокон). Эти им­пульсы, участвующие в процессах двух видов: слиянии и разделении (которые могут быть неупорядоченными или упорядоченными), в конечном счете и приводят к высказыванию, со всей сложностью его внутренней структуры.

85. Морфема — основная единица морфемного уровня языка

По традиции грамматика языка подразделяется на синтаксис и морфологию. При таком подходе сфера морфологии оказывается чрезвычайно широкой: сюда входят, во-первых, явления, связанные с грамматической организацией лексики (грамматические классы и разряды слов; принадлежащие им грамматические категории, т. е. системы граммем и соответствующие системы форм, и т. д.), и, во-вторых, внутреннее строение слова. Первая группа явлений имеет общеграмматический, базовый характер; она была рассмотрена в связи с исходным понятием грамматического значения (см. § 62—66). Вторая группа проблем составляет предмет специальной отрасли языкознания, именуемой морфемикой. Итак, морфемика — это раздел грамматики, занимающийся описанием системы морфем и правил их сочетаемости. Морфема, согласно распростра­ненному определению, есть минимальная значи-

мая часть слова. В качестве основной единицы морфемного уровня языка она характеризуется четырьмя важнейшими призна­ками, которые мы последовательно и рассмотрим.

Значимость. Морфема, по определению, является носителем значения. В соответствии с выполняемой в слове функ­ цией морфемы делятся на корневые и аффиксальные; последние в свою очередь подразделяются на словообразовательные (дериваци­ онные) и словоизменительные (реляционные). Корневая морфема обязательно присутствует в слове, аффиксальная морфема может сопровождать корневую для образования слова или же словоформы. Данное деление весьма нестрого соотносится с классификацией основных типов значения (см. § 61). Дело в том, что морфема по своей природе полифункциональна: она может объединять в себе несколько — в том числе разнородных — значений. В результате соотношение основных типов морфем и основных типов значений может быть с некоторой долей условности пред­ ставлено следующим образом:

типы морфем типы выражаемых значений . корневая -^ лексическое

sS ^, словообразовательное словообразовательная ^^** /

/ ^^> классификационное словоизменительная ^"""^ словоизменительное

Схему следует читать так:

а) корневые морфемы, как правило, выражают лексическое зна­ чение (в качестве исключений здесь можно рассматривать примеры супплетивизма; в особый вид морфем выделяются служебные слова, в которых корень является носителем грамматического значения);

б) словообразовательные морфемы, кроме того, что они передают словообразовательное значение, участвуют в передаче лексического значения и могут выражать значение классификационное;

в) словоизменительные морфемы выражают словоизменительное значение, а одновременно с ним могут нести классификационное или словообразовательное значение. (Как уже отмечалось, сами эти значения, точнее, смежные их типы, например словообразовательное и классификационное, в пограничных случаях весьма близки друг к другу.)

е т с я в том или ином линейном наборе фонем или что зна­чение ее включает в себя те или иные семы, однако как единица своего уровня, как двусторонняя сущность она н е ч л е-н и м а, элементарна.

Мельчук И.А. Опыт теории лингвистических моделей Смысл-Текст

Предлагаемая публикация является переизданием книги, вышедшей в 1974 г. В книге детально обсуждаются такие понятия, как семантическое представление высказывания; глубинная и поверхностная синтаксическая структура фраз; порядок слов; коммуникативная организация текста; формализованный лексикон; универсальные правила перифразирования; ограниченная лексическая сочетаемость (включая лексические функции) и многие другие. Теоретическая дискуссия сопровождается богатым иллюстративным материалом, в первую очередь - из русского языка.
Настоящее издание включает новое предисловие автора, отражающее развитие теории за прошедшие 25 лет, и новую библиографию, а также два приложения, которые содержат историю эмиграции автора и некоторые статьи, характеризующие его гражданскую позицию.

Аверьянов Л.Я. Контент-анализ

  • формат doc
  • размер 3.13 МБ
  • добавлен 02 апреля 2010 г.

КноРус, 2009 г. В настоящее время текст рассматривается как сфера филологии - литературоведческой дисциплины, изучающей произведения письменности в целях установления их особой организации; исследующей отношение между текстом и культурным контекстом; рассматрвающей текст как систему высказываний, обладающих единым смыслом, и, наконец, как форму передачи информации. В предлагаемой работе мы подходим к тексту с принципиально иной стороны. Для нас.

Арнольд И.В. Основы научных исследований в лингвистике

  • формат pdf
  • размер 936.54 КБ
  • добавлен 12 июля 2009 г.

Учеб. пособие. — М.: Высш. шк. , 1991. — 140 с. Цель пособия — ознакомить студентов с основами и процедурами современных лингвистических исследований, развить у них навыки самостоятельной творческой работы. В пособии рассматриваются методические, методологические и коммуникативные проблемы лингвистических исследований. Пособие знакомит с требованиями к терминологии, библиографическому аппарату, сбору и описанию фактического материала. Для студен.

Бондарко А.В. Теория значения в системе функциональной грамматики: На материале русского языка

  • формат djvu
  • размер 11.96 МБ
  • добавлен 23 июля 2010 г.

Рос. академия наук. Ин-т лингвистических исследований. - М.: Языки славянской культуры, 2002. - 736 с. Основная проблема, рассматриваемая в этой книге, — языковая категоризация семантического содержания. Различные аспекты категоризации семантики раскрываются в комплексе взаимосвязанных вопросов: а) значение и смысл; интенциональность грамматической семантики; б) семантические инварианты и прототипы; структурные типы грамматических значений; в) оп.

Бразговская Е.Е. Референция и отображение (от философии языка к философии текста)

  • формат doc
  • размер 1.43 МБ
  • добавлен 23 октября 2011 г.

Иорданская Л.Н., Мельчук И.А. Типы фразем

  • формат pdf
  • размер 1.29 МБ
  • добавлен 01 октября 2010 г.

Статья из книги Л. Н. Иорданская, И. А. Мельчук "Смысл и сочетаемость в словаре". Изд-во Языки славянских культур, Москва 2007. размер статьи - 30 стр (стр 215-1450). Одна из базовых, классических работ по словосочетаниям. Иллюстрируется в основном примерами из английского языка. Содержание: Объект исследования, подход, теоретический рамки. Постановка задачи. Ограничения. Понятие фраземы: Краткая характеристика теории Смысл-Текст. Свободные слов.

Леонтьева Н. Автоматическое понимание текстов

  • формат djvu
  • размер 3.72 МБ
  • добавлен 29 мая 2011 г.

М.: Академия, 2006. - 202 с. Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. Рассмотрены те компоненты процесса АПТ, которые могут быть заданы в вербальном виде. В основе пособия.

Мельчук И.А. Курс общей морфологии. Том I

  • формат djvu
  • размер 5.25 МБ
  • добавлен 03 апреля 2011 г.

Мельчук И. А. Курс общей морфологии. Т. I. Москва - Вена: "Языки русской культуры", Wiener Slavistischer Almanach, Sonderband 38/1, Издательская группа "Прогресс", 1997. "Курс общей морфологии" представляет собой компендиум современный знанай в области морфологии естественный языков. Объектом его является слово - во всех его смысловых, формальных и комбинаторных аспектах. Для описания свойств и поведения слов в языках Земли разработана дедуктивн.

Мельчук И.А. Курс общей морфологии. Том II

  • формат djvu
  • размер 4.62 МБ
  • добавлен 09 апреля 2011 г.

Мельчук И. А. Курс общей морфологии. Том II. Москва - Вена: "Языки русской культуры", Венский славистический альманах, 1998. - 544 с. "Курс общей морфологии" представляет собой компендиум современный знанай в области морфологии естественный языков. Объектом его является слово - во всех его смысловых, формальных и комбинаторных аспектах. Для описания свойств и поведения слов в языках Земли разработана дедуктивная система строгих понятий, охватыва.

Мельчук И.А. Курс общей морфологии. Том III

  • формат djvu
  • размер 25.85 МБ
  • добавлен 09 апреля 2011 г.

Мельчук И. А. Курс общей морфологии. Том III. Москва - Вена: "Языки русской культуры", Венский славистический альманах, 2000. - 368 с. "Курс общей морфологии" представляет собой компендиум современный знанай в области морфологии естественный языков. Объектом его является слово - во всех его смысловых, формальных и комбинаторных аспектах. Для описания свойств и поведения слов в языках Земли разработана дедуктивная система строгих понятий, охватыв.

Пиотровский Р.Г. Математическая лингвистика

  • формат djvu
  • размер 5.31 МБ
  • добавлен 28 мая 2009 г.

Р. Г. Пиотровский, К. Б. Бектаев, А. А. Пиотровская: Математическая лингвистика. Учеб. пособие для пед. институтов. М.: Высшая школа, 1977. - 383 с. В книге рассматриваются различные вопросы языкознания, связанные с применением в нем математического анализа, теории вероятностей и математической статистики. Достаточное место уделено теоретическому обоснованию и приемам практического применения математических методов в изучении языка. Исходные по.

Читайте также: