Математика в лингвистике кратко

Обновлено: 04.07.2024

математическая дисциплина, предметом к-рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к 50-м гг. 20 в.; она была вызвана к жизни прежде всего внутренними потребностями теоретич. лингвистики, в к-рой к этому времени назрела необходимость уточнения основных понятий, а также задачами, связанными с автоматизацией переработки языковой информации (см. Автоматический перевод). В М. л. широко используются методы теории алгоритмов, теории автоматов и алгебры. Сохраняя свое прикладное значение, М. л. постоянно эволюционирует по пути превращения в теоретическую математич. дисциплину, являющуюся по сути дела одним из ответвлений математич. логики. В то же время круг приложений М. л. расширился - ее методы нашли применение в теории программирования.

Лингвистич. концепции, лежащие в основе формальных методов описания строения языка, принадлежат структурной лингвистике. Главнейшая из этих концепций - представление о языке как о "системе чистых отношений", сближающее язык с абстрактными системами, изучаемыми в математике. Это представление конкретизируется в концепции функционирования языка как преобразования нек-рых абстрактных объектов - "смыслов" - в объекты другой природы - "тексты" и обратно. Такая концепция приводит к мысли об изучении указанного преобразования (после уточнения понятий "смысла" и "текста") математич. средствами. Использование этого подхода затруднительно, если пытаться рассматривать преобразование "в целом", ввиду его чрезвычайной сложности, а также ввиду трудности формализации понятия "смысла". Однако содержательные соображения подсказывают расчленение преобразования на этапы. Напр., при одном из наиболее грубых членений нек-рый этап может состоять в переходе от "смыслов" предложений к "синтаксическим структурам без линейного порядка" - наборам элементов предложений, соединенных "синтаксическими связями", но еще не расположенных в линейные последовательности; на следующем этапе получаются линейные последовательности слов, потом они превращаются в цепочки звуков. При более тонких членениях вводятся синтаксич. структуры нескольких уровней, все более отдаляющиеся от "смыслового" и приближающиеся к "текстовому"; "послесинтаксические" этапы также подвергаются дальнейшему расчленению. Такие этапы уже легче описывать математически, уточняя представления об объектах промежуточных уровней и моделируя переходы от одних уровней к другим эффективными отображениями. Правда, рассматриваемое преобразование неоднозначно, и таковы же все или почти все (в зависимости от способа членения) промежуточные этапы; это связано с одной из важнейших особенностей языка - наличием в нем явления синонимии, т. е. возможности выражать одно и то же содержание разными способами. Поэтому приходится строить не детерминированные эффективные системы (алгоритмы), а недетерминированные (исчисления), позволяющие либо для данного объекта нек-рого уровня перечислять отвечающие ему объекты соседнего уровня или объекты (того же уровня), ему синонимичные, либо перечислять множество "правильных" объектов заданного уровня (т. е. таких, к-рые известным регулярным способом сопоставляются объектам предыдущего уровня), либо перечислять множество пар отвечающих друг другу объектов двух заданных соседних уровней (напр., "предложение + его синтаксическая структура") и т. п. Такого рода исчисления известны как грамматики формальные. Одновременно с формальными грамматиками, моделирующими преобразования языковых объектов, возникают конструкции, предназначенные для формального описания самих этих объектов. Кроме того, на множествах объектов одного уровня возникают классификации и отношения, во многом сходные с категориями традиционной грамматики (такими, как часть речи, род, падеж и т. п.) и в ряде случаев совпадающие с ними; без введения таких классификаций и отношений реальное построение формальных грамматик для естественных языков фактически невозможно.

Таким образом, можно выделить три аспекта формального описания языка: описание строения языковых объектов различных уровней, описание нек-рых специальных отношений и классификаций на множествах этих объектов и описание преобразований одних объектов в другие, а также строения множеств "правильных" объектов. Этим аспектам отвечают три основных раздела М. л.: 1) разработка и изучение способов описания строения отрезков речи; 2) изучение лингвистически значимых отношений и классификаций на множествах языковых объектов (построенные для этой цели формальные системы обычно называют аналитическими моделями языка);3) теория формальных грамматик.

Для описания строения отрезков речи используются синтаксич. структуры, представляющие собой графы или биграфы специального вида, обычно с помеченными вершинами и/или дугами. Лучше всего разработана теория описания "поверхностных" уровней (т. е. наиболее далеких от "смыслового"); на этих уровнях структуры обычно являются деревьями. Интенсивно разрабатываются способы описания более "глубинных" уровней. Для этого, в частности, предложен аппарат т. н. лексических функций, играющих при описании смысловой сочетаемости слов роль, сходную с той, к-рую традиционные категории рода, падежа, числа и т. п. играют при описании синтаксич. сочетаемости. Средств строгого описания "смыслового" уровня пока нет, но многим исследователям представляется вероятным, что на таком пути "последовательного приближения" можно надеяться выработать подход к формальному описанию смысла. Это не исключает и иных подходов; в частности, много исследований посвящено способам выражения в естественных языках предикатов, пропозициональных связок, кванторов, "переводу" с формально-логич. языков на естественные и обратно. Сюда же примыкают работы по конструированию так наз. семантических языков, в к-рых смыслы сопоставляются текстам простыми и строго формальными способами.

Аналитич. модели языка важны, в частности, ввиду того, что они позволяют уточнить логич. природу многих понятий и категорий традиционного языковедения. Эти модели не всегда носят характер эффективных процедур, поскольку в них могут входить такие понятия, как (бесконечное) множество грамматически правильных предложений нек-рого языка, считающееся заданным. Однако в ряде моделей все исходные данные представляют собой конечные множества и финитные отношения; в этих случаях входящие в модель процедуры эффективны. К теории аналитич. моделей языка примыкает теория лингвистической д е ш и ф р о в к и: ее предметом является построение процедур, применяемых, подобно аналитич. моделям, к "неупорядоченным" эмпирич. данным о языке, но всегда эффективных и позволяющих получать не только абстрактные определения, но и конкретные сведения о строении конкретных языков (напр., алгоритмы, осуществляющие автоматич. разбиение множества фонем языка на классы гласных и согласных без использования каких-либо сведений о языке, кроме нек-рого достаточно длинного текста).

Теория формальных грамматик занимает в М. л. центральное место, т. к. она позволяет моделировать наиболее существенный аспект функционирования языка - переработку смыслов в тексты и обратно - и благодаря этому служит связующим звеном между остальными разделами М. л. По характеру своего аппарата теория формальных грамматик во многом близка к теории алгоритмов и теории автоматов. Более других разработаны те типы формальных грамматик, к-рые служат для характеризации множества грамматически правильных предложений языка и приписывания этим предложениям синтаксич. структур. Предложения при этом моделируются цепочками (словами) в конечном алфавите, элементы к-рого интерпретируются как слова естественного языка (поэтому в М. л. термин "цепочка" предпочитают термину "слово", а алфавит часто называют также словарем), и моделью множества грамматически правильных предложений служит нек-рый формальный язык. К этому типу относятся, в частности, грамматики порождающие. Порождающая грамматика представляет собой по существу частный случай исчисления Поста: она состоит из конечного алфавита, разделенного на две части - основной и вспомогательный алфавиты, конечного множества правил вывода, представляющих собой правила подстановки вида (- цепочки) и одной аксиомы (обычно состоящей из одного вспомогательного символа, называемого начальны м). (Формальный) язык, порождаемый такой грамматикой,- это множество цепочек в основном алфавите, выводимых из аксиомы. Наиболее важный для лингвистич. приложений класс порождающих грамматик - грамматики составляющих, у к-рых каждое правило имеет вид где - цепочки в объединении основного и вспомогательного алфавитов, А - вспомогательный символ и 6 непуста. Грамматика составляющих позволяет естественным образом сопоставлять цепочкам порождаемого ею языка размеченные системы составляющих. Этот класс грамматик наиболее важен и в чисто математич. отношении, т. к. языки, порождаемые грамматиками составляющих, представляют собой простой и весьма важный подкласс класса примитивно рекурсивных множеств. Среди грамматик составляющих в свою очередь особенно важны как в теоретическом, так и в прикладном аспектах грамматики бесконтекстные, у к-рых правила имеют вид где А - вспомогательный символ. К бесконтекстным грамматикам близки грамматики доминационные, также порождающие формальные языки, но сопоставляющие цепочкам этих языков деревья подчинения, и грамматики категориальные, характеризующиеся особым способом задания информации о синтаксич. свойствах слов. Принципиально иной тип формальных грамматик представляют собой грамматики трансформационные;. они служат для осуществления преобразований синтаксич. структур, не "привязанных", вообще говоря, К цепочкам; эти грамматики представляются наиболее перспективными для описания строения естественных языков, т. к. позволяют рассматривать синтаксические и линейные отношения между словами раздельно, что лучше отражает языковую реальность.

Теория формальных грамматик наряду с "традиционными" для нее лингвистич. приложениями нашла применение в теории программирования для описания языков программирования и трансляторов. Особенно широко применяются для этих целей бесконтекстные грамматики, но используются и грамматики более общего вида.

Лит.:[1] Xомский Н., в кн.: Новое в лингвистике, в. 2, М., 1962, с. 412-527; [2] Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969.

Математическая энциклопедия. — М.: Советская энциклопедия . И. М. Виноградов . 1977—1985 .

Язык – важнейшее средство человеческого общения – социальное средство хранения и передачи информации, одно из средств управления человеческим поведением.

До начала XX в., говоря о языках, имели в виду только естественные языки (русский, английский и т.д.). В конце прошлого века была предпринята попытка создать искусственный язык – Эсперанто.

Лингвистика – наука о языках – сводилась в основном к изучению конкретных естественных языков, их классификации, выяснению сходств и различий между ними. Возникновение математики, логико-философского исследования языка науки, привели к появлению идеи структуралистского подхода к лингвистике [19].

Язык может быть описан математическими средствами, как преобразование некоторых абстрактных объектов – смыслов, в некоторые объекты – тексты и обратно [29].

Преобразование объектов языка выглядит следующим образом:

1) переход от смыслов к синтаксическим структурам без линейного порядка;

2) переход к линейным последовательностям слов;

3) получение цепочек звуков.

Язык – частный случай знаковой системы.

Наиболее хорошо исследованы знаковые системы, в которых знаками являются символы алфавитов, а последовательностями знаков – тексты; к таким знаковым системам относятся естественные языки, языки науки, а так же сильно развившиеся за последние 60 лет языки программирования.

Математическая лингвистика – математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков.

Математическая лингвистика является ответвлением математической логики.

Наибольших успехов математическая лингвистика достигла в изучении синтаксиса, где за последние годы сложился специальный математический аппарат – теория формальных языков и грамматик.

Формальный язык

Формальный язык в отличие от естественного, допускающего неоднозначность, двусмысленность, строится по математически строгим и точным правилам. Он применяется для описания искусственных языков, например, языков программирования.

Язык – важнейшее средство человеческого общения – социальное средство хранения и передачи информации, одно из средств управления человеческим поведением.

До начала XX в., говоря о языках, имели в виду только естественные языки (русский, английский и т.д.). В конце прошлого века была предпринята попытка создать искусственный язык – Эсперанто.

Лингвистика – наука о языках – сводилась в основном к изучению конкретных естественных языков, их классификации, выяснению сходств и различий между ними. Возникновение математики, логико-философского исследования языка науки, привели к появлению идеи структуралистского подхода к лингвистике [19].

Язык может быть описан математическими средствами, как преобразование некоторых абстрактных объектов – смыслов, в некоторые объекты – тексты и обратно [29].

Преобразование объектов языка выглядит следующим образом:

1) переход от смыслов к синтаксическим структурам без линейного порядка;

2) переход к линейным последовательностям слов;

3) получение цепочек звуков.

Язык – частный случай знаковой системы.

Наиболее хорошо исследованы знаковые системы, в которых знаками являются символы алфавитов, а последовательностями знаков – тексты; к таким знаковым системам относятся естественные языки, языки науки, а так же сильно развившиеся за последние 60 лет языки программирования.

Математическая лингвистика – математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков.

Математическая лингвистика является ответвлением математической логики.

Наибольших успехов математическая лингвистика достигла в изучении синтаксиса, где за последние годы сложился специальный математический аппарат – теория формальных языков и грамматик.

Формальный язык

Формальный язык в отличие от естественного, допускающего неоднозначность, двусмысленность, строится по математически строгим и точным правилам. Он применяется для описания искусственных языков, например, языков программирования.

Во-вторых, в математике в начале Нового времени вышли на первый план количественные методы, и только в XIX веке математики снова начали строить неколичественные абстрактные модели, отличавшиеся от античных более высоким уровнем абстракции, а также — что для нашей темы особенно важно — тем, что они могли использоваться для описания значительно более широкого круга явлений, чем пространственные формы; нередко такие модели оказывались удобным и даже необходимым средством для изучения явлений, о которых строившие их математики вовсе не думали и даже не знали об их существовании. Среди этих моделей были и те, которые впоследствии получили применение в лингвистике; особенно интенсивное развитие математических дисциплин, содержанием которых было их построение, пришлось на первую половину ХХ столетия. Поэтому встреча математики и лингвистики в середине этого столетия была вполне закономерна.

Не меньшее, а может быть и большее значение, чем возникновение математической лингвистики, имело непосредственное проникновение в лингвистику фундаментальных математических идей и понятий — таких, как множество, функция, изоморфизм. В современной лингвистической семантике важную роль играют пришедшие из математической логики понятия предиката и квантора. (Первое из них возникло в логике еще тогда, когда она не отграничивалась от лингвистики, и теперь вернулось в лингвистику в обобщенном и математически обработанном виде.)

Свидетельство и скидка на обучение каждому участнику

Зарегистрироваться 15–17 марта 2022 г.

Связь математики и лингвистики

Аннотация: В данной статье авторы рассматривают роль математики в лингвистике. Центральными понятиями математической лингвистики являются понятия множества исходных символов и множества. Проанализированы работы ученых, видевшие связь языкознания с математикой.

Ключевые слова: символ, математические методы, лингвистика, язык, система.

Статистически исследуется фонетика, закладываются основы статистического изучения морфемного состава слова и морфологических категорий. В частности установлена связь между числом фонем и средней длиной морфемы, стало известно, что количество фонем отражается на качестве морфем и слов, а количество морфем на качестве слов.

С помощью формально-количественных методов изучается авторский идиостиль. Шире всего количественные методики используются при описании лексического уровня языковой системы. Практическим результатом статистического изучения лексики являются частотные словари, отличающиеся от обычных лингвистических (толковых, орфографических им других) тем, что словарные единицы располагаются в них не только в алфавитном порядке, но и в порядке убывающей частотности.

Характерно, что математические методы обладают следующими возможностями:

делают точными суждения, основанные на количественно-частотных соображениях;

указывают на такие обстоятельства функционирования языка и диалекта, которые иными способами не обнаруживаются;

позволяют глубже и всесторонне понять причины и результаты языковой эволюции, длительность эволюционных процессов и их хронологию, и даже прогнозировать будущее языковое развитие;

расширяют сферу прикладного использования языкознания.

Список использованной литературы

Бор Н. Атомная физика и человеческое познание. - М.: Изд-во иностр. лит-ры, 1961.

Школьники из Ржева поехали в Торжок

Друзья кровавой старины народной чаяли войны

Аппарат деревьев подчинения и систем составляющих исполь­зу­ет­ся также для представ­ле­ния глубинно-синтаксической структуры предложения, которая образует промежу­точ­ный уровень между семантической и обычной синтаксической структурой (послед­нюю часто называют поверхностно-синтаксической).

Более совершенное представление синтаксической структуры предложения (требующее, однако, более сложного математического аппарата) дают системы синтаксических групп, в которые входят как словосочетания, так и синтаксические связи, причём не только между словами, но и между словосочетаниями. Системы синтаксических групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксических групп.

Ямщик сидит на облучке

Особняком стоят грамматики Монтегю, служащие для одновременного описания синтак­си­че­ских и семантических структур предложения; в них исполь­зу­ет­ся сложный математико-логический аппарат (так называемая интенсиональная логика).

Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования.

В аналитических моделях языка исполь­зу­ют­ся простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели — процеду­ры, позво­ля­ю­щие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предва­ри­тель­ных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языко­ве­де­ния. В то же время ее методы находят широкое применение в прикладных лингвистических иссле­до­ва­ни­ях — автоматической обработке текста, автоматическом переводе и разработ­ках, связан­ных с так называемым общением между человеком и ЭВМ.

Читайте также: