Реферат на тему электронные словари

Обновлено: 05.07.2024

Рекомендуемые электронные словари и поисковые системы.

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными поисковыми системами. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Эти системы могут различаться по принципу отбора информации, который в той или иной степени присутствует и в алгоритме сканирующей программы автоматического индекса, и в регламенте поведения сотрудников каталога, отвечающих за регистрацию. Как правило, сравниваются два основных показателя:

  • пространственный масштаб, в котором работает ИПС,
  • и ее специализация.

Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обработки запросов пользователей, о том, из чего эти системы состоят и как функционируют… Поисковые системы можно сравнить со справочной службой, агенты которой обходят предприятия, собирая информацию в базу данных. При обращении в службу информация выдается из этой базы. Данные в базе устаревают, поэтому агенты их периодически обновляют. Некоторые предприятия сами присылают данные о себе, и к ним агентам приезжать не приходится. Иными словами, справочная служба имеет две функции: создание и постоянное обновление данных в базе и поиск информации в базе по запросу клиента.

Аналогично, поисковая машина состоит из двух частей: так называемого робота (или паука), который обходит серверы Сети и формирует базу данных поискового механизма. База робота в основном формируется им самим (робот сам находит ссылки на новые ресурсы) и в гораздо меньшей степени - владельцами ресурсов, которые регистрируют свои сайты в поисковой машине. Помимо робота (сетевого агента, паука, червяка), формирующего базу данных, существует программа, определяющая рейтинг найденных ссылок Принцип работы поисковой машины сводится к тому, что она опрашивает свой внутренний каталог (базу данных) по ключевым словам, которые пользователь указывает в поле запроса, и выдает список ссылок, ранжированный по релевантности. Следует отметить, что, отрабатывая конкретный запрос пользователя, поисковая система оперирует именно внутренними ресурсами (а не пускается в путешествие по Сети, как часто полагают неискушенные пользователи), а внутренние ресурсы, естественно, ограниченны. Несмотря на то что база данных поисковой машины постоянно обновляется, поисковая машина не может проиндексировать все Web-документы: их число слишком велико. Поэтому всегда существует вероятность, что искомый ресурс просто неизвестен конкретной поисковой системе.

Яндекс и Google ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок постоянно растет. Яндекс не требует от вас знания специальных команд для поиска. Достаточно набрать вопрос и вы получите результат - список страниц, где встречаются эти слова.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос 'идти', то в результате поиска будут найдены ссылки на документы, содержащие слова 'идти', 'идет', 'шел', 'шла' и т.д. На запрос 'окно' будет выдана информация, содержащая и слово 'окон', а на запрос 'отзывали' - документы, содержащие слово 'отозвали'. При этом поиск не ограничен лишь словами или фразами. Яндекс отыщет по названию web-страницу компании или файл с нужной картинкой.

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей.

Существующие типы словарей разнообразны. Это разнообразие объясняется, прежде все­го, сложностью и многоаспектностью самого объекта лексикографического описания, т. е. языка. Кроме того, многочисленные потребности общества в получении самой различной информации о языке также усложняют и рас­ширяют репертуар словарей. Практически нет никакой возможности дать в одном словаре всю в той или иной мере исчерпывающую информацию о языке, которая удовлетворила бы в равной степени все общество в целом и отдельные его слои и частности. Именно поэтому в лю­бой национальной лексикографии мы находим десятки, а то и сотни словарей самых разных типов.

Деление словарей на типы происходит, как говорят классификаторы, по различным основаниям: в зависимости от цели словаря, его объема, порядка расположения в нем слов, объекта описания и т. д. Многие из указанных момен­тов налагаются друг на друга, объединяясь в словаре одного и того же типа, другие стоят особняком, служа основанием для словарей совершенно отличного типа. Существуют переводные, толковые, диалектные и региональные словари, словари сленга, исторические, неологизмов, этимологические, крылатых выражений и много других. Необходимо от­метить, что в науке о языке пока еще нет сколько-нибудь общепринятой типологии словарей, хотя попытки создать таковую предпринимались многими лингвистами, в частно­сти Л. В. Щербой, П. Н. Денисовым, Б. Кемадой, Я. Малкилом, Л. Згустой и др.

С появлением компьютерной техники, создатели программного обеспечения создали новый тип словарей - электронный словарь. Такой тип словаря - абсолютно новое слово в истории лексикографии, отметившее новую качественную ступень ее развития. Именно сейчас электронные словари вышли из тени бумажных и становятся самостоятельными игроками на языковой площадке, причем игроками, которые, похоже, в ближайшее время сделают остальных действующих лиц экспонатами Музея книги. Ведь электронные словари обладают рядом очевидных и существенных преимуществ по сравнению со словарями традиционными. Единственным же их недостатком является привязанность к персональному компьютеру и, следовательно, ограниченная доступность. Однако этот недостаток будет достаточно скоро устранен если не полностью, то, по крайней мере, большей частью, вследствие все возрастающих темпов компьютеризации, в том числе и растущей доступностью переносным компьютеров типа Laptop.

Электронных словарей сейчас выпущено довольно много, поэтому остановимся только на двуязычных англо-русских и русско-английских словарях. Одними из самых популярных являются Мультитран и Lingvo.

Multitran – открытая информационная система накопительного типа, доступная абсолютно любому пользователю. Multitran функционирует на принципах единого словаря. При запросе на определенный термин, выдаются одним списком все тематики, где встречается этот термин. Благодаря этому очень сильно упрощается непрерывное пополнение базы словаря. В сети доступна основная версия Multitran, размещенная на основном сайте, но существует также и электронная версия под Windows, которая может обновляться через Интернет.

Первое, что бросается в глаза, когда мы говорим об электронных словарях - это резкое сокращение объема. На десятиграммовом компакт-диске помещается целая полка толстых словарей общим весом в двадцать пять килограмм. Но, естественно, не это главное. Важно, что электронный словарь принципиально может обойти ключевое противоречие книжной лексикографии: чем больше информации предлагает словарь, чем развитее его научный аппарат, тем сложнее им пользоваться. Поэтому классические словари разделяется на две категории. Первая - популярные, относительно удобные, но довольно простые. Вторая - обстоятельные академические издания, не позволяющие быстро получить искомую информацию.

Современные электронные словари не только значительно превосходят по объему книжные, но и находят искомое слово или словосочетание за несколько секунд. Причем искать можно в любой форме. Некоторые, например Lingvo, встраиваются во все основные офисные приложения и выделенное слово можно переводить нажатием нескольких клавиш.

Одно из преимуществ электронных словарей, это то, что они не только содержат транскрипцию, но и могут произносить слова. Но, конечно, самое главное преимущество хороших электронных словарей - одновременный поиск не только по названию словарной статьи, но и по всему огромному объему словарей, что просто нереально в бумажном варианте. Такой поиск создает многомерный портрет слова, при этом извлекаются из глубин словарной статьи не только конкретные примеры его использования и устойчивые выражения, в которых слово встречается, но и обнажаются, становятся явными языковые законы, которым подчиняются правила словообразования. Даже мобильный электронный словарь не может отразить все сиюминутные движения языка, но он может дать ключ для расшифровки и понимания этих изменений, делая пользователя соавтором лексикографа. Что очень важно, когда требуется точный смысловой перевод, ведь это не задача подбора подходящего выражения, а в широком смысле отображение одной культуры с помощью языка другой.

Словари Lingvo и Multitran вполне могут уместиться на флэшке с емкостью до 256 мегабайт. Словари прекрасно дополняют друг друга и могут удовлетворить большую часть терминологических запросов замого привередливого потребителя, коим и является профессиональный технический переводчик, желающий всегда быть в курсе терминологических нововведений.

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода

Содержание работы
Файлы: 1 файл

лексикография.doc

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное образовательное учреждение

высшего профессионального образования

Факультет иностранных языков

Кафедра теории и практики перевода

КУРСОВАЯ РАБОТА

по дисциплине:

Современная лексикография

Электронные словари

студент группы

Чебоксары 2012

Глава I. МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ

ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН. 4

a. Лексикография как одна из наук о языке. 5

b. Типы словарей. 7

c. Составление словарей. 18

Глава II. ЭЛЕКТРОННЫЕ СЛОВАРИ. 20

a. Электронные словари "МультиЛекс". 20

b. Электронные словари "Lingvo". 21

c. Преимущества электронных словарей. 22

d. Новые мехи требуют нового вина. 24

f. Проблема актуальности. 26

    1. Соответствие уровню достижений лингвистической

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 27

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода.

Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров (а тем более таких, каким было бы 'под силу' осуществлять более или менее современные программы машинного перевода) насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Россия все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много, следствием чего является тот факт, что услуги их недешевы. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой - сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное - лингвистики.

Цель данной работы - определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.

В соответствии с поставленной целью, задачами исследования являются:

- уяснение местоположения компьютерной лексикографии среди лингвистических наук;

- уяснение различий между электронными и традиционными бумажными словарями;

- определение максимально эффективного способа организации электронных словарей;

- уяснение различий между разнообразными системами МП и классификации последних;

- анализ работы систем машинного перевода на примере перевода, произведенного программой PROMT XT, и сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия.

ГЛАВА I. МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ

Лексикография как одна из наук о языке

Существует, однако, другая точка зрения на лексикографию. Ее сторонники считают, что лексикография — это не просто техника, не просто практическая деятельность по составлению словарей и даже не искусство, а самостоятельная научная дисциплина, имеющая свой предмет изучения (словари различных типов), свои научные и методологические принципы, свою собственную теоретическую проблематику, свое место в ряду других наук о языке.

Что такое наука вообще? Каковы ее важнейшие черты? Основными и важнейшими чертами науки, любой научной дисциплины являются следующие: наличие системы знаний и необходимость их объективного исследования. Эти две существенные черты взаимосвязаны, тесно переплетены, ибо только тогда можно строить адекватную действительности систему знаний, когда эта действительность будет объективно изучена. В применении к лексикографии это выглядит следующим образом.

Если принять тезис о том, что лексикография есть искусство, то тогда открываются двери субъективному пониманию задач и предмета лексикографии, приемов и методов ее исследования, субъективному решению ее проблем. Вряд ли такой подход будет плодотворен и уж никак не научно объективен. Если же принять тезис о том, что лексикография есть просто техника составления словарей, некий вид сугубо практической деятельности, то тогда придется передать другим наукам (лексикологии, семантике, стилистике, этимологии и т. п.) решение всех теоретических вопросов, и лексикография должна будет использовать лишь готовые решения этих наук. Вряд ли это будет плодотворно, ибо другие науки о языке недостаточно хорошо знакомы с положением дел в лексикографии. Они, следовательно, будут решать вопросы лексикографии со своих позиций, со своих точек зрения, а потому ущербно для лексикографии. Таким образом, тезис о том, что лексикография есть наука, является единственно правильным и наиболее плодотворным. Из этого следует, что лексикография как наука имеет свой собственный предмет исследования, свои специальные методы исследования, свою структуру, свое место в ряду других лингвистических дисциплин.

Как и всякая наука, лексикография имеет две стороны: научно-теоретическую и практически-прикладную. Первая (теоретическая лексикография) ставит общие теоретические проблемы и работает над их решением. Вторая (практическая лексикография) занимается непосредственно составлением словарей различных типов на базе теоретических решений основных проблем. Конечно, деление лексикографии на две части в высшей степени условно. Эти две стороны лексикографии идут всегда вместе, они взаимосвязаны: лексикограф-теоретик не может заниматься голым теоретизированием без работы над конкретным материалом, без участия в какой-то практической лексикографической работе; и, наоборот, никакой лексикограф-практик не может окунуться только в свою чисто эмпирическую работу, не зная новейшей проблематики лексикографии как науки. Тем не менее, принципиальное разграничение двух сторон лексикографии чрезвычайно важно.

Читайте также: