Как работать с электронными словарями сообщение

Обновлено: 23.04.2024

Что важнее всего при изучении иностранного языка? Желание, свободное время, проверенный учебник, хороший преподаватель? Безусловно. А ещё — хороший словарь.

У многих из нас на полках стоят бумажные словари: старые и новые, общие и специализированные, многотомные и карманные. С ними, как и с любыми книгами, может быть связано множество воспоминаний: например, о школьных уроках немецкого или о первой поездке за рубеж. Но вряд ли кто-то поспорит с тем, что по удобству использования бумажные словари проигрывают электронным.

Работать с электронными словарями проще и быстрее, чем с бумажными: не нужно перелистывать страницы в поисках слова, можно не только прочитать перевод слова, но и услышать, как оно звучит, а пользоваться словарём можно на любом устройстве. На сервисе Яндекс.Словари представлены три вида электронных словарей: переводные, энциклопедические и словари русского языка: толковые, этимологические, орфографические, фразеологические, словари синонимов и так далее.

Если ввести в поисковую строку Словарей, например, слово [колибри], то словари русского языка дадут его краткое толкование, расскажут, откуда произошло слово, есть ли у него синонимы и на какой слог в нём ставить ударение. Из энциклопедических словарей можно узнать, как выглядит колибри, где обитает и чем питается. Переводные словари, об устройстве которых мы хотим рассказать, подскажут, как слово переводится на иностранные языки.


Сколько у нас словарей

Сейчас в коллекции сервиса Яндекс.Словари — 67 переводных словарей для десяти языков, включая казахский, турецкий и латынь. В нашем индексе есть как общие, так и специализированные словари: для юристов, биологов, врачей, авиаторов. Мы используем готовые электронные словари, а не составляем их самостоятельно: эта работа требует специальных навыков и знаний, и её выполняют ученые-лексикографы.

Как формируется словарная статья

Мы не знаем, какая именно задача стоит перед пользователем, заглянувшим в словарь. Возможно, он делает школьное задание по английскому языку, а может быть, переводит статью про плазмохимическое травление в микроэлектронике. Поэтому для каждого слова мы показываем все переводы из всех словарей, где оно нашлось. Само по себе это несложно, но без специальной обработки результатов пользователям придётся продираться через большое количество повторов. Перевод будет выглядеть примерно так:

Чтобы не дублировать информацию, мы научились разбирать словарные статьи на отдельные переводы и склеивать переводы по близости значений. Этим в переводных Яндекс.Словарях занимается специальный алгоритм.

Алгоритм извлекает из словарных статей данные — основные и вспомогательные. Основные — это заголовок и список переводов; иными словами, то, что составляет структуру статьи. К вспомогательным данным относятся часть речи, грамматические пометки, транскрипция, примеры употребления и тематика.

Дальше алгоритм, ориентируясь на основные (а при необходимости — и на вспомогательные) данные, распределяет переводы по частям речи, собирает близкие по значению переводы в одну строку и удаляет дубликаты. В результате получается такая статья:

Многие статьи проиллюстрированы примерами. Примеры мы тоже получаем из словарей, входящих в индекс. В словарях примеры часто даются списком в конце статьи, что не всегда удобно. Наш же алгоритм умеет распределять примеры по значениям – вот так:

Помимо Словарей, у Яндекса есть еще один сервис для тех, кто имеет дело с иностранным языком, – это Перевод. Если Словари предназначены главным образом для тех, кто серьезно изучает язык, то автоматический переводчик может пригодиться, например, в зарубежной поездке или в случае, когда нужно примерно понять содержание текста на незнакомом языке.

Автор: Синица Александра Игоревна, учитель русского языка, педагог дополнительного образования ГБОУ школы №531 Красногвардейского района Санкт-Петербурга

Необходимость обогащения словарного запаса учащихся через различные виды упражнений и диктантов ставит перед учителем и учениками важную задачу — проводить всесторонний анализ слова в орфоэпическом, лексико-семантическом, орфографическом и синтаксическом аспектах. Обучая, необходимо создать условия для устранения из речи как диалектно-просторечных и нелитературных слов, так и слов архаичных, вышедших из употребления. Причем одновременно с этим необходимо ориентироваться и на возрастные возможности учащихся.

Работа со словарем несет большое воспитательно-образовательное значение для формирования языковой личности учащегося, его мировоззрения, его культуры речи. Данная работа необходима для вооружения навыками, необходимыми для будущей практической деятельности учащегося.

Для более эффективного усвоения лексических особенностей русского языка самым практичным способом становится использование информационно-электронных словарей.В процессе обучения русскому языку и литературе мы традиционно обращались и к различным источникам информации: словарям, справочникам, энциклопедиям, хрестоматиям и т.п. Основным источником такой информации перестает быть традиционная библиотека, на смену ейпришли электронные словари, энциклопедии, представляемые ранее в большом объеме только на электронных носителях,а теперь и в Интернете.

Электронный словарь — это не просто отсканированныйлисткакого-либо печатного издания словаря, это программа или портал (пример:Грамота.ру), снабженные удобным пользовательским интерфейсом и автоматическими быстрыми средствами поиска. И это намного ускорит работу учителя на уроке и учащегося при подготовке к домашней работе. Ведь многие бумажные словари до сих пор не всем доступны по следующим причинам. Многие популярные словари, удобные для использования по своим объемам и по своей цене, скорее всего, довольно просты и не всегда отражают важную для полной словарной статьи информацию. Как часто в карманном словарике мы не можем найти нужного слова или же его толкованиеочень скудно для понимания? Однако объемные профессиональные издания чаще всего непригодны для быстрого получения информации: потребуется не малая сила, чтобы принести в школу двухкилограммовый том, достаточное количество времени для того, чтобы начать его листать в поисках необходимого слова. А электронные словари сочетают большой объем с удобством пользования, что достигается благодаря машинному механизму поиска. Чтобы найти слово в электронном словаре, обычно достаточно просто напечатать его в командной строке словаря или найти в алфавитно-корневом рубрикаторе.

Информационно-коммуникационные технологии я применяю на всех этапах урока: при объяснении нового материала, при закреплении, а также при повторении материала.

При усвоении учащимся семантики и орфографии неизвестного слова необходима этимологическая справка, которую, как правило, давал учитель, что помогало сформировать интерес к слову, к языку, к его истории. Теперь эту этимологическую справку дети могут составлять друг для друга самостоятельно, используя электронные словари.

Важно помнить, что тщательно спланированная и хорошо организованная работа со словарями помогает обогащать словарный запас учащихся, вырабатывать орфографическую грамотность, развивать речь учащихся, а в целом способствует повышению языковой культуры, формированию у ребенка внимания, уважения и любви к родному языку.

Благодаря систематической словарной работе на уроках русского языка и литературы, у моих учащихся возрос интерес к словарной работе и к русскому языку в целом. Они любят и умеют работать со словарями и справочной литературой с использованием компьютерных технологий, что позволило им запомнить принцип работы и с печатными словарями, знают имена русских языковедов и лексикографов, ведь на их фамилии они должны опираться при описании какого-либо искомого слова. И если ученики быстро ориентируются в море предлагаемых им вариантов электронных словарей — это прекрасный результат. Ведь использование электронных словарей способно значительно ускорить нашу работу.

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

Электронные словари.

Электронный словарь соединяет в себе функции поиска интересующей информации, демонстрации языковых закономерностей и дает возможность освоить учебный материал с помощью специальной системы упражнений.

Все современные электронные словари используют звуковые средства мультимедийных персональных компьютеров для воспроизведения произношения.

В данной работе мы хотим дать описание некоторым электронным словарям.

Тир и Кроссворд - это система упражнений для изучения новых слов, использующаяся в качестве базы данных говорящий оксфордский словарь. По вашему выбору вы либо отгадываете английские слова по русским значениям либо русские слова по английским значениям. Слова выбираются из словаря в случайном порядке, поэтому наборы слов в тирах и кроссвордах никогда не повторяются. Предусмотрены различные уровни сложности, благодаря чему упражнения будут интересны и эффективны как для начинающих, так и для тех, кому необходимы, знать английский язык в совершенстве.

Динамичное упражнение Тир научит писать английские слова быстро и без ошибок, а увлекательный Кроссворд позволит выучить огромное количество новых слов с учетом всех их возможных значений. Для каждого студента ведется полная персональная статистика использования всех слов, результаты которой наглядно отображаются в виде цветных диаграмм.

Этот английский словарь , незаменимый при изучении письменного английского языка эффективно обогащает вокабуляр студентов и помогает им развить навыки письма. Он ведет от базового значения к словам и фразам, необходимым для точного выражения мыслей.

Подробные определения помогают выбрать точно слово, а аутентичные примеры демонстрируют употребление слова в типичном контексте.

Устойчивые выражения и фразы, необходимые для того, чтобы писать правильно.

Указатель ключевых слов в конце словаря облегчает поиск необходимых значений


Единственное в своем роде издание, предназначенное для тех, кто хочет успешно сдать международные экзамены по английскому языку (FCE, CAE, IELTS, TOEFL, TOEIC).

212 000 слов, выражений и значений.

160 000 примеров, включая примеры из академических работ (эссе), показывающих, как правильно употреблять слова.

Более 10 000 синонимов, антонимов и производных слов.

Более 1 000 Study Notes, посвященных проблемным областям лексики и грамматики и предупреждению типичных ошибок.

Единственный словарь, где выделены не только три тысячи наиболее употребительных слов устной и письменной речи, но и слова, которые характерны для академического стиля.

Раздел Essay Activator способствует эффективному развитию навыка письма.

Раздел Topic Activator поможет расширить словарный запас по темам, традиционно предлагаемым для написания эссе.

На CD-ROM’е к Longman Exam Dictionary находятся обзор/формат экзаменов, обширный банк заданий в интерактивном режиме для успешной подготовки к экзаменам, более 3-х часов практики по подготовке к заданиям по аудированию, а также полное содержание словарей Longman Exam Dictionary и Longman Language Activator.

CD-ROM Longman Dictionary Of Contemporary English установлен на компьютеры в отделениях Британского Совета по всему миру.
В архиве Вы найдете два диска в формате mdf и патч, решающий все проблемы с запуском.

Особенности словаря на CD-ROM:

Более 100 000 словосочетаний в дополнение к традиционному формату.

Более 1 000 000 примеров из устной и письменной речи покажут, как правильно употреблять слова.

Longman Language Activator существенно расширит Ваш словарный запас и улучшит навыки письма.

Longman Writing Assistant - эффективная интерактивная помощь - незаменимая вещь при написании эссе и других работ.

Тысячи упражнений для подготовки к международным экзаменам (FCE, CAE, CPE, IELTS).

Возможность услышать не только произношение отдельных слов, но и запись 80 000 предложений - примеров в британском и американском варианте.

Your link to living language:

155,000 natural examples bring English to life

British and American pronunciations of headwords, including people and place names

NEW 88,000 spoken example sentences pronounced on the CD-ROM

1 million additional sentences from books and newspapers

3000 most frequent words in spoken and written English highlighted

4000 new words and meanings

Reading and Writing solutions:

207,000 words, phrases and meanings – including free encyclopedia on CD-ROM

NEW Longman Writing Assistant – write correct English first time, every time

Choose the right word with Longman Language Activator® free on the CD-ROM

Longman Phrase Bank – 220,000 word combinations - free on CD-ROM

NEW Collocation and Word Focus boxes

NEW Over 1000 listening exercises as well as extensive exam practice for FCE, CAE, CPE, IELTS & TOEIC

Формирование коммуникативных компетенций на уроках русского языка

1. Необходимо нацелить на подготовку к преподаванию, ориентированному на качественные показатели по результатам ЕГЭ:
- ознакомить с едиными требованиями государственного стандарта, программ по русскому языку к сформированности знаний, умений, коммуникативных компетенций учащихся;
- порекомендовать передовые учебные программы и технологии преподавания русского языка;
- уточнить нормы оценивания работ;
- ознакомить с критериями оценивания развернутого ответа части С единого государственного экзамена по русскому языку;
- провести практикум учителей по выявлению, исправлению, обозначению и корректированию речевых, грамматических и фактических ошибок в работах учапщхся.
2. Сформировать у школьников ключевые умения, проверяемые заданием части С ЕГЭ:
- умение анализировать содержание исходного текста;
- умение анализировать форму исходного текста;
- умение выражать личностную позицию
- умение последовательно излагать собственные мысли;
- умение использовать в собственной речи разнообразие грамматических форм и лексическое богатство языка;
- орфографические и пунктуационные умения;
- владение нормами современного литературного языка.
3. Учитывать, что качество монологического письменного высказывания школьников зависит от развития у них мыслительного и понятийного аппарата, чувства родного языка, начитанности и общего кругозора.
Формирование и развитие коммуникативной компетенции возможно, с нашей точки зрения, за счет реализации в процессе преподавания русского языка межпредметных связей, умения ориентироваться в различных речевых ситуациях, умения строить диалогическое высказывание через тексты, используемые на других учебных предметах.
Формирование коммуникативной компетенции на уроках русского языка способствует разностороннему развитию языковой личности ученика, а также предполагает, в частности, необходимость гармоничного сочетания собственно учебной деятельности, в рамках которой формируются базовые знания, умения и навыки, с деятельностью творческой, связанной с развитием индивидуальных задатков учащихся, их познавательной акгивности, творческого мышления, способности самостоятельно решать нестандартные коммуникативные задачи.
Школа призвана развивать способности школьника реализовать себя в новых динамичных социально-экономических условиях, адаптироваться к различным жизненным обстоятельствам. Нет сомнения, что характеристиками той личности становятся коммуникабельность, способность к сотрудничеству
и социальному речевому взаимодействию, владение культурой слова, устной и письменной речью в различных сферах применения языка.

СОВРЕМЕННЫЕ ПОДХОДЫ В ФОРМИРОВАНИИ ЛИНГВИСТИЧЕСКОЙ, КОММУНИКАТИВНОЙ И МЕЖЪЯЗЫКОВОЙ КОМПЕТЕНЦИЙ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ В ВУЗЕ

Боброва Т.О.
Ставропольский филиал московского государственного гуманитарного университета им. Шолохова, г. Ставрополь

В статье предпринят анализ компетентностного подхода в обучении иностранным языкам в вузах, формирование лингвистической, коммуникативной и межъязыковой компетенций студентов на основе применения современных образовательных технологий.

Список использованной литературы

Общеевропейские компетенции владения иностранным языком: Изучение, преподавание, оценка

Что составляет основное содержание данного проекта, проведенного в рамках Совета Европы? Участники данного проекта попытались создать стандартную терминологию, систему единиц, или общепонятный язык для описания того, что составляет предмета изучения, а также для описания уровней владения языком, независимо от того, какой язык изучается, в каком образовательном контексте - какой стране, институте, школе, на курсах, или частным образом, и какие методики при этом используются. В итоге была разработана система уровней владения языком и система описания этих уровней с использованием стандартных категорий. Эти два комплекса создают единую сеть понятий, которая может быть использована для описания стандартным языком любой системы сертификации, а, следовательно, и любой программы обучения, начиная с постановки задач - целей обучения и заканчивая достигаемыми в результате обучения компетенциями.

Система уровней владения языком

При разработке Европейской системы уровней проводились обширные исследования в разных странах, методики оценки опробовались на практике. В результате пришли к согласию по вопросу о количестве уровней, выделяемых для организации процесса изучения языка и оценки степени владения им. Существует 6 крупных уровней, которые представляют собой более низкие и более высокие подуровни в классической трехуровневой системе, включающей в себя базовый, средний и продвинутые уровни. Схема уровней построена по принципу последовательного разветвления. Она начинается с разделения системы уровней на три крупных уровня - А, В и С:

Одной из самых полезных программ на ПК и смартфоне в моем понимании является электронный словарь. В те стародавние времена, когда я учил иностранный язык, каждое слово приходилось искать в бумажном словаре. Эту тривиальную операцию я проделывал сотни раз, а некоторые зловредные слова приходилось смотреть снова и снова, так как я успевал забыть их значение. Как это было обидно! То ли дело сейчас, вжух и перевод перед глазами на экране монитора. История поиска, на случай, если искомое слово не перешло из области кратковременной памяти в долгосрочную.

StarDict

Давайте своими силами создадим электронный словарь для программ StarDict / GoldenDict. Для этого может понадобится много, или мало человеко-часов, в зависимости от качества исходного материала.

Шаг первый: OCR

В отличие от альпинизма при оцифровке словаря самый тяжелый шаг, не последний а первый. Если вам придется проводить OCR бумажного словаря с выцветшими страницами, напечатанного слишком мелко, с различными артефактами небрежного использования, или на экзотическом языке, то даже FineReader не сильно поможет. На некоторых страницах разница в длительности времени между ручным набором текста и OCR с корректировкой ошибок ничтожна.

Советую сохранять все в простых текстовых файлах, так как продвинутый поиск и исправление ошибок, расстановка тэгов, преобразование сортировки и прочие операции с текстовым массивом невообразимо осуществлять с бинарным фалом.

На этом шаге важно определиться со структурой словарных статей. В самом простом случае будет всего два поля: ключ и значение. Этого достаточно, но если нужна подсветка различных элементов статей, то тогда потребуется все такие элементы определенным образом маркировать.

Самое время немного поговорить о форматах. Существует много форматов электронных словарей, вот их список.

Все форматы мы здесь разбирать не будем, так как большинство из них проприетарные. Нас интересуют открытые стандарты и открытое ПО.

Dictd

Возникший в эпоху, когда сетевые TCP/IP протоколы беспрепятственно плодились и размножались dictd сейчас представляет лишь археологический интерес. Это клиент серверный протокол, использующий TCP порт 2628, определен в RFC 2229.

Исходный файл для словаря форматируется следующим образом.

Готовый файл для словаря создается командой dictfmt .

В результате образуются 2 файла: dict-name.index и dict-name.dict . Из них первый очевидно индексный файл, с ним ничего делать не нужно, а второй можно сжать командой dictzip . Данная команда сжимает *.dict файл с помощью утилиты gzip . Сразу же возникает вопрос: а зачем оно тогда нужно, если есть обычный gzip ?

Дело в том, что dictzip использует добавочные байты в заголовке архивного файлы для обеспечения псевдо-произвольного доступа к файлу.

Наконец файлы помещаются в профильные каталоги, т. к. /usr/lib/dict , перезагружаем службу dictd и вуаля. Синтаксис поиска прост, достаточно набрать

Пробежка по dictd ссылкам напоминает сафари по интернет сети 90-х, жив и еще лягается!

Sdict

Дерзкая попытка Алексея Семенова изменить мир к лучшему с помощью магии Perl в ту пору, когда Microsoft еще не крутил шашни с Linux и сообществом открытого ПО, а основной источник словарей были пиратки ABBYY Lingvo.

Заголовок исходного файла словаря.

Тело форматировано следующим образом:

Можно качнуть версию для ОС Symbian, если что. Проект более не жив, и даже сами словари можно почерпнуть лишь с Машины Времени.

Ну все, завязываем с археологией и переходим к словарным форматам и программам годным для использования IRL.

XDXF имеет все преимущества и недостатки XML формата, каковым и является. Весь синтаксис формата и примеры можно обозреть тут.

Скелет словарного файла выгладит следующим образом, состоит из 2-х частей: meta_info и lexicon .

Есть огромное количество словарей в этом формате. Большим достоинством формата является то, что далее нет надобности ничего конвертировать. Программа GoldenDict распознает XDXF файлы наряду с большим количеством других поддерживаемых форматов.

TSV / StarDict

StarDict и клоны его это не столько про формат электронного словаря, сколько про качественное ПО просмотра, конвертации и создания таковых.

Для создания электронного словаря с помощью StarDict достаточно TSV файла, что я и выбрал для цифровой копии армяно-русского словаря.

Тем не менее возможно и кое-какое форматирования и разметка файла словаря, однако не идет ни в какое сравнение с XDXF .

Формат определяет символ переноса строки \n , в том случае, когда статья разбита на параграфы.

После первого шага скорее всего будут десятки, а то и сотни орфографических, грамматических и всяких прочих ошибок, странных символов и прочих артефактов OCR.

Не холивара для, рекомендую обработку теска производить с Vim. Если ваш любимый текстовый редактор справляется с этим не хуже, то и славно. С Vim достаточно команды.

для проверки орфографии по двум словарям, в данном случае русском и английском. Далее список граблей.

  • Сортировка текста работает абы как для не латинских локалей, особенно плохо там, где написание буквы требует более одного символа, как армянская ու = ո + ւ . Необходимо в таких случаях самостоятельно сортировать список слов с помощью простенького Perl, или иного скрипта.
  • Поиск по шаблону также может работать неожиданно для некоторых локалей, даже если сам текст и консоль в UTF-8.
  • При оцифровке печатного словаря нужно быть готовым не только к ошибкам оцифровки, но и ошибкам в самом печатном словаре. Их там может содержаться немало!
  • Если название статьи пишется заглавными, то возможно следует перевести при оцифровке в нижний регистр. Не все буквы имеют символы в верхнем регистре, собственно не для всех локалей даже есть верхний регистр.

Для формата XDXF , как уже было сказано, этот шаг не требуется. Просто запихнуть файл в папку /usr/share/goldendict , где программа подхватит его.

Для TSV файла, используется утилита stardict-editor , поставляемого с набором инструментов StarDict.

stardict-editor

На выходе программа создает следующие файлы, наподобие древнего Dict.

  1. somedict.ifo
  2. somedict.idx либо somedict.idx.gz
  3. somedict.dict либо somedict.dict.dz
  4. somedict.syn (optional)

Файлы копируются в каталог /ysr/share/stardict/dic и на этом все.

P. S. Для мобильной платформы Android программа GoldenDict внезапно стал платной, однако в интернет сети все еще можно найти последнюю бесплатную версию программы.

Читайте также: