Как сделать тезаурус реферата

Обновлено: 05.07.2024

В настоящее время в связи с возрастанием объема документальной информации, необходимой для принятия эффективного управленческого решения, и возможностями, предоставляемыми новыми компьютерными технологиями, автоматизированные информационно-поисковые системы стали широко использоваться в различных сферах экономики.

Организация быстрого и эффективного поиска документальной информации становится все более неразрешимой проблемой.

Цель документального поиска - нахождение и выдача соответствующих запросу пользователя документов или их описаний.

Традиционно информационно-поисковые системы (ИПС) применяются для тематического поиска научно-технической информации в крупных библиотеках, научно-технических центрах, архивах, патентных библиотеках.

Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.

При автоматизации поиска документальной информации важнейшей является задача формализации содержания документа и запроса. При этом поиск происходит по всему тексту документа или по его поисковому образу, а в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации. Именно на этой технологии основано действие информационно-поискового тезауруса (ИПТ). Цель моей работы – дать необходимые определения, определить цели разработки ИПТ, его структуру и построение, а также значение и перспективы развития.

1. И нформационно-поисковые системы

Автоматизированный документальный поиск может быть организован на основе различных технологий: поиска по поисковому образу документа, поиска по полному тексту документа, поиска документов по гипертекстовым ссылкам.

Технология полнотекстового поиска является неотъемлемой составляющей таких современных и перспективных информационных технологий, как: системы управления документами (Documentmanagementsystem, DMS), технологии групповой работы над документами (groupware), технологии поиска в Internet/intranet. На технологии гипертекста базируется самый известный сервис InternetWorldWideWeb (WWW).

Информационно-поисковая система для управленческих документов, как правило, требует раз­работки собственного информационно-поискового языка, адекватного данной предметной области.

В документальных информационно-поисковых системах поиск документа происходит по краткому формализованному описанию его содержания - так называемому поисковому образу документа.

Важнейшей структурной составляющей является информационно-поисковый язык.

Информационно-поисковый язык, ИПЯ (indexinglanguage, retrievallanguage) - искусственный язык для выражения содержания документов или запросов с целью последующего поиска.

Основное назначение ИПЯ - установить принадлежность того или иного документа к определенной группе понятий.

Перевод текстов документов и запросов на ИПЯ называется индексированием.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса - в поисковое предписание.

Индексирование может быть ручным (когда его производит человек) или автоматическим.

Для общения человека с компьютером разрабатываются специальные искусственные языки, естественный язык (ЕЯ) в этом качестве пока не может быть использован без специального предварительного преобразования. В естественном языке присутствуют: синонимия, омонимия и полисемия, избыточность, субъективность и другие свойства, препятствующие его автоматизированной обработке.

Синонимы - слова, различающиеся по написанию, но совпадающие по смыслу (Россия, РФ, Российская Федерация).

Омонимы - слова, совпадающие по звуковому и графическому составу, но имеющие разные значения (ключ может быть - телеграфный, поисковый, к замку, к шкафу и т.д.).

Полисемия - наличие у одного и того же слова нескольких разных, но связанных между собой значений (например: фамилия - как имя и фамилия - как семья).

Искусственный язык, как правило, разрабатывается на основе ЕЯ. При этом устраняется многозначность слов ЕЯ.

Слова любого языка в процессе отображения предметов реального мира вступают между собой в определенные отношения. Эти отношения можно разделить на парадигматические и синтагматические.

Парадигматические отношения - логические отношения, существующие между лексическими единицами ИПЯ независимо от контекста, в котором эти лексические единицы употребляются. Эти отношения обусловлены предметно-логическими, а не языковыми факторами, т.е. относятся к категории внеязыковых связей. Примеры парадигматических отношений: часть - целое (отдел - организация); род - вид (ценная бумага - акция); причина - следствие; функциональное сходство; ассоциации. Учет парадигматических отношений необходим для правильного выбора и точного употребления слов.

Наиболее часто в качестве основания деления при классификации ИПЯ используют способ организации понятий. По способу организации понятий различают: предкоординируемые (классификационные) ИПЯ; посткоординируемые (дескрипторные) ИПЯ.

Дескрипторные языки семантически более сильны, чем классификационные, но более сложны для формальной обработки.

Дескриптор - ключевое слово или словосочетание, служащее именем класса эквивалентных ключевых слов (синонимов). Как правило, в качестве дескриптора выбирают одно, наиболее употребляемое ключевое слово из класса синонимичных ключевых слов.

Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса.

2. Информационно-поисковый тезаурус: определение, цель разработки

Тезаурус – термин, широко используемый в информатике как составная часть информационно-поисковых систем.

Можно выделить два определения информационно-поискового тезауруса:

1. Информационно-поисковый тезаурус представляет собой словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка (дескрипторами) и предназначенный для поиска слов по их смысловому содержанию.

2. Информационно-поисковый тезаурус (ИПТ) – контролируемый словарь терминов предметной области, создаваемый для улучшения качества информационного поиска в данной предметной области.

И в том, и в другом случае речь идет о словаре, который призван облегчить поиск необходимой информации.

Возможно два способа расположения слов в словарях: по близости их буквенного состава и по смысловой близости.

По первому способу создаются алфавитные словари. По второму способу - тезаурусы. Алфавитные словари служат для раскрытия значения данного слова. Тезаурусы служат для поиска слов для выражения данного понятия. Т.е., если в обычном словаре по слову ищется его смысл, то в тезаурусе по заданному смыслу ищутся слова, которые этот смысл выражают.

Цели разработки ИПТ:

- перевод языка авторов на контролируемый язык, используемый для индексации и поиска;

- обеспечение последовательности в присваивании индексных терминов;

- обозначение отношений между терминами;

- облегчение информационного поиска.

3. Использование информационно-поисковых тезаурусов

Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.

Информационно-поисковые тезаурусы используются при индексировании документов и запросов.

Различают безтезаурусное индексирование и индексирование с тезаурусным контролем лексики.

При безтезаурусном индексировании поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа. Такое индексирование требует меньше времени и менее трудоемко. Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения.

При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска.

Таким образом, информационно-поисковые тезаурусы используются для:

- перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;

- отображения парадигматических связей между дескрипторами.

4. Структура информационно-поискового тезауруса

Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними.

Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя.

Введение содержит общие характеристики тезауруса - область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию.

Алфавитный указатель включает алфавитный перечень дескрипторных статей.

Дескрипторная статья может иметь следующую структуру:

- ключевые слова из класса эквивалентности;

- дескрипторы, подчиняющие заглавный;

- дескрипторы, подчиненные заглавному;

- дескрипторы, ассоциированные с заглавным.

Ассоциации могут быть следующих видов: причина - следствие; сырье - продукт; процесс - объект; процесс - субъект; свойство - носитель свойства; функциональное сходство и др.

Систематический указатель служит для раскрытия, учета и контроля парадигматических отношений между дескрипторами. Для каждого дескриптора ИПЯ должны быть найдены соответствующие родовые и видовые дескрипторы. Причем предварительно необходимо сформулировать критерии, определяющие число уровней иерархии. Определение степени отображения парадигматических отношений зависит от требований, предъявляемых к системе. Чем шире эти отношения отображены, тем выше полнота выдачи, но одновременно происходит увеличение словарного запаса, усложняется система ссылок и может произойти уменьшение точности поиска.

5. Построение информационно-поисковых тезаурусов

Построение тезауруса состоит из нескольких взаимосвязанных этапов.

Первый этап - формирование словника. Словник - первоначальные множества ключевых слов. При этом рассматривается представительный массив наиболее информативных для данной предметной области документов. Например: реферативные журналы, словари, учебники, справочники, нормативные документы и т.д. Выбираются слова, употребляемые в этих источниках, при этом устанавливается частота употребления слов и учитываются все формы, которые могут иметь слова.

Второй этап - формирование множества ключевых слов. Из словника формируется множество ключевых слов. При отборе ключевых слов учитывается информативность слова, которая определяется исходя из частоты встречаемости слова, роли слова в данной предметной области. Процесс выбора ключевых слов достаточно сложно формализовать. Например, такой критерий, как частота встречаемости не может быть абсолютным. Если слово встречается в текстах очень часто, это может означать, что оно выражает чрезмерно широкое понятие, либо недостаточно четко определено, т.е. неинформативно. Если ключевое слово встречается очень редко, это может означать, что оно выражает новое понятие и таким образом является информативным.

Третий этап - формирование классов эквивалентности. Выделение дескрипторов.

Класс эквивалентности - это группа терминов, равнозначных по смыслу в пределах сферы действия данной системы. Одно из слов класса эквивалентности объявляется дескриптором (как правило, наиболее употребляемое). Все слова, включенные в класс эквивалентности, объявляются условными синонимами (условными - так как они равнозначны в пределах данной предметной области, а в ЕЯ эти слова могут не являться синонимами).

В процессе построения тезауруса и выделения множества дескрипторов происходит устранение синонимии, омонимии, полисемии ключевых слов, а также выявление парадигматических связей между дескрипторами.

В ЕЯ многие слова могут быть правильно истолкованы только с учетом контекста. В ИПЯ для правильной трактовки ключевых слов необходимы средства для исключения многозначности трактования слов.

Для устранения многозначности (омонимии и полисемии) ключевое слово, которое можно неоднозначно трактовать, снабжается пометой, в которой указывается в каком значении данное ключевое слово используется в ИПЯ.

Разработка тезауруса без использования компьютерных технологий - достаточно длительный и трудоемкий процесс.

Документы Частота слова в документе
1 2 3 4 5 6 7
D1 D2 D3 D4

Автоматические информационно-поисковые тезаурусы являются составным элементом систем автоматического индексирования документов и запросов. В словарной статье автоматического тезауруса, как правило, зафиксированы отношения условной эквивалентности (синонимии), отношение подчинения и ассоциативные отношения.

6. Сфера применения и перспективы развития информационно-поисковых тезаурусов

В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.

Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие:

1. Получение справки по используемому слову. Указав слово, в качестве ключа для запроса, пользователь в ответ получает соответствующий фрагмент словаря, содержащий лингвистическую информацию о данном слове. Например, автоматический тезаурус получает от пользователя некоторое существительное и в ответ выдает совокупность устойчиво сочетающихся с ним глаголов или все наиболее часто сопровождающие его определения. При этом автоматически выполняется процедура нормализации входного слова (т.е. приведение существительного к именительному падежу).

2. Контекстные замены по требованию пользователей. В данном случае тезаурус не только подбирает вместо одного словосочетания другое, которое пользователь счел более соответствующим контексту по смысловым или стилистическим соображениям, но и автоматически переоформляет параметры слов (например, род прилагательного) в соответствии с контекстом. Это означает, что синтаксические операции, производимые тезаурусом, существенно усложняются.

3. Автоматическая оценка стиля. Если слова и словосочетания в тезаурусе снабдить стилистическими пометками, то он может использоваться для стилистической оценки текста с выделением слов и словосочетаний, выпадающих, из общего стиля документа.

В условиях конкурентной борьбы, необходимости постоянного повышения качества работы органа управления и всего предприятия в целом на руководителя обрушивается мощный поток информации, прежде всего документальной, и у него возникают проблемы с ее переработкой. Необходимы специальные методы информационной обработки документов, организации быстрого и эффективного поиска документальной информации. Именно информационно-поисковые тезаурусы служат решению этой проблемы.

Считаю, что в моей работе достаточно подробно и логично изложены способы использования и построения информационно-поискового тезауруса, а также сфера его применения и перспективы развития.

1. Ивасенко А.Г. Информационные технологии в экономике и управлении: учебное пособие / А.Г.Ивасенко, А.Ю.Гридасов, В.А.Павленко.- 2-е изд., стер.- М.: КНОРУС, 2007.- 160с.

2. Информатика для юристов и экономистов / Симонович С.В. и др.- СПб.: Питер, 2001.- 688с.: ил.

3. Информатика: Базовый курс/С.В.Симонович и др.- СПб.: Питер, 2002.- 640с.: ил.

4. Михеева Е.В. Информационные технологии в профессиональной деятельности: учебное пособие.- М.: ТК ВЕЛБИ, Изд-во Проспект, 2007.- 448с.

Часто у студентов возникают проблемы с написанием реферата, особенно это касается внешнего вида работы. Принимаясь за форматирование текста, надо изучить правила оформления и образцы.

Как делать реферат, образец для студента

Реферат – это небольшое исследование, которое подтверждает те или иные знания студента. Первое, с чем придется столкнуться учащемуся – структурный план будущего проекта. Озаглавить разделы и подразделы следует согласно теме реферата. Если тема касается анализа финансового состояния организации, то и названия глав должны быть связаны с данным разделом экономики. Вместе с титульным листом, содержанием и списком литературы максимальный объем текста составляет до 20 листов. Поэтому необходимо определить, сколько страниц будет занимать каждая часть реферата:

Введение – 1 стр.

1 глава – 5-7 стр.

2 глава – 5-7 стр.

Заключение – 1 стр.

Набирая текст на компьютере, исходный материал перепечатывается своими словами. Преподавателю необходимо понять, что студент не просто поработал с источниками, но смог сформировать и свою точку зрения. Помимо грамотного внутреннего содержания, реферат должен быть качественно оформлен.

Реферат по истории.

Реферат по биологии.

Реферат по экономике.

Структура реферата на примере готовых работ

Даже придерживаясь рекомендаций методических пособий и государственных стандартов не всегда получается правильно написать реферат. Намного легче делать задание, когда перед глазами есть хороший пример, ведь у каждой части учебного проекта есть свои определенные правила написания и нормы оформления.



Образец титульного листа

Образец титульного листа реферата поможет более подробно изучить его визуальную составляющую.



Как оформляется вторая страница реферата

Левое поле – 3 см.

Правое поле – 1,5 см.

Верхнее и нижнее поля – 2 см.

В случае, когда составление оглавления дается с трудом, всегда можно воспользоваться шаблонами и образцами .

СОДЕРЖАНИЕ
ВВЕДЕНИЕ . 3
1 ГЛАВА. ЭКСТРЕМАЛЬНАЯ ЖУРНАЛИСТИКА. ОСОБЕННОСТИ И СПЕЦИФИКА . 4
1.1. Появление и становление экстремальной журналистики как профессиональной деятельности . 4
1.2. Правовые и этические аспекты работы журналиста в зоне экстремальных ситуаций . 8

2 ГЛАВА. УЧАСТИЕ РОССИЙСКИХ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ В ВОЕННЫХ КОНФЛИКТАХ КОНЦА XX ВЕКА . 11
2.1. История и становление экстремальной журналистики в России . 11
ЗАКЛЮЧЕНИЕ . 14
СПИСОК ЛИТЕРАТУРЫ . 15

Как писать введение

Введение – это краткое изложение всего проекта, с обоснованием актуальности темы и целей исследования. Данная часть работы должна уместиться на одном листе. Чаще всего во введении используются шаблонные фразы. Написать введение можно по следующему плану:

Несколько слов о теме реферата.

Рассказать об актуальности поставленной проблемы.

Определить объект исследования.

Выделить несколько задач, используя слова: исследовать, изучить, рассмотреть.

Рассказать о методологической составляющей работы, описать источники.

Рассказать о структуре работы: сколько глав, объем, количество таблиц и рисунков.



Пример основной части

Проверить правильность разметки.

Выставить шрифт Time New Roman, кегль – 14, с полуторным интервалом.

Заголовки выровнять по центру, основной текст – по ширине листа.

Пример, как делается оформления основной части исследования, можно увидеть в образце.

ГЛАВА 1. ОСНОВНЫЕ ОРГАНИЗАЦИОННО-ПРАВОВЫЕ ФОРМЫ ПРЕДПРИЯТИЯ В РОССИЙСКОЙ ФЕДЕРАЦИИ И ИХ ЗАКОНОДАТЕЛЬНОЕ ОБОСНОВАНИЕ
1.1 Основные организационно-правовые формы предприятия, регистрируемые на территории Российской Федерации

Организационно-правовая форма предприятия – это понятие, которое позволяет определить финансово-экономическую и хозяйственную направленность организации. Вместе с тем это помогает определить отраслевую принадлежность и предприятия.

1.2 Законодательные предпосылки для регистрации предприятия, последствия их нарушения

Все действия граждан нашей страны регулируются конституционным правом. Для создания и ведения бизнеса также существуют определенные законодательные нормы. Данные акты прописаны в Гражданском Кодексе, Кодексе об административных правонарушениях, Федеральном Законе и Уголовном Кодексе Российской Федерации.

ГЛАВА 2. ОСОБЕННОСТИ ВЫБОРА ОРГАНИЗАЦИОННО-ПРАВОВОЙ ФОРМЫ ПРЕДПРИЯТИЯ, В ЗАВИСИМОСТИ ОТ УСЛОВИЙ ВЕДЕНИЯ БИЗНЕСА
2.1. Сравнительная характеристика организационно-правовых форм, их преимущества и недостатки

Для того чтобы наиболее полно раскрыть тематическую составляющую нашего реферата, мы разобрали и сравнили следующие, самые распространенные организационно-правовые формы предприятия:

  • Индивидуальное предпринимательство (ИП).
  • Общество с ограниченной ответственностью (ООО).
  • Акционерное общество (АО).
  • Некоммерческая организация (НКО).

2.2. Основные критерии выбора организационно-правовой формы предприятия на этапе его создания

Выбор той или иной организационно-правовой формы предприятия является важным этапом на пути к ведению прибыльного бизнеса. Первый критерий – это соответствие уровню ответственности. Предприниматель должен отвечать за последствия своей деятельности: ИП – собственным имуществом, ООО – размерами уставного капитала.

Образец заключения



Как оформить список литературы

Каждый источник, который студент использовал в ходе написания реферата, надо отражать в списке литературы. Все нюансы составления библиографии прописаны в ГОСТ 7.1-2003. Важно использовать только актуальные и новые источники, не старше 5 лет на начало написания реферата. Располагать источники необходимо по фамилии авторов в алфавитном порядке, используя арабскую нумерации. Самое оптимальное количество источников – это 10 учебников, монографий, статей и законодательных актов вместе взятых.



Образцы с оформлением готового реферата по ГОСТу

Оформление реферата регламентируется не только методическими рекомендациями учебного заведения, но и требованиями государственных стандартов . При формировании внешнего вида исследования необходимо пользоваться следующими нормами:

Для того, чтобы понять как полностью выглядит структура реферата, сформированная по ГОСТу, ниже представлен образец.

Реферат на книгу, образец

В студенческой практике встречаются ситуации, когда преподаватель дает задание написать реферат по книге. Это аннотация произведения или небольшой доклад. Для данного проекта необходимо прочитать то, о чем студент собирается писать. Дополнительно можно использовать статьи известных критиков, отзывы читателей и авторефераты. Реферировать книгу необходимо в соответствии с последовательностью глав, анализируя процессы и явления, происходящие в произведении.

Все использованные материалы необходимо занести в список литературы, включая интернет-порталы. В зависимости от размера книги и ее жанрового направления, можно разделить текст реферата на несколько логических блоков – подразделов. Написание подобной работы может быть произведено в более свободной форме, нежели стандартный учебный реферат . Не всегда для аннотаций требуется наличие титульного листа. В самом начале текста необходимо указать автора работы, название книги, информацию об издании, год выпуска и количество листов. Завершить реферат следует небольшими выводами или полноценным заключением, а также библиографическим списком. Материал формируется в соответствии со стандартами:

Размер шрифта – 14 кегель.

Цвет текста – черный.

Выравнивание должно быть по ширине листа, заголовки по центру.

Стиль шрифта – Times New Roman.

Интервал между строк – полуторный.

Жирный шрифт используется для выделения заголовков и структурных элементов реферата, возможно написание заголовков заглавными буквами.

Абзацный отступ – 1,25 см.

Размеры полей: левое – 30 мм, правое – 15 мм, верхнее и нижнее – 20 мм.

Главное, в такой работе, чаще высказывать собственное мнение и использовать, в качестве подкрепления точки зрения, цитаты автора произведения. Более наглядно образец оформления реферата на книгу представлено ниже.

Часто задаваемые вопросы

Вопрос. Сколько должно быть разделов в реферате?

Ответ. Обязательными разделами реферата являются: введение, название главы, заключение, список литературы. Сколько будет глав зависит от темы и объема работы. В каждой главе могут быть еще и параграфы.

Вопрос. Что написать в резюме в конце реферата,если преподаватель требует писать его без учета содержания реферата а просто написать об опыте его написания?

Ответ. Преподаватель хочет, чтобы Вы подытожили и сказали, как далось написание работы, с какими трудностями пришлось столкнуться при написании, а какие моменты, наоборот, писались легко.

Что такое тезаурус? В статье рассмотрим общий термин и поговорим о тезаурусе в Ворде. На практике воспользуемся тезаурусом в программе Word. Эта информация может вам пригодится при написании текстов или в процессе замены слов.

Что такое тезаурус, для чего он нужен

Что такое тезаурус

Здравствуйте, друзья! Что такое тезаурус? Это информационный вид словаря или по-другому словарь синонимов. Он хранит в себе различные слова, которые можно использовать для того или иного слова в тексте. То есть, подбирает для слов похожие синонимы или антонимы – противоположные слову.

Для чего нужен тезаурус? Как правило, он нужен для поиска похожих слов и замены старых словосочетаний. Рассмотрим простой пример необходимости использования тезауруса. К примеру, копирайтер написал текст, а он выглядит не уникальным. Чтобы повысить уникальность, можно подобрать слова синонимы для текста. В этом случае, как раз помогает тезаурус.

Вы просто используете набор слов готового словаря и заменяете в тексте слова на другие. Главное подобрать то слово, из-за которого не потеряется смысл текста.

Что такое тезаурус в программе Ворд

Тезаурус в программе Ворд – это словарь синонимов. Данный инструмент встроен в программу. В поздних версиях программы Ворд 2007, 2010, 2013 и так далее, эта функция работает без сбоев.

Так выглядит тезаурус в программе Word (скрин 1).

что такое тезаурус в word

При нажатии данного инструмента, вы увидите список слов, которые будут доступны в справочном материале.

Как пользоваться тезаурусом в Ворде

Рассмотрим инструкцию, с помощью которой вы научитесь пользоваться тезаурусом в Ворде:

Рассмотренную выше инструкцию мы разберем ниже на практике.

Как пользоваться тезаурусом из интерфейсного меню

как пользоваться тезаурусом

Справа в программе будет открыт справочник, откуда вы можете выбрать словосочетание (скрин 3).

тезаурус

Как пользоваться тезаурусом из контекстного меню

Как пользоваться тезаурусом в Ворде

Заключение

В данной статье рассмотрели, что такое тезаурус и как им пользоваться. Применив готовый словарь к своему тексту, вы сможете его улучшить, разбавить новыми словами или повысить уникальность. Измененный текст можно публиковать на ресурсах в Интернете или отправлять работы заказчикам.

4. Порядок разработки, экспертизы, регистрации и ведения ИПТ.

1. ГОСТ 7.74 – 96. Информационно-поисковые языки. Термины и определения [Текст]. – Введ. 1997-07-01. – Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 1997. – 34 с. (Система стандартов по информации библиотечному и издательскому делу) ТК 191.

2. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления [Текст]. – Взамен ГОСТ 7.25-80; Введ. 2002-07-01. – М.: ИПК Изд-во стандартов, 2001. – 16 с. МТК 191.

4. Баранов, О. С. Идеографический словарь русского языка [Текст] / О. С. Баранов. – М.:Издательство ЭТС, 1995. – 820 c

5. Жмайло, С. В. К вопросу об определении тезауруса [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. – 2003. – №12. – С.20 – 25.

6. Жмайло, С. В. К разработке современных информационно-поисковых тезаурусов [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. –2004. – №1. – С.23 – 31.

7. Пробст, М. А. Тезаурус и информационный поиск [Текст] / М. А. Пробст // НТИ. Сер. 2. Информационные процессы и системы – 1979. – №9. – С. 14 – 20.

1. Тезаурус как способ систематизированного представления знаний и разновидность идеографического словаря

Тезаурус (от греч. Thesauros – клад, сокровище, сокровищница) – многозначное слово, имеющее, как минимум, два значения:

2) тезаурус как материально существующий объект – словарь. Тезаурус – это словарь особого типа или идеографический словарь, в котором слова располагаются не по алфавиту, а по степени смысловой близости. Лексика языка представлена в них в виде систематизированных групп слов, в той или иной степени близких в смысловом отношении (синонимы, гиперонимы, гипонимы, антонимы, паронимы и др.). Тезаурус представляет собой упорядоченную совокупность лексических единиц, в которой в явном виде с помощью специальных помет отражены смысловые отношения (синонимические, родовидовые и ассоциативные) между лексическими единицами. Иными словами, упорядочение лексики в тезаурусе осуществляется не по алфавитному или другому формальному признаку, а по смысловому (семантическому).

Из истории тезаурусов

Следует подчеркнуть, что первые тезаурусы составлялись без всякой связи с особенностями информационной деятельности, они были органически связаны с фундаментальными проблемами познания, отображая представление о мире в целом и закономерностях его постижения средствами естественного языка. В дальнейшем, при проникновении идей тезауруса в автоматизированные ИПС, тезаурус стал рассматриваться как словарь для построения поисковых образов документов и запросов, качество которых существенно влияло на качество поиска информации.

2. Информационно-поисковые тезаурусы: сущность и назначение

Среди тезаурусов, понимаемых как идеографические словари, в особую группу выделяются информационно-поисковые тезаурусы (ИПТ), появление и развитие которых связано с автоматизацией информационного поиска в середине ХХ в.

Следует подчеркнуть, что на практике, в инструктивно-методической литературе существует большая путаница в понятийном аппарате. Тезаурусом подчас называют любую классификацию, любой рубрикатор или даже список. Тем не менее, следует отличать ИПТ от словарей синонимов, антонимов и ассоциативных; от компьютерных словарных списков взаиморасположения терминов в документах, которые часто в литературе называют автоматизированными тезаурусами; от списков предметных заголовков и ключевых слов, если в них не выражены семантические отношения между терминами.

ИПТ – это структурированный словарь для контроля лексики, в котором явно и системно определяются основные семантические отношения (эквивалентности, иерархические и ассоциативные) между терминами естественного языка. В соответствии с ГОСТ 7.25-2001 ИПТ ориентированы, прежде всего, на использование в рамках автоматизированных информацион­ных систем и сетей научно-технической информации.

Появление ИПТ неразрывно связано с развитием автоматизированных информационных систем (АИС). Первоначально целью создания ИПТ являлось повышение показателей качества поиска информации в АИС. В соответствии с этой целью назначение ИПТ заключалось в следующем:

1. Обеспечивать индексирование документов и запросов средствами дескрипторного языка путем замены ключевых слов соответствующими дескрипторами, а также осуществлять избыточное индексирование документов и/или информационных запросов за счет использования вышестоящих, нижестоящих и ассоциативных понятий;

2. Отражать парадигматические отношения, существующие между лексическими единицами какой-либо отрасли науки или техники.

3. Служить средством контроля и нормализации лексики конкретной отрасли знания, обеспечивать единое и формализованное представление информации в ИПС.

Кроме того, ИПТ использовались и используются при традиционном (ручном) информационном поиске как средство терминологического контроля, позволяющее на основе эксплицитного представления парадигматических отношений между дескрипторами сужать или расширять область поиска, уточнять информационные запросы пользователей, осуществлять корректировку поисковых предписаний.

3. Структура ИПТ

1) вводная часть;

2) основная часть (лексико-семантический указатель);

3)дополнительные части (систематический, пермутационный, иерархический и другие указатели и списки специальных категорий лексических единиц).

Обязательными составными частями являются вводная часть и лексико-семантический указатель.

Допускается в состав ИПТ вводить приложения, содержащие допол­нительные сведения о разработке и использовании ИПТ.

Вводная часть включает титульный лист и введение.

На титульном листе должны быть приведены:

- наименование организации-разработчика и дополнительные сведения об авторстве ИПТ;

- сведения о переиздании;

- место и год создания или издания ИПТ.

- цель создания и область применения тезауруса, описанные кодами

и наименованиями рубрик Межгосударственного рубрикатора НТИ;

- ссылки на источники, использованные для сбора лексики ИПТ;

- ссылки на нормативные и методические документы, использован­ные при составлении ИПТ;

- описание порядка составления тезауруса, включая обоснование

представительности использованных источников лексики;

- описание состава и структуры;

- перечень отношений между лексическими единицами и методические основания для их установления;

- перечень всех символов и специальных сокращений, допущенных

- порядок алфавитного расположения (расположение букв разных

алфавитов, небуквенных символов и др.);

- количественные характеристики тезауруса (общее число статей, число дескрипторов, аскрипторов и др.);

- описание состава и формы представления дополнительных данных в словарных статьях;

Введение к последующим изданиям (версиям) ИПТ дополнительно должно содержать:

- обоснование необходимости составления новой версии тезауруса;

- указание на характер внесенных изменений.

Лексико-семантический указатель – это упорядоченная последовательностью словарных статей ИПТ, сформированная я путем расположения их в алфавитном порядке заглавных лексических единиц. Представляет собой алфавитный перечень всех дескрипторов и аскрипторов с их словарными статьями.

Приведем фрагмент лексико-семантического указателя из ИПТ по швейной промышленности:

Читайте также: