Тезаурус

Перейти к: навигация, поиск

Теза́урус (от греч. θησαυρός — сокровище), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между лексическими единицами. Тезаурусы являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

В психологии тезаурус индивидуума характеризуют восприятие и понимание информации. Теория коммуникации также рассматривает общий тезаурус сложной системы, благодаря которому взаимодействуют её элементы[1].

История

 (англ.), автор первого современного тезауруса

Одним из первых тезаурусов называют «Словарь синонимов» Филона Библского. Более точное соответствие термину имеет Амара-коша, написанный на санскрите в стихотворной форме в VI веке. Первый современный английский тезаурус был создан  (англ.) в 1805 году. Он был опубликован в 1852 году и с тех пор используется без переизданий[2].

В 1970-е годы тезаурусы стали активно использоваться для информационно-поисковых задач. В таких тезаурусах слова сопоставляются с дескрипторами, через которые устанавливаются семантические связи[1].

Тезаурусы

  • Амара-коша (Словарь Амары) — первый и наиболее важный санскритский тезаурус (III—IV век)
  • Тезаурус Роже (XIX век, около 15000 синсетов).
  • Викисловарь: многоязычный свободно пополняемый словарь и тезаурус (с 2004 года по настоящее время, проект фонда Викимедиа, в Русском Викисловаре (дата — август 2013) содержится около 390 тыс. понятий[3], 212 тыс. отношений всего[4], из них 150 тыс. отношений для русского языка[5]).
  • РуТез — тезаурус русского языка (был создан Центром информационных исследований как инструмент для автоматического индексирования; разрабатывается с 1997 года по настоящее время, 45 тыс. понятий, 107 тыс. слов и выражений, 177 тыс. отношений)[6].
  • Встроенный тезаурус в Microsoft Word[7].
  • «Писательский тезаурус» советского писателя С. Н. Есина[8].

См. также

Примечания

  1. 1 2 Тезаурус — статья из Большой советской энциклопедии
  2. Шаблон:Cite webb
  3. wikt:Участник:AKA MBG/Статистика:Размеры базы данных, созданной парсером Викисловаря, строка «meaning» в таблице.
  4. wikt:Участник:AKA MBG/Статистика:Размеры базы данных, созданной парсером Викисловаря, строка «relation» в таблице.
  5. wikt:Участник:AKA MBG/Статистика:Семантические отношения#Number of relations per language, столбец «total» в таблице.
  6. Онтологии для автоматической обработки текстов: описание понятий и лексических значений
  7. Поиск синонимов с помощью тезауруса - Word (рус.). support.office.com. Проверено 18 января 2017.
  8. Есин С. Н. Писательский тезаурус

Литература

Ссылки