Скрыть
Раскрыть

ISSN 1998-0663 (print),
ISSN 2587-8166 (online)

English version: ISSN 2587-814X (print),
ISSN 2587-8158 (online)

Большаков И. А.

Кросслексика: универсум связи между русскими словами

2013. № 3(25). С. 19–26 [содержание номера]

Большаков Игорь Алексеевич – доктор технических наук, профессор, независимый исследователь, Почетный профессор Национального политехнического института Мексики.
Адрес: 127055, Москва, ул. Лесная, 45.  
E-mail: iabolshakov@gmail.com

За последнюю четверть века русский язык претерпел существенные изменения. Накопившиеся в обществе разговорные слова и жаргонизмы выплеснулись на страницы изданий, в рекламу, на телеэкран, в Интернет. Появилось множество новых заимствований, многие слова приобрели новый смысл. Соответственно, изменился и пополнился состав словосочетаний, используемых в русском языке. Поэтому создание словарей, отражающих допустимые и недопустимые связи между словами, стало крайне актуальным.

В работе обсуждаются вопросы разработки сетевой структуры и кросслексических принципов  для словаря, по размерам и структуре не имеющего аналогов. Принципы сетевой структуры заключаются в том, что любой элемент словника всегда сопровождается своими связями. Контент кросслексического массива основан на бумажных словарях, новостях и аналитике Интернета, а также различной рекламе, журналах по персоналиям, модам, туризму и автомобилям. Тематика охватывает экономику, бизнес, социально-политическую сферу, технологии, точные, естественные и гуманитарные науки, медицину, спорт, бытовой язык.

Элементы массива (вокабулы) относятся к четырем главным частям речи: существительным, глаголам, прилагательным (вместе с причастиями) и наречиям (вместе с деепричастиями). Структура кросслексики представляет собой матрицу с ячейками, описывающими конкретные связи. Наиболее многочисленными словосочетаниями оказались «прилагательное – существительное» и «глагол – его дополнение-существительное». Наиболее многочисленными смысловыми связями, помогающими понять смысл вокабул, обладают синонимы и смысловые производные. Кросслексический массив содержит почти триста тысяч вокабул и более восьми миллионов связей между ними.

Проведенный анализ и тесты разработки свидетельствуют, что кросслексика помогает редактировать тексты и изучать русский язык. Кроме того, приложения кросслексики  могут поднять на новый, более высокий уровень автоматическую обработку текстов. 

BiBTeX
RIS
 
 
Rambler's Top100 rss