Большаков Игорь Алексеевич – доктор технических наук, профессор, независимый исследователь, Почетный профессор Национального политехнического института Мексики.
Адрес: 127055, Москва, ул. Лесная, 45.
E-mail: iabolshakov@gmail.com
За последнюю четверть века русский язык претерпел существенные изменения. Накопившиеся в обществе разговорные слова и жаргонизмы выплеснулись на страницы изданий, в рекламу, на телеэкран, в Интернет. Появилось множество новых заимствований, многие слова приобрели новый смысл. Соответственно, изменился и пополнился состав словосочетаний, используемых в русском языке. Поэтому создание словарей, отражающих допустимые и недопустимые связи между словами, стало крайне актуальным.
В работе обсуждаются вопросы разработки сетевой структуры и кросслексических принципов для словаря, по размерам и структуре не имеющего аналогов. Принципы сетевой структуры заключаются в том, что любой элемент словника всегда сопровождается своими связями. Контент кросслексического массива основан на бумажных словарях, новостях и аналитике Интернета, а также различной рекламе, журналах по персоналиям, модам, туризму и автомобилям. Тематика охватывает экономику, бизнес, социально-политическую сферу, технологии, точные, естественные и гуманитарные науки, медицину, спорт, бытовой язык.
Элементы массива (вокабулы) относятся к четырем главным частям речи: существительным, глаголам, прилагательным (вместе с причастиями) и наречиям (вместе с деепричастиями). Структура кросслексики представляет собой матрицу с ячейками, описывающими конкретные связи. Наиболее многочисленными словосочетаниями оказались «прилагательное – существительное» и «глагол – его дополнение-существительное». Наиболее многочисленными смысловыми связями, помогающими понять смысл вокабул, обладают синонимы и смысловые производные. Кросслексический массив содержит почти триста тысяч вокабул и более восьми миллионов связей между ними.
Проведенный анализ и тесты разработки свидетельствуют, что кросслексика помогает редактировать тексты и изучать русский язык. Кроме того, приложения кросслексики могут поднять на новый, более высокий уровень автоматическую обработку текстов.