TY - JOUR TI -
О возможности определения префикса и суффикса слова по подсловам фиксированной длины
T2 - Бизнес-информатика IS - Бизнес-информатика KW - pеконструкция слова KW - префикс KW - суффикс KW - мультимножество подслов KW - подслова фиксированной длины KW - оператор сдвига AB - В прикладных задачах бизнес-информатики, связанных с анализом данных (в частности, при анализе и прогнозировании временных рядов при исследовании лог-файлов бизнес-процессов) возникают задачи качественного анализа. Методы качественного анализа достаточно часто используют символьное кодирование как способ представления информации об исследуемых процессах. В ряде ситуаций, обусловленных фрагментарностью таких описаний, возникает задача реконструкции полного символьного описания процесса (слова) по его последовательным фрагментам (подсловам). По мультимножеству всех подслов достаточно большой длины исходное слово восстанавливается однозначно. В случае недостаточно длинных подслов возможно множество различных реконструкций исходного неизвестного слова. Число допустимых реконструкций можно сократить, если определить суффикс и префикс реконструируемого слова. Предложен метод определения префикса и суффикса слова над конечным алфавитом, состоящих из символов каждый, на основании мультимножества подслов фиксированной длины, равной. Принимается гипотеза о том, что это мультимножество порождено смещением на один символ окна фиксированной длины по неизвестному слову.Метод определения префикса и суффикса основан на построениии анализе матрицы, образованной записанными по строкам в произвольном порядке подсловамиз и использовании оператора, действующего на мультимножества символов алфавита, образованных соседними столбцами этой матрицы.Метод позволяет определить префикс и суффикс неизвестного слова в случае, если для любых от 1 до . В случае, если только для некоторых значений , в префиксе и суффиксе определяются символы в соответствующих позициях, а для остальных символов выполняется условие . В худшем случае метод констатирует, что для всех от 1 до , но не определяет сами символы. Это ситуация, при которой префикс и суффикс совпадают, но не могут быть определены. AU - Г. Н. Жукова AU - Ю. Г. Сметанин AU - М. В. Ульянов UR - https://bijournal.hse.ru/2020--2 Vol.14/375002082.html PY - 2020 SP - 84-92 VL -