@ARTICLE{26583204_181126048_2016, author = {А. А. Пономаренко and Ю. А. Мальков and А. А. Логвинов and В. В. Крылов}, keywords = {, поиск ближайшего соседа, метрическое пространство, распределенные вычисления, Интернет-технология и приложения, структура данныхалгоритм}, title = {

Оверлейная сеть для распределенного точного и интервального поиска в одномерном пространстве

}, journal = {Бизнес-информатика}, year = {2016}, number = {1(35)}, pages = {26-36}, url = {https://bijournal.hse.ru/2016--1(35)/181126048.html}, publisher = {}, abstract = {Пономаренко Александр Александрович - научный сотрудник, Лаборатория алгоритмов и технологий анализа сетевых структур Национальный исследовательский университет «Высшая школа экономики»    Адрес: Российская Федерация, 603093, г. Нижний Новгород, ул. Родионова, 136E-mail: aponomarenko@hse.ruМальков Юрий Андреевич - младший научный сотрудник, Институт прикладной физики, Российская академия наук  Адрес: Российская Федерация, 603950, г. Нижний Новгород, ул. Ульянова, 46E-mail: yurymalkov@mail.ruЛогвинов Андрей Александрович - руководитель проектов, ООО «МераЛабс»Адрес: Российская Федерация, 603093, г. Нижний Новгород, ул. Родионова, 192E-mail: alogvinov@meralabs.comКрылов Владимир Владимирович - доктор технических наук, профессор, заведующий лабораторией больших данных, Нижегородский государственный технический университет им. Р.Е.АлексееваАдрес: Российская Федерация, 603950, г. Нижний Новгород, ул. Минина, 24E-mail: vkrylov@heterarchica.com      Для современной компьютерной системы возможность масштабироваться является необходимым бизнес-требованием. Распределенные системы явно демонстрируют это свойство, как и способность легко обрабатывать сверхбольшие объемы данных. Многие системы с распределенной архитектурой имеют в основе распределенную хэш-таблицу (distributed hash table, DHT), которая используется в качестве дополнительной логической сети, объединяющей множество распределенных серверов. Эта логическая сеть используется для поиска узлов и распределения задач между ними. Главное преимущество такого подхода - отсутствие какого-либо центрального элемента или узла, который обладал бы информацией о структуре всей сети. Поиск узлов в сети происходит путем передачи поискового сообщения от одного узла к другому. Несмотря на то, что каждый узел «знает» только небольшое число других узлов, сеть организованна таким образом, что процедура поиска затрагивает логарифмическое число узлов.      Существует несколько реализаций концепции DHT, которые регламентируют, каким образом логическая сеть строится и поддерживается. В этой работе мы демонстрируем, как такая сеть может быть сконструирована очень простым способом, с применением (с небольшими изменениями) недавно опубликованного алгоритма метризованного тесного мира (Metrized Small World) для случая одномерного метрического пространства. В работе мы приводим теоретический анализ для случая равномерного распределения данных и эмпирический анализ для других распределений. Главным преимуществом предложенного алгоритма перед аналогами является его устойчивость к различным распределениям данных и отсутствие необходимости поддержания распределения длин ссылок, определенного явным образом.      Также в работе описывается, каким образом можно полностью отделить физическое размещение данных от поисковой функциональности. Это разделение важно, например, для построения глобальных хранилищ данных, данными которых владеют несколько сторон, причем каждая сторона заинтересована в том, чтобы иметь полный контроль над физическим размещением и доступу к своим данным. В отличие от DHT, добавление новых данных не требует их перемещение на другие узлы. }, annote = {Пономаренко Александр Александрович - научный сотрудник, Лаборатория алгоритмов и технологий анализа сетевых структур Национальный исследовательский университет «Высшая школа экономики»    Адрес: Российская Федерация, 603093, г. Нижний Новгород, ул. Родионова, 136E-mail: aponomarenko@hse.ruМальков Юрий Андреевич - младший научный сотрудник, Институт прикладной физики, Российская академия наук  Адрес: Российская Федерация, 603950, г. Нижний Новгород, ул. Ульянова, 46E-mail: yurymalkov@mail.ruЛогвинов Андрей Александрович - руководитель проектов, ООО «МераЛабс»Адрес: Российская Федерация, 603093, г. Нижний Новгород, ул. Родионова, 192E-mail: alogvinov@meralabs.comКрылов Владимир Владимирович - доктор технических наук, профессор, заведующий лабораторией больших данных, Нижегородский государственный технический университет им. Р.Е.АлексееваАдрес: Российская Федерация, 603950, г. Нижний Новгород, ул. Минина, 24E-mail: vkrylov@heterarchica.com      Для современной компьютерной системы возможность масштабироваться является необходимым бизнес-требованием. Распределенные системы явно демонстрируют это свойство, как и способность легко обрабатывать сверхбольшие объемы данных. Многие системы с распределенной архитектурой имеют в основе распределенную хэш-таблицу (distributed hash table, DHT), которая используется в качестве дополнительной логической сети, объединяющей множество распределенных серверов. Эта логическая сеть используется для поиска узлов и распределения задач между ними. Главное преимущество такого подхода - отсутствие какого-либо центрального элемента или узла, который обладал бы информацией о структуре всей сети. Поиск узлов в сети происходит путем передачи поискового сообщения от одного узла к другому. Несмотря на то, что каждый узел «знает» только небольшое число других узлов, сеть организованна таким образом, что процедура поиска затрагивает логарифмическое число узлов.      Существует несколько реализаций концепции DHT, которые регламентируют, каким образом логическая сеть строится и поддерживается. В этой работе мы демонстрируем, как такая сеть может быть сконструирована очень простым способом, с применением (с небольшими изменениями) недавно опубликованного алгоритма метризованного тесного мира (Metrized Small World) для случая одномерного метрического пространства. В работе мы приводим теоретический анализ для случая равномерного распределения данных и эмпирический анализ для других распределений. Главным преимуществом предложенного алгоритма перед аналогами является его устойчивость к различным распределениям данных и отсутствие необходимости поддержания распределения длин ссылок, определенного явным образом.      Также в работе описывается, каким образом можно полностью отделить физическое размещение данных от поисковой функциональности. Это разделение важно, например, для построения глобальных хранилищ данных, данными которых владеют несколько сторон, причем каждая сторона заинтересована в том, чтобы иметь полный контроль над физическим размещением и доступу к своим данным. В отличие от DHT, добавление новых данных не требует их перемещение на другие узлы. } }