Биологи долго подозревали, что муравьи основывают свои оценки плотности населения на частоте, с которой они – буквально – врезаются в других муравьев, беспорядочно исследуя их среду.Та теория получает новую поддержку со стороны теоретического доклада, который исследователи из Лаборатории Информатики и Искусственного интеллекта MIT сделают на Симпозиуме Ассоциации вычислительной техники по Принципам Распределенной Вычислительной конференции позже в этом месяце. Бумага показывает, что наблюдения от случайного исследования окружающей среды сходятся очень быстро на точной оценке плотности населения. Действительно, они сходятся почти так быстро, как теоретически возможно.
Вне предложения поддержки гипотез биологов эта теоретическая структура также относится к анализу социальных сетей, коллективного принятия решения среди роев робота, и коммуникации в одноранговых сетях, таких как сети недорогих датчиков, рассеянных в запрещении окружающей среды.«Это интуитивно, что, если группа людей беспорядочно идет вокруг области, количество раз, они врезаются друг в друга, будет суррогат плотности населения», говорит Кэмерон Маско, аспирант MIT в электротехнике и информатике и соавторе на новой бумаге. «Что мы делаем, дает строгий анализ позади той интуиции, и также говорит, что оценка – очень хорошая оценка, а не некоторая грубая оценка. Как функция времени, это становится более точным, и это идет почти с такой скоростью, как Вы ожидали бы, что могли когда-либо делать».Случайные прогулки
Musco и его соавторы – его советник, профессор NEC Науки программного обеспечения и Техническая Нэнси Линч, и Хсинь-Хао Су, postdoc в группе Линча – характеризуют среду муравья как сетку с некоторым числом других муравьев, рассеянных беспорядочно через него. Муравей интереса – называет его, исследователь – начинает в некоторой клетке сетки и, с равной вероятностью, двигается в одну из смежных клеток. Затем с равной вероятностью это двигается в одну из клеток, смежных с той и так далее.
В статистике это упоминается как «случайная прогулка». Исследователь считает число других муравьев, населяющих каждую клетку, которую оно посещает.В их статье исследователи сравнивают случайную прогулку со случайной выборкой, в которой клетки отобраны из сетки наугад и числа посчитанных муравьев. Точность обоих подходов улучшается с каждым дополнительным образцом, но замечательно, случайная прогулка сходится на истинной плотности населения фактически так быстро, как случайная выборка делает.
Это важно, потому что во многих практических случаях, случайная выборка не выбор. Предположим, например, что Вы хотите написать, что в алгоритме, чтобы проанализировать социальную сеть онлайн – говорится, чтобы оценить то, что часть сети самоописывает как республиканца. Нет никакого общедоступного списка участников сети; единственный способ исследовать его состоит в том, чтобы выбрать отдельного участника и начать прослеживать связи.Точно так же в одноранговых сетях, данное устройство знает только местоположения устройств в его непосредственной близости; это не знает расположение сети в целом.
Алгоритм, который использует случайные прогулки для совокупной информации от многократных устройств, было бы намного легче осуществить, чем тот, который должен характеризовать сеть в целом.Повторите столкновения
Результат исследователей удивителен, потому что в каждом шаге случайной прогулки у исследователя есть значительная вероятность возвращения к клетке, что это уже посетило. У оценки, полученной из случайных прогулок таким образом, есть намного более высокий шанс сверхвыборки конкретных клеток, чем один на основе случайной выборки делает.
Первоначально, Маско говорит, он и его коллеги предположили, что это было ответственностью, которую должен будет преодолеть алгоритм для оценки плотности населения. Но их попытки отфильтровать сверхвыбранные данные, казалось, ухудшили работу их алгоритма, а не улучшили его. В конечном счете, сможение объяснить, почему, теоретически.«Если Вы беспорядочно идете вокруг сетки, Вы не собираетесь врезаться во всех, потому что Вы не собираетесь пересекать целую сетку», говорит Маско. «Таким образом, есть кто-то на противоположной стороне сетки, что у меня есть в значительной степени нулевой шанс процента врезания.
Но в то время как я врежусь в тех парней меньше, я врежусь в местных парней больше. Я должен посчитать все свои взаимодействия с местными парнями, чтобы восполнить то, что есть эти далекие парни, в которых я никогда не собираюсь врезаться.
Это вид отлично балансирует. Действительно легко доказать, что, но это не очень интуитивно, таким образом, это взяло нас некоторое время, чтобы понять это».Обобщения
Сетка, что исследователи раньше моделировали среду муравьев, является просто специальным случаем структуры данных, названной графом. Граф состоит из узлов, как правило представленных кругами и краями, как правило представленными как линейные сегменты, соединяющие узлы. В сетке каждая клетка – узел, и это делит края только с теми клетками, немедленно смежными с ним.Аналитические методы исследователей, однако, относятся к любому графу, такому как одно описание, какие члены социальной сети связаны, или какие устройства в одноранговой сети в коммуникационном диапазоне друг друга.
Если граф очень хорошо не связан – если, например, это – просто цепь узлов, каждый связанный только с этими двумя узлами, смежными с ним – тогда сверхвыборка может стать проблемой. В цепи, скажем, 100 узлов исследователь, совершающий случайную прогулку, мог застрять, пересекая те же самые пять или шесть узлов много раз.
Но целых две случайных прогулки, начинающиеся с того же самого узла, вероятно, расширятся в различных направлениях, как это часто бывает в графах, описывающих коммуникационные сети, случайные прогулки остаются фактически столь же хорошими как случайная выборка.Кроме того, в новой газете, исследователи анализируют случайные прогулки, выполненные единственным исследователем.
Объединение наблюдений от многих исследователей сходилось бы на точной оценке более быстро. «Если бы они были роботами вместо муравьев, они могли бы получить прибыль, говоря друг с другом и высказыванием, ‘О, это – моя оценка’», говорит Маско.
