Как работает выявление реальных событий в мире посредством анализа данных интернет-трафика
2 677

Как работает выявление реальных событий в мире посредством анализа данных интернет-трафика

Большинство людей считает отключение интернета неприятным явлением. Однако исследователи из ANT Lab (анализ сетевого трафика) Университета Южной Калифорнии (USC) называют это точкой данных.


Команда исследователей сканировала интернет в поисках прерываний сети с 2014 года. Аспирант Университета USC Сяо Сон и ведущий научный сотрудник ISI Джон Хайдеманн, проанализировали собранную информацию в момент начала эпидемии COVID-19 в 2020 году.

Мы анализировали сеть в институте информационных наук (ISI), в котором мы видели четыре или пять всплесков каждую неделю, соответствующих расписанию рабочей недели. После праздника Мартина Лютера Кинга мы видели четыре всплеска за одну рабочую неделю, потому что в тот понедельник никто не пришел на работу. А затем мы увидели наступление COVID, и вдруг всплески прекратились

—Джон Хайдеманн, ведущий научный сотрудник ISI и профессор-исследователь факультета компьютерных наук школы инженерии USC.

Наблюдаемые исследователями «всплески» представляли собой подключения IP-адресов ноутбуков сотрудников ISI к внутренней сети в рабочее время. Хайдеманн и Сон подумали, что, возможно, наблюдения можно обобщить и применить ко всему интернету, чтобы понять, можно ли выявить признаки человеческой активности на основе данных об использовании интернета.

Количество чувствительных к изменению областей. Набор Данные за 1 месяц 2020 года.


Результатом работы исследователей стала статья «Выявление изменений в повседневной человеческой активности с помощью наблюдений за интернетом», в которой демонстрировалось изменение в человеческой активности при переходе к удаленной работе.

Влияние чрезвычайных происшествий на активность в интернете


Мы искали значительные изменения человеческого поведения в интернете и сравнивали полученные даты аномальной активности с новостями в том же месте. Например, в конце марта 2020 года использование сети резко снизилось в Маниле. Хронология новостей подтвердила, что изменение, которое мы видели, коррелировало с карантином, начавшимся 15 марта 2020 года

— Сяо Сон, аспирант Университета USC.

Используя свой метод, команда обнаружила изменения активности в Китае в конце января 2020 года. Изменения совпали с двумя событиями: карантином в Ухане из-за COVID и национальным праздником, во время которого большинство людей остается дома. Поскольку карантин в Ухане и Весенний фестиваль происходили одновременно, нельзя было приписать изменения в сети одному конкретному событию.
Также исследователи зафиксировали изменения активности в сети в течение нескольких дней в Индии как в феврале, так и в марте 2020 года. Февральская активность коррелировала с беспорядками в Индии, связанными с протестами против иммиграционного закона, а мартовская соответствовала первому карантину в Индии и началу локдауна из-за COVID.

Два описанных выше исследования показывают, что изменения в человеческом поведении, приводящие к использованию домашнего IP-адреса, могут иметь разные причины, но их воздействие на интернет схоже.

Новый источник информации


Способность обнаруживать подобные тенденции предоставляет нам новую возможность понимания нашего мира, дополняя другие источники общественной информации.

Нашей первой мотивацией было простое любопытство — можем ли мы увидеть человеческую активность путем анализа использования интернета? В контексте COVID мы могли бы исследовать вопросы, такие как: какие страны объявляют о карантине или локдауне? Когда они объявляются? Если объявлен локдаун, то не нарушается ли он? Я надеюсь, что наше исследование поможет предоставить анонимное и независимое наблюдение за тем, что происходит, и это может повлиять на решения в области общественного здравоохранения

—Джон Хайдеманн.
Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

Рекомендуем для вас