Масштабная утечка кода Яндекса раскрывает факторы ранжирования российской поисковой системы
Почти 45 ГБ файлов с исходным кодом, предположительно украденных бывшим сотрудником, раскрыли основы многих приложений и сервисов российского технологического гиганта «Яндекс». Он также раскрыл ключевые факторы ранжирования для поисковой системы Яндекса, которые почти никогда не раскрываются публично.
Git-исходники Яндекса были опубликованы в виде торрент-файла 25 января и показывают файлы, якобы снятые в июле 2022 года и относящиеся к февралю 2022 года. Инженер-программист Арсений Шестаков утверждает, что при совместной проверке с нынешними и бывшими сотрудниками Яндекса он убедился, что некоторые архивы содержат современный исходный код для сервисов компании. Яндекс сообщил блогу безопасности BleepingComputer, что Яндекс не был взломан и утечка произошла от бывшего сотрудника. «Яндекс» заявил, что не видит угрозы для пользовательских данных или производительности платформы.
В частности, файлы датируются февралем 2022 года, когда Россия начала СВО на Украине. Бывший руководитель Яндекса сказал BleepingComputer, что утечка была «политически мотивирована», и отметил, что бывший сотрудник не пытался продать код конкурентам Яндекса. Код защиты от спама также не просочился.
Хотя неясно, связаны ли раскрытие исходного кода Яндекса с безопасностью или структурными последствиями, утечка 1922 факторов ранжирования в алгоритме поиска Яндекса, безусловно, наделала много шума. Консультант по SEO Мартин Макдональд описал взлом в Твиттере как «вероятно, самое интересное, что произошло в SEO за последние годы». В ветке, подробно описывающей некоторые из наиболее заметных факторов, исследователь Алекс Буракс предполагает, что в обнародованных данных есть много полезной информации и для SEO отдела Google.
Как подробно рассказал Buraks движок Яндекса отдает предпочтение страницам, которые:
Существует возможность выполнить более подробный поиск по всем параметрам ранжирования в скомпилированном поисковом инструменте Роба Осби. Можно заметить, что почти 1000 факторов имеют тег «TG_DEPRECATED», а более 200 указаны как «TG_UNUSED». Поскольку код датирован февралем 2022 года и был получен в июле 2022 года, с тех пор поиск Яндекса, безусловно, изменился. Но утечка дает редкий взгляд на то, как составляются поисковые рейтинги на сайте, который обслуживает одну из крупнейших стран мира.
Ранее код поисковой системы Яндекса появлялся в 2015 году, когда бывший сотрудник попытался продать его на черном рынке за 28 000 долларов, чтобы профинансировать свой собственный стартап. Удивительно низкая цифра для основного кода главного продукта Яндекса свидетельствовала о том, что мошенник не знал о его реальной ценности. Сотрудник тогда был приговорен к двум годам лишения свободы условно, а упомянутый файл с кодом так никогда и не был опубликован.
Git-исходники Яндекса были опубликованы в виде торрент-файла 25 января и показывают файлы, якобы снятые в июле 2022 года и относящиеся к февралю 2022 года. Инженер-программист Арсений Шестаков утверждает, что при совместной проверке с нынешними и бывшими сотрудниками Яндекса он убедился, что некоторые архивы содержат современный исходный код для сервисов компании. Яндекс сообщил блогу безопасности BleepingComputer, что Яндекс не был взломан и утечка произошла от бывшего сотрудника. «Яндекс» заявил, что не видит угрозы для пользовательских данных или производительности платформы.
В частности, файлы датируются февралем 2022 года, когда Россия начала СВО на Украине. Бывший руководитель Яндекса сказал BleepingComputer, что утечка была «политически мотивирована», и отметил, что бывший сотрудник не пытался продать код конкурентам Яндекса. Код защиты от спама также не просочился.
Хотя неясно, связаны ли раскрытие исходного кода Яндекса с безопасностью или структурными последствиями, утечка 1922 факторов ранжирования в алгоритме поиска Яндекса, безусловно, наделала много шума. Консультант по SEO Мартин Макдональд описал взлом в Твиттере как «вероятно, самое интересное, что произошло в SEO за последние годы». В ветке, подробно описывающей некоторые из наиболее заметных факторов, исследователь Алекс Буракс предполагает, что в обнародованных данных есть много полезной информации и для SEO отдела Google.
Как подробно рассказал Buraks движок Яндекса отдает предпочтение страницам, которые:
- Не слишком старые
- Имеют много пользовательского (состоящего из уникальных посетителей) и меньше поискового трафика
- В URL имеют меньше цифр и косых черт
- Размещаются на надежных серверах
- Являются страницами Википедии или на них ссылается Википедия
- Размещены или связаны со страницами более высокого уровня в домене
- Имеют ключевые слова в своем URL (до трех)
Существует возможность выполнить более подробный поиск по всем параметрам ранжирования в скомпилированном поисковом инструменте Роба Осби. Можно заметить, что почти 1000 факторов имеют тег «TG_DEPRECATED», а более 200 указаны как «TG_UNUSED». Поскольку код датирован февралем 2022 года и был получен в июле 2022 года, с тех пор поиск Яндекса, безусловно, изменился. Но утечка дает редкий взгляд на то, как составляются поисковые рейтинги на сайте, который обслуживает одну из крупнейших стран мира.
Ранее код поисковой системы Яндекса появлялся в 2015 году, когда бывший сотрудник попытался продать его на черном рынке за 28 000 долларов, чтобы профинансировать свой собственный стартап. Удивительно низкая цифра для основного кода главного продукта Яндекса свидетельствовала о том, что мошенник не знал о его реальной ценности. Сотрудник тогда был приговорен к двум годам лишения свободы условно, а упомянутый файл с кодом так никогда и не был опубликован.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Росархив рассекретил документы: Доказано, что именно Польша не дала СССР остановить Вторую мировую войну
Об этом в 1939 году сообщали из Варшавы французские дипломаты и разведчики...
Удивительные и невероятные приключения первой советской ракеты класса «воздух-воздух»
Военные историки говорят: без якутских мастеров советские конструкторы не смогли бы «взломать» американскую ракету и построить нашу Р-3...
Гробовщик Британии: как Япония похоронила империю, «где никогда не заходит солнце»
Историки говорят: Британская корона получила такой мощный удар, что рассыпалась как карточный домик...
Как рождаются волны-убийцы: российские ученые вплотную приблизились к разгадке этого опасного морского феномена
Правда, для этого пришлось «отменить» действующие модели прогнозов, которые, как оказалось, не работали...
Тесла снова меняет правила игры: генератор по проекту гения выжимает электричество из воздуха
Эксперты говорят, что мы только сейчас доросли до великого изобретателя. Из 300 его открытий реализованы лишь десятки. Что еще может скрываться в архивах?...
Снова плохая новость для Илона Маска: выяснилось, что атмосфера Марса сама производит яд
Готово ли человечество не просто прилететь на Красную планету, а жить в ядовитой пыли и вести бесконечную борьбу за выживание?...
Как построили Великую пирамиду: американский ученый нашел неожиданный и простой до гениальности способ
Теория оказалась настолько логичной, что смогла объяснить многие аномалии пирамиды Хеопса, над которыми столетиями ломали головы ученые...
225,8 миллиарда долларов: Америка требует от России оплатить колоссальный долг царского времени
Почему ведущие эксперты называют этот иск ящиком Пандоры и предупреждают, что он может закончиться для Штатов и всего Запада огромными проблемами?...
Почему компонент сыра, который используется уже 30 лет, вызвал внезапную панику у американцев?
Эксперты рассказали: используется ли это вещество в России и стоит ли нам волноваться...
Импланты в голове превратили жизнь китайских пациентов в кошмар наяву
Участник эксперимента рассказал: «Когда нейрочип отключили, я упал на пол. Жить без импланта было просто невыносимо. Я умолял врача включить чип снова. И тогда...
Легендарный египтолог рассказал, что сейчас шансы найти гробницу самой известной древней царицы высоки как никогда
Почему Захи Хавасс так уверен, что сумеет совершить величайшее открытие в долине Нила?...
Очень зимняя история: Как 289 лет назад появилась первая точная карта России
Почему генплан Российского получилось создать лишь… на льду замершего Финского залива? И причем здесь шпионский скандал?...