Масштабная утечка кода Яндекса раскрывает факторы ранжирования российской поисковой системы
Почти 45 ГБ файлов с исходным кодом, предположительно украденных бывшим сотрудником, раскрыли основы многих приложений и сервисов российского технологического гиганта «Яндекс». Он также раскрыл ключевые факторы ранжирования для поисковой системы Яндекса, которые почти никогда не раскрываются публично.
Git-исходники Яндекса были опубликованы в виде торрент-файла 25 января и показывают файлы, якобы снятые в июле 2022 года и относящиеся к февралю 2022 года. Инженер-программист Арсений Шестаков утверждает, что при совместной проверке с нынешними и бывшими сотрудниками Яндекса он убедился, что некоторые архивы содержат современный исходный код для сервисов компании. Яндекс сообщил блогу безопасности BleepingComputer, что Яндекс не был взломан и утечка произошла от бывшего сотрудника. «Яндекс» заявил, что не видит угрозы для пользовательских данных или производительности платформы.
В частности, файлы датируются февралем 2022 года, когда Россия начала СВО на Украине. Бывший руководитель Яндекса сказал BleepingComputer, что утечка была «политически мотивирована», и отметил, что бывший сотрудник не пытался продать код конкурентам Яндекса. Код защиты от спама также не просочился.
Хотя неясно, связаны ли раскрытие исходного кода Яндекса с безопасностью или структурными последствиями, утечка 1922 факторов ранжирования в алгоритме поиска Яндекса, безусловно, наделала много шума. Консультант по SEO Мартин Макдональд описал взлом в Твиттере как «вероятно, самое интересное, что произошло в SEO за последние годы». В ветке, подробно описывающей некоторые из наиболее заметных факторов, исследователь Алекс Буракс предполагает, что в обнародованных данных есть много полезной информации и для SEO отдела Google.
Как подробно рассказал Buraks движок Яндекса отдает предпочтение страницам, которые:
Существует возможность выполнить более подробный поиск по всем параметрам ранжирования в скомпилированном поисковом инструменте Роба Осби. Можно заметить, что почти 1000 факторов имеют тег «TG_DEPRECATED», а более 200 указаны как «TG_UNUSED». Поскольку код датирован февралем 2022 года и был получен в июле 2022 года, с тех пор поиск Яндекса, безусловно, изменился. Но утечка дает редкий взгляд на то, как составляются поисковые рейтинги на сайте, который обслуживает одну из крупнейших стран мира.
Ранее код поисковой системы Яндекса появлялся в 2015 году, когда бывший сотрудник попытался продать его на черном рынке за 28 000 долларов, чтобы профинансировать свой собственный стартап. Удивительно низкая цифра для основного кода главного продукта Яндекса свидетельствовала о том, что мошенник не знал о его реальной ценности. Сотрудник тогда был приговорен к двум годам лишения свободы условно, а упомянутый файл с кодом так никогда и не был опубликован.
Git-исходники Яндекса были опубликованы в виде торрент-файла 25 января и показывают файлы, якобы снятые в июле 2022 года и относящиеся к февралю 2022 года. Инженер-программист Арсений Шестаков утверждает, что при совместной проверке с нынешними и бывшими сотрудниками Яндекса он убедился, что некоторые архивы содержат современный исходный код для сервисов компании. Яндекс сообщил блогу безопасности BleepingComputer, что Яндекс не был взломан и утечка произошла от бывшего сотрудника. «Яндекс» заявил, что не видит угрозы для пользовательских данных или производительности платформы.
В частности, файлы датируются февралем 2022 года, когда Россия начала СВО на Украине. Бывший руководитель Яндекса сказал BleepingComputer, что утечка была «политически мотивирована», и отметил, что бывший сотрудник не пытался продать код конкурентам Яндекса. Код защиты от спама также не просочился.
Хотя неясно, связаны ли раскрытие исходного кода Яндекса с безопасностью или структурными последствиями, утечка 1922 факторов ранжирования в алгоритме поиска Яндекса, безусловно, наделала много шума. Консультант по SEO Мартин Макдональд описал взлом в Твиттере как «вероятно, самое интересное, что произошло в SEO за последние годы». В ветке, подробно описывающей некоторые из наиболее заметных факторов, исследователь Алекс Буракс предполагает, что в обнародованных данных есть много полезной информации и для SEO отдела Google.
Как подробно рассказал Buraks движок Яндекса отдает предпочтение страницам, которые:
- Не слишком старые
- Имеют много пользовательского (состоящего из уникальных посетителей) и меньше поискового трафика
- В URL имеют меньше цифр и косых черт
- Размещаются на надежных серверах
- Являются страницами Википедии или на них ссылается Википедия
- Размещены или связаны со страницами более высокого уровня в домене
- Имеют ключевые слова в своем URL (до трех)
Существует возможность выполнить более подробный поиск по всем параметрам ранжирования в скомпилированном поисковом инструменте Роба Осби. Можно заметить, что почти 1000 факторов имеют тег «TG_DEPRECATED», а более 200 указаны как «TG_UNUSED». Поскольку код датирован февралем 2022 года и был получен в июле 2022 года, с тех пор поиск Яндекса, безусловно, изменился. Но утечка дает редкий взгляд на то, как составляются поисковые рейтинги на сайте, который обслуживает одну из крупнейших стран мира.
Ранее код поисковой системы Яндекса появлялся в 2015 году, когда бывший сотрудник попытался продать его на черном рынке за 28 000 долларов, чтобы профинансировать свой собственный стартап. Удивительно низкая цифра для основного кода главного продукта Яндекса свидетельствовала о том, что мошенник не знал о его реальной ценности. Сотрудник тогда был приговорен к двум годам лишения свободы условно, а упомянутый файл с кодом так никогда и не был опубликован.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Еще одна теория заговора оказалась чистой правдой: «химтрейлы» были подтверждены документально
Оказалось, что правительство США десятилетием секретно распыляет в атмосфере вещества, влияющие на погоду и здоровье миллионов...
Жители китайской деревни 20 лет подряд ели… самого большого динозавра в Азии
Ученые говорят: это был самый громкий и безумный случай в истории палеонтологии...
Вскрылся неожиданный парадокс: поддержка Украины... значительно укрепила русский язык в Прибалтике
Ученые Псковского университета объяснили этот демографический и лингвистический феномен. Все оказалось более чем интересно...
Просто отличная новость для России: арктическая «метановая бомба» может не взорваться!
Оказалось, у природы есть мощные механизмы для обезвреживания этого заряда...
Второе «Эльдорадо» за два года: китайские геологи снова нашли самую большую золотую жилу в истории
Ученые рассказали, почему Китаю так везет на этот благородный металл...
Случайное открытие российских ученых привело к прорывной технологии
Химики из Тольяттинского университета превратили автомобильный фреон… в ключ к новым лекарствам. И не только...
Совершенно случайно выяснилось: волки гораздо умнее, чем считали зоологи
Оказалось, что хищники могут… пользоваться инструментами. А это уже совсем другой уровень интеллекта...
Венера — снова «русская планета»: суперзонд из Новосибирска сможет выжить в этом аду целых 100 дней!
Астрофизики уверены: российская идея с «вечным» запасом гелия открывает новую эру в исследовании соседней планеты...
Разбитый череп из форта Ла-Лома раскрыл тайны древнеримского тотального террора
Испанские археологи говорят: «Это была не столько жестокость, сколько продуманная и проверенная стратегия»...
Последние исследования показывают: все люди… телепаты от рождения
Ну а мозг — это беспроводной передатчик. Почему же ученые так решили?...
Это была жестокая эпоха каннибалов: зачем неандертальцы охотились на женщин и детей?
Сенсационная находка в пещере Гойе заставляет ученых отказаться от мифа о миролюбивых аборигенах Европы...
Водолазы исследовали озеро в Польше и случайно наткнулись на жуткое древнее лицо
И несмотря на то, что рот языческой личины закрыт, этот артефакт может рассказать очень многое. В том числе забытые факты русской истории...
Наступает эпоха великих переездов: вот и Иран объявил о переносе столицы
Рассказываем, какие еще столицы могут переехать в ближайшее время и почему...
Оказывается, ученые искали жизнь вообще не там: Теперь «космические» лучи меняют правила
Новое исследование говорит: даже у далеких от звезд «мертвых» планет есть большие шансы на обитаемость...
Археологи в недоумении: Женщина эпохи викингов была похоронена с ракушками во рту
Почему уникальное захоронение заставляет ученых взглянуть по-новому на погребальные обряды скандинавов?...