История алгоритмов ранжирования Яндекс

История алгоритмов ранжирования поисковой системы Яндекс

Суть ранжирования заключается в обработке запросов пользователей поисковой системой, после чего происходит автоматическая сортировка результатов согласно искомой информации. На сегодня для выдачи упорядоченного рейтинга веб-страниц система Яндекс использует специальные формулы ранжирования, построенные с применением машинного обучения — MatrixNet.

Со времени появления поисковой системы Яндекс (дата запуска 23 сентября 1997 г.) алгоритмы ранжирования периодически модернизуются, а также уделяется внимание их устойчивости к внешним факторам, таким как искусственные методы оптимизации сайта с целью обмана поисковика и т.п.

Хронология алгоритмов ранжирования

За время работы Яндекс внедрил множество алгоритмов. Предлагаю ознакомиться с историей за прошедшие 11 лет. Приведу краткую таблицу, а дальше в статье остановлюсь подробнее на каждом из алгоритмов.

Новая формула ранжирования: 02.07.2007 г.

Об изменении в алгоритме ранжирования сообщил представитель Яндекса на Forum.Searchengines.ru. По отношению к запросам, состоящим из одного или нескольких слов, стали использоваться различные формулы.

Обновление алгоритма по однословным запросам: 07.08.2007 г.

Благодаря нововведениям изменились настройки самой формулы, выросла численность рассматриваемых по «однословным» запросам компонент релевантности. Анонс изменений появился также на Forum.Searchengines.ru.

«Версия 8» и «Восьмерка SP1»: 20.12.2007 г. и 17.01.2008 г.

На этот раз сайты с высоким уровнем авторитета стали обладать преимуществами в ранжировании, началось понижение веса ссылок с главных страниц. В результате вебмастерами начинают закупаться ссылки с внутренних страниц-доноров.

«Магадан» и «Магадан 2.0»: 16.05.2008 г. и 02.07.2008 г.

В 2008 году появляются алгоритмы ранжирования, которым разработчик присваивает имена и анонсирует их уже на официальном сайте Яндекса:

  • В поисковой программе «Магадан» была в 2 раза увеличена численность факторов ранжирования, добавлены классификаторы для улучшенного понимания типа веб-страниц и ссылок, смягчена фильтрация выбора документов для ранжирования, а также модернизирована технология расшифровки аббревиатур и транслитерации.
  • Алгоритм «Магадан 2.0» получил новые факторы, отслеживающие контент по уникальности, а также были внедрены классификаторы по гео и коммерческим запросам.

«Находка»: 11.09.2008 г.

Новшества коснулись учёта стоп-слов и модернизировалось машинное обучение. Произошло расширение тезауруса благодаря автоматическому исследованию подлежащей индексации «оболочки» текста. К примеру, он пополнился словосочетаниями, которые слитно и раздельно несут один смысл: по запросу [авто пром] также находятся веб-страницы с «автопром».

«Арзамас» («Анадырь»): 08.04.2009 г.

Разработчик анонсировал данный алгоритм, как «снятие омонимии». Это означает, что при ранжировании ресурсов в поисковой выдаче для запросов с неоднозначной смысловой нагрузкой применяется история запросов других пользователей (учитывается частотность слов и их словосочетаний). Анализируя такие запросы, Яндекс выбирал чаще всего встречающуюся конструкцию слов. В результате поисковая программа научилась понимать, что «день весны и труда» — это праздник, а не призыв к работе. Стали учитываться регионы пользователей, но сначала только для отдельных стран и некоторых городов. Спустя 3 месяца стало возможным привязать ресурс к региону.

  • Арзамас 1.1.: 24.06.2009 г. Усовершенствована формула ранжирования для интернет-пользователей Российской Федерации помимо Москвы, Санкт-Петербурга, Екатеринбурга.
  • Арзамас 1.2.: 20.09.2009 г. Появляется разделение поисковых запросов на зависимые и независимые по гео, что автоматически определяется поисковиком. В случаях, где регион не имеет особого значения, ранжирование происходит по качеству контента, авторитетности ресурса и другим признакам.
  • «Арзамас+16»: 31.09.2009 г. Результаты поиска локализовались – ранжирование по гео пополнилось 16-ю регионами РФ. Обновлённая поисковая программа коснулась, как я упомянул выше, геозависимых запросов на усмотрение Яндекса.
  • «Арзамас 1.5»: 23.09.2009 г. Улучшена формула ранжирования, устанавливающая рейтинг результатов выдачи независимых по гео запросов и запросов пользователей из регионов, где не применяется локализованное ранжирование.
  • «Арзамас 1.5 SP1»: 28.09.2009 г. Объединение предыдущей версии ранжирования с улучшенной формулой поиска по регионам.

«Снежинск»: 10.11.2009 г.

Стал первым алгоритмом на основе самообучающейся платформы MatrixNet. Чего удалось достичь: введены новые параметры (несколько тысяч), учитываемые в процессе ранжирования одного документа, а сама формула пополнилась поведенческими факторами, 19 городов РФ получили региональную выдачу. На этом этапе важнее стало качество ресурса в целом, а не его отдельных веб-страниц. Система Яндекс научилась различать между собой коммерческие и некоммерческие ссылки.

«Конаково» и «Снежинск 1.1»: 22 декабря 2009 г. и 17.03.2010 г.

Благодаря разработке «Конаково» локальное ранжирование распространилось на 1250 городов Российской Федерации. Следующий алгоритм — «Снежинск 1.1», который претерпел обновлений в общей формуле по гео независимым запросам. Тогда свои позиции в выдаче повысили некоммерческие ресурсы с энциклопедической информацией, обзорами и т.п.

«Обнинск»: 13.09.2010 г.

Улучшилась обработка по гео независимым запросам, появилось ограничение влияния искусственных ссылок на ранжирование. Таким образом, в поисковой выдаче свои позиции улучшили ресурсы, не имеющие привязки к определённому региону. Кроме того, повысилась эффективность выявления авторских текстов.

«Краснодар»: 15.12.2010 г.

За основу данного алгоритма была взята новая поисковая технология «Спектр». На тот момент веб-ресурсы были разделены на 60 категорий по смыслу. Возможность классифицировать запросы и выявлять в них отдельные объекты (имя человека, название книги/фильма и т.д.) помогли поисковой системе более чётко распознавать различные значения слов в запросах, соответственно, генерировать выдачу согласно потребностям пользователя. Данная технология использовала статистику запросов пользователей, информацию из энциклопедий и различных справочных материалов.

«Рейкьявик»: 08.09.2011 г.

На этот раз пользователи стали получать поисковую выдачу согласно языковым предпочтениям. Так, при написании запроса латиницей пользователь при желании мог получить выдачу на русскоязычные веб-сайты. Более того, была внедрена новая формула для запросов с опечатками: для русских пользователей результаты выдачи показывались по 2 запросам – с опечаткой и в исправленном системой варианте (не во всех случаях).

У коммерческих организаций появилась возможность размещения сведений о своей компании в Яндекс.Справочнике. Ещё был внедрён инструмент для авторов оригинальных текстов: перед публикацией уникального контента в интернете нужно было сообщить об этом разработчику, отправив заявку через Яндекс.Вебмастер.

«Калининград»: 28.12.2012 г.

Результаты поисковой выдачи стали персонализированными. Система начала предлагать интернет-пользователям ответы и подсказки согласно их интересам, используя историю запросов и поведенческих факторов на странице поисковой выдачи. К примеру, на запрос [пираты карибского моря] читающим людям поисковик предложит в первую очередь книгу, киноманам – фильм, а геймерам – одноименную игру.

В браузере и на странице поиска Яндекса стали появляться предупреждения о веб-сайтах, которые предлагают загрузку и установку вредоносного программного обеспечения.

«Дублин»: 30.05.2013 г.

Совершенствование персонализации поисковой выдачи. Теперь стали учитываться предпочтения и интересы пользователей в реальном времени – результаты выдачи подстраиваются в процессе поиска.

«Без ссылок»: 12.03.2014 г.

Положено начало отмене ссылок. На этот раз обновилась формула ссылочного ранжирования для запросов по коммерции для города Москвы по нескольким категориям, а именно недвижимость, туризм, электроника и бытовая техника.

«Острова»: 05.06.2014 г.

Обновление дизайна поисковой выдачи. Пользователь мог увидеть интерактивные ответы на странице результатов поиска, не переходя на веб-сайт. Однако этот эксперимент был признан неудачным самими разработчиками, и впоследствии был отменён.

«Объектный ответ»: 01.04.2015 г.

Страница результатов поиска претерпела нововведений: в правой части экрана появилась так называемая Яндекс.Карточка (блок), содержащая сведения о предмете поискового запроса. В Яндексе внедрена классификация и база со множеством объектов поиска.

«Многорукие бандиты Яндекса»: 14.09.2015 г.

Происходит рандомизация поисковой выдачи – в ТОПе к трастовым ресурсам подмешиваются «молодые» сайты. В результате возраст ресурса перестаёт быть ключевым фактором в поисковом продвижении.

«Владивосток»: 02.02.2016 г.

Яндекс начинает учитывать адаптацию ресурса для просмотра на мобильных устройствах. В результате нововведений более высокие позиции в мобильной выдаче присваиваются сайтам, оптимизированным для пользования с мобильных девайсов.

«Палех»: 03.11.2016 г.

Система Яндекс научилась искать не по словам в запросе, а по смыслу запроса и заголовка (Title) страницы, благодаря использованию нейронных сетей. Причём поиск соответствия между ними мог осуществляться даже в тех случаях, когда в документе нет слова или фразы из вводимого пользователем запроса. Задача данного алгоритма – качественный поиск страниц по редким запросам и словам, например, заданным в формате разговорной речи.

«Королев»: 22.08.2017 г.

Алгоритм с использованием нейронной сети для сопоставления смысла запроса и страниц сайтов. По сути, он является доработанной версией алгоритма «Палех». На этот раз в обучении искусственного интеллекта задействованы статистика поиска, ассесоры и толокеры, а также оценки самих пользователей системы. В отличие от «Палех», данный алгоритм научился подвергать анализу не только заголовок, но и всё содержимое веб-страницы.

«Андромеда»: 19.11.2018 г.

В алгоритме внедрены ряд новшеств – модернизация быстрых ответов для мгновенного решения задач пользователей, помощь при отборе источников (появление непосредственно в поиске меток «Популярный сайт», «Выбор пользователей», оценок и отзывов к фильмам, заведениям), возможность сохранения найденных страниц в Яндекс.Коллекции, которые доступны пользователям на любом устройстве, где есть Яндекс.

Понравилась статья?
Подпишитесь на рассылку, и на еженедельной основе получайте подборку интересных новостей, статей и исследований из мира интернета и маркетинга
Согласие с Политикой обработки персональных данных
Поделиться
  •  
  •  
  •  
  •  
  •  
  •