«Яндекс» внедрил новую нейросетевую архитектуру для ранжирования веб-страниц

«Яндекс» сообщил о внедрении новой нейросетевой архитектуры для ранжирования веб-страниц. Компания поделилась новостью в рамках конференции YaC 2020.

Новая технология помогает поиску «Яндекса» давать более эффективную оценку смысловой связи между запросами пользователей и содержимым документов в интернете.

Алгоритмы «Палех» и «Королев» оказали менее значимое влияние на поиск, чем новая технология на трансформерах. В поиске рассчитываются тысячи факторов. Даже если отключить их все, оставив новую модель, качество ранжирования по основной оффлайн-метрике снизится только на 4-5%, — подчеркнули представители «Яндекса».

Новая технология анализирования текстового контента названа YATI. Она применяет нейронные сети нового поколения — трансформеры. Это общее название известной нейросетевой архитектуры, положенной в основе современных подходов к анализу текста.

«Яндекс» создал свою модель трансформеров. Ее аббревиатура расшифровывается как Yet Another Transformer with Improvements — еще один трансформер с улучшениями.

YATI работает с короткими (запросы, заголовки статей) и длинными текстами. Она оснащена «механизмом внимания», позволяющим выбирать из текста наиболее важные фрагменты. YATI учитывает порядок слов и контекст (влияние слов друг на друга).

Источник: Searchengines

Понравилась статья?
Подпишитесь на рассылку, и на еженедельной основе получайте подборку интересных новостей, статей и исследований из мира интернета и маркетинга
Согласие с Политикой обработки персональных данных
Поделиться