«Яндекс» внедрил новую нейросетевую архитектуру для ранжирования веб-страниц
«Яндекс» сообщил о внедрении новой нейросетевой архитектуры для ранжирования веб-страниц. Компания поделилась новостью в рамках конференции YaC 2020.
Новая технология помогает поиску «Яндекса» давать более эффективную оценку смысловой связи между запросами пользователей и содержимым документов в интернете.
Алгоритмы «Палех» и «Королев» оказали менее значимое влияние на поиск, чем новая технология на трансформерах. В поиске рассчитываются тысячи факторов. Даже если отключить их все, оставив новую модель, качество ранжирования по основной оффлайн-метрике снизится только на 4-5%, — подчеркнули представители «Яндекса».
Новая технология анализирования текстового контента названа YATI. Она применяет нейронные сети нового поколения — трансформеры. Это общее название известной нейросетевой архитектуры, положенной в основе современных подходов к анализу текста.
«Яндекс» создал свою модель трансформеров. Ее аббревиатура расшифровывается как Yet Another Transformer with Improvements — еще один трансформер с улучшениями.
YATI работает с короткими (запросы, заголовки статей) и длинными текстами. Она оснащена «механизмом внимания», позволяющим выбирать из текста наиболее важные фрагменты. YATI учитывает порядок слов и контекст (влияние слов друг на друга).
Источник: Searchengines