Google объявила о начале использования поискового алгоритма BERT для запросов на русском языке. Компания называет его крупнейшим прорывом за последние пять лет и одним из самых грандиозных успехов за всю историю Google Поиска.
Технология предварительного обучения обработке текста на естественном языке, созданная с использованием нейронных сетей, позволяет поисковику обрабатывать не только отдельные слова, но и учитывать взаимодействие слов в предложениях, понимать контекст. Таким образом, Google Поиск станет более эффективным для длинных и разговорных запросов, а также запросов с предлогами, и будет выдавать наиболее подходящие результаты.
К примеру, прошлый поисковый алгоритм на запрос «Может ли преподаватель выгнать студента с занятия?» возвращал результаты, отвечавшие на вопрос «Имеет ли преподаватель право не пустить студента на пару?». Запросы выглядят похожими, однако смысл у них разный. Поисковый алгоритм BERT понимает контекст и наиболее точно отвечает на запрос пользователя.
В случае с запросом «Памятник строителям коммунизма у Цимлянского водохранилища» прошлый алгоритм ориентировался на ключевые слова, предлагая в качестве результата поиска страницу Цимлянской ГЭС на Википедии. Алгоритм BERT выдаст результаты, касающиеся именно монумента.