Кейс 5. Классификация без обучения (zero-shot через similarity)

Сценарий

Нужно классифицировать тексты по заранее заданным категориям, не обучая модель.

Идея

Категории тоже переводим в эмбеддинги.

Пример категорий

– «финансы»

– «политика»

– «технологии»

– «религия»

Как работает

  1. Считаем эмбеддинги категорий (один раз)

  2. Для текста считаем эмбеддинг

  3. Ищем ближайшую категорию

Почему это важно

Показывает, что эмбеддинги заменяют классические классификаторы в простых задачах.

Last updated