Сценарий. Форма на сайте получает сообщения. Нужно автоматически отфильтровать спам.
Почему TF–IDF. – спам содержит характерные слова – редкие, но повторяющиеся паттерны – не нужен LLM
Подход. – TF–IDF – порог по cosine similarity со «спам-шаблонами» или – Naive Bayes на частотах
Практическая польза. – защита сайтов – B2B SaaS – минимальные ресурсы
Ключевой вывод. TF–IDF отлично работает там, где важны слова, а не контекст.
Last updated 15 days ago