Кейс 4. Детектор «спама» в формах обратной связи (чистый PHP)

Сценарий. Форма на сайте получает сообщения. Нужно автоматически отфильтровать спам.

Почему TF–IDF. – спам содержит характерные слова – редкие, но повторяющиеся паттерны – не нужен LLM

Подход. – TF–IDF – порог по cosine similarity со «спам-шаблонами» или – Naive Bayes на частотах

Практическая польза. – защита сайтов – B2B SaaS – минимальные ресурсы

Ключевой вывод. TF–IDF отлично работает там, где важны слова, а не контекст.

Last updated