Кейс 6. Сравнение: Bag of Words vs TF–IDF на одном примере

Сценарий. Берём один и тот же корпус и:\n – считаем cosine similarity на BoW – считаем cosine similarity на TF–IDF

Что видит читатель. – BoW «любит» частые слова – TF–IDF «подсвечивает смысл»

Это идеальный учебный кейс.

Ключевой вывод. TF–IDF — это не «другая модель», а умное взвешивание.

Last updated