Сценарий. Берём один и тот же корпус и:\n – считаем cosine similarity на BoW – считаем cosine similarity на TF–IDF
Что видит читатель. – BoW «любит» частые слова – TF–IDF «подсвечивает смысл»
Это идеальный учебный кейс.
Ключевой вывод. TF–IDF — это не «другая модель», а умное взвешивание.
Last updated 2 months ago