Кейс 6. Сравнение: Bag of Words vs TF–IDF на одном примере

Сценарий. Берём один и тот же корпус и:\n – считаем cosine similarity на BoW – считаем cosine similarity на TF–IDF

Что видит читатель. – BoW «любит» частые слова – TF–IDF «подсвечивает смысл»

Это идеальный учебный кейс.