Кейс 1. Фильтр спама: вероятность ≠ решение (RubixML)
Сценарий
Модель классифицирует письма как спам или не спам и возвращает вероятность. Решение о том, что делать с письмом, принимается отдельно.
Модель и данные
use Rubix\ML\Classifiers\LogisticRegression;
use Rubix\ML\Datasets\Labeled;
$samples = [
[3, 1], // короткая тема, мало ссылок
[15, 8], // длинная тема, много ссылок
[5, 0],
];
$labels = ['normal', 'spam', 'normal'];
$dataset = new Labeled($samples, $labels);
$model = new LogisticRegression();
$model->train($dataset);Предсказание вероятности
Решение
Вывод
Модель оценивает уверенность. Порог – это инженерное решение, зависящее от цены ошибки.
Last updated