Кейс 1. Фильтр спама: вероятность ≠ решение (RubixML)

Сценарий

Модель классифицирует письма как спам или не спам и возвращает вероятность. Решение о том, что делать с письмом, принимается отдельно.

Модель и данные

use Rubix\ML\Classifiers\LogisticRegression;
use Rubix\ML\Datasets\Labeled;

$samples = [
    [3, 1],  // короткая тема, мало ссылок
    [15, 8], // длинная тема, много ссылок
    [5, 0],
];

$labels = ['normal', 'spam', 'normal'];

$dataset = new Labeled($samples, $labels);

$model = new LogisticRegression();
$model->train($dataset);

Предсказание вероятности

Решение

Вывод

Модель оценивает уверенность. Порог – это инженерное решение, зависящее от цены ошибки.

Last updated