Кейс 2. Ошибка в длинной математической цепочке (error propagation)
Сценарий
Решение: автоматическая перепроверка шагов
Пример проверки выражений
<?php
function evaluateExpression(string $expr): float {
// крайне упрощённый пример!
return eval("return $expr;");
}
$llmStep = "5 * (3 + 2) = 30";
preg_match('/(.+)=\s*(\d+)/', $llmStep, $matches);
$expression = trim($matches[1]);
$claimed = (float)$matches[2];
$real = evaluateExpression($expression);
if ($real !== $claimed) {
echo "Step is incorrect. Claimed: $claimed, Real: $real";
}Инженерный вывод
PreviousКейс 1. Галлюцинация числовых фактов и обязательная верификацияNextPage 3. Base Rate Neglect в phishing-симуляциях
Last updated