Агентные системы и multi-step reasoning в PHP
LLM как управляемая система: планирование, инструменты и контроль.
Когда разработчики впервые сталкиваются с LLM, они обычно воспринимают модель как "умный автокомплит". Мы задаём вопрос – модель генерирует ответ. Однако такой способ использования раскрывает лишь небольшую часть потенциала современных моделей.
На практике наиболее мощные системы строятся иначе. LLM используется не как финальный источник ответа, а как компонент внутри управляемой системы, где:
модель планирует действия
система вызывает инструменты
промежуточные результаты проверяются
процесс повторяется до достижения цели
Такой подход называется агентной архитектурой.
В этой главе мы разберём:
что такое агентные системы
что такое multi-step reasoning
как устроено планирование действий
как подключать инструменты
как контролировать выполнение
Ну а затем мы реализуем это на PHP.
Почему одного запроса к LLM недостаточно
Представим задачу.
Пользователь спрашивает:
"Сколько будет средняя зарплата PHP-разработчика в Германии, если учитывать последние данные?"
Чтобы ответить на этот вопрос, система должна:
Найти свежие данные по зарплатам
Отфильтровать по PHP
Посчитать среднее
Сформировать ответ
LLM не имеет доступа к интернету и вычислениям, если её специально этому не научить.
Поэтому система должна выполнить цепочку действий:
Так работает агентная система.
Что такое агент
Агент – это система, которая может:
понимать цель
планировать действия
использовать инструменты
оценивать результат
повторять процесс
Формально можно представить агента как функцию:
где
st – состояние системы
at – действие
π – стратегия агента
После действия состояние меняется:
LLM выступает в роли политики принятия решений.
Multi-step reasoning
Большинство сложных задач нельзя решить за один шаг.
Они требуют последовательного рассуждения. Рассмотрим следующий пример.
Запрос:
"Какая компания дороже – Apple или Microsoft?"
Шаги:
Получить капитализацию Apple
Получить капитализацию Microsoft
Сравнить
Формально процесс рассуждения (reasoning) можно представить как последовательность состояний:
где каждое состояние зависит от предыдущего.
Внутренний цикл агента

Архитектура агентной системы
Типичная архитектура выглядит так:
Компоненты:
1. Планировщик (Planner)
LLM решает:
что делать дальше
какой инструмент использовать
2. Инструменты (Tools)
Функции системы:
поиск
API
базы данных
вычисления
3. Память (Memory)
Контекст предыдущих шагов.
4. Контроллер
Логика цикла выполнения.
5. Инструменты
Инструмент – это функция, которую агент может вызвать.
Примеры:
Формально инструмент:
Память агента
Для multi-step reasoning нужна память.
Простейшая память – список сообщений.
PHP реализация
Планирование нескольких шагов
Агент может выполнять несколько действий.
Пример:
Цикл агента

Контроль и безопасность
Без контроля агент может:
зациклиться
вызвать опасный инструмент
генерировать мусор
Поэтому система должна иметь ограничения.
Ограничение шагов
Ограничение инструментов
Белый список:
Валидация аргументов
Evaluator – критик агента
В более сложных системах есть критик.
Он проверяет:
правильность шага
достижение цели
Формально:
где V – функция оценки.
LLM может выступать и в роли критика.
Self-Reflection
Современные агентные системы используют саморефлексию.
Модель анализирует собственные ошибки.
Почему агентные системы – это будущее LLM
Большинство современных AI-систем уже используют агентную архитектуру.
Причины:
LLM плохо считает
LLM не имеет данных
LLM делает ошибки
Агентная архитектура решает это:
инструменты делают вычисления
базы дают данные
контроллер следит за процессом
В итоге LLM становится оркестратором интеллекта, а не источником истины.
Итог
LLM сама по себе – это генератор текста.
Но внутри агентной архитектуры она превращается в универсальный планировщик действий.
Агентная система включает:
планирование
инструменты
память
контроль
оценку
Такая архитектура позволяет решать сложные задачи через multi-step reasoning, объединяя сильные стороны LLM и традиционного программирования.
Для PHP-разработчиков это особенно важно: большая часть логики агента реализуется обычным кодом, а LLM используется только там, где нужна гибкость и семантическое понимание.
Именно поэтому современная разработка AI-систем всё чаще выглядит не как вызов модели, а как проектирование управляемой интеллектуальной системы.
Last updated