Сценарий
Есть папка с .txt или .md файлами. Нужно искать по смыслу, а не по словам.
Что демонстрируем
– получение эмбеддингов
– косинусное сходство
– инженерный цикл «индексация → поиск»
Как запустить
Считываем все файлы
Для каждого считаем эмбеддинг
Сохраняем в JSON
При запросе считаем эмбеддинг запроса
Сортируем по similarity
Почему это хороший кейс
Минимум инфраструктуры, максимум понимания. Идеален как первый запуск.
Технически
– transformers-php
– чистый PHP
– JSON как хранилище
Last updated 9 days ago