Кейс 1. Семантический поиск по текстовым документам (без БД)

Сценарий

Есть папка с .txt или .md файлами. Нужно искать по смыслу, а не по словам.

Что демонстрируем

– получение эмбеддингов

– косинусное сходство

– инженерный цикл «индексация → поиск»

Как запустить

  1. Считываем все файлы

  2. Для каждого считаем эмбеддинг

  3. Сохраняем в JSON

  4. При запросе считаем эмбеддинг запроса

  5. Сортируем по similarity

Почему это хороший кейс

Минимум инфраструктуры, максимум понимания. Идеален как первый запуск.

Технически

– transformers-php

– чистый PHP

– JSON как хранилище

Last updated