Продвинутый демонстрационный кейс:
embedding слой
single-head attention
linear classifier
Для tiny-датасета типа:
spam / not spam
Это можно реализовать без GPU, чисто математически.
Это будет:
идеальный образовательный мост между теорией и LLM.
Last updated 1 month ago