Andrej Karpathy. Самое ясное от и до объяснение на YouTube того, чем на самом деле является LLM — претренинг, токенизация, SFT, RLHF, reasoning RL, использование инструментов, галлюцинации — на уровне детализации, нужном инженеру, чтобы рассуждать о компромиссах между моделями. Посмотрите его один раз, и решения «GPT-класса vs. модели с открытыми весами vs. reasoning-модель» из статьи перестанут казаться выбором бренда и начнут выглядеть как выбор training-рецептов.
Названия моделей, цены и возможности быстро меняются. Используйте видео для понимания принципа выбора, затем проверьте актуальное поведение модели перед внедрением.
Самое ясное от и до объяснение на YouTube того, чем на самом деле является LLM — претренинг, токенизация, SFT, RLHF, reasoning RL, использование инструментов, галлюцинации — на уровне детализации, нужном инженеру,…
Продолжайте тот же учебный путь со следующими отобранными видео-компаньонами.