Why AI evals are the hottest new skill for product builders | Hamel Husain & Shreya Shankar

107 минУверенныйИИ для бизнеса

Lenny's Podcast. Хамел Хусейн и Шрея Шанкар проходят весь воркфлоу evals на реальном ИИ-ассистенте по управлению недвижимостью — смотрят трассировки, открытое и осевое кодирование ошибок, решают, когда остановиться, строят LLM-as-judge и валидируют его против человеческого суждения. Это редкий длинный разговор, действительно нацеленный на продактов и тимлидов, а не на ML-инженеров, и он покрывает тот же ритм «30 минут в неделю после настройки», который рекомендует статья.

Заметка AI Expert

Концепция остаётся полезной, но проверьте примеры на актуальных инструментах перед применением в реальной работе.

Что вынести из этого видео

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

Что посмотреть или знать заранее

Полезно понимать бизнес-процессы, риски и практические сценарии применения ИИ.

Смотреть дальше

Продолжайте тот же учебный путь со следующими связанными видео.

RAG Agents in Prod: 10 Lessons We Learned — Douwe Kiela, creator of RAG

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

Смотреть дальше

RAG vs. Fine Tuning

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

Смотреть дальше

Anthropic's Claude Computer Use Is A Game Changer | YC Decoded

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

Смотреть дальше

Похожие видео

Introducing EmbeddingGemma: The Best-in-Class Open Model for On-Device Embeddings

How to Build Human-Centered AI Workflows in Localization with Shashi Bhushan

От хайпа к привычке: как технологические компании масштабируют ИИ дальше экспериментов

Private AI против cloud: как лидерам принимать более умные build-or-buy решения

Углубиться

Тщательно подобранные внешние курсы, которые глубже раскрывают эту тему.

Coursera · DeepLearning.AI

AI for Everyone

Эндрю Ын

Шесть лет спустя — самая чистая точка входа для тех, кому нужно разобраться в ИИ без программирования. Без математики, без жаргона, без хайпа — после прохождения вы сможете вести осознанные разговоры о проектах с ИИ.

Новичок в ИИ~6 часовПроверено 25 дней назад

Coursera · The Wharton School

AI Strategy and Governance

Kartik Hosanagar · Kevin Werbach · Prasanna Tambe · Lynn Wu

Сильная рамка Wharton для руководителей, принимающих решения «строить или покупать». Курс не продаёт инструменты, а фокусируется на экономике внедрения ИИ, алгоритмической предвзятости, доверии к данным и практиках управления, которые выдерживают аудит.

Эксперт~10 часовПроверено 25 дней назад

Все курсы в категории «ИИ для бизнеса»