Отобранная библиотека

Видео

Смотрите самые понятные связанные видео, не просматривая всю библиотеку сразу. Выберите учебный путь, продолжите начатое или используйте фильтры, если уже знаете, что ищете.

157 результатов
4 мин

Introducing EmbeddingGemma: The Best-in-Class Open Model for On-Device Embeddings

Google for Developers. Видео представляет многоязычные текстовые векторные представления, которые могут работать локально и поддерживать семантический поиск и RAG без отправки каждого документа во внешний API. Для эстонских компаний это полезное техническое дополнение к паттерну внутреннего поиска знаний из статьи: многоязычный поиск полезен только тогда, когда он также учитывает расположение данных, права доступа и авторитетность источников.

Понять, почему многоязычные модели векторных представлений важны для приватного внутреннего поиска и где локальное извлечение может снизить риск раскрытия данных.

УверенныйИИ для бизнеса
32 мин

How to Build Human-Centered AI Workflows in Localization with Shashi Bhushan

Crowdin. Shashi Bhushan начинает с картирования процесса, а не с выбора инструмента, затем разбирает качество исходного текста, человеческую проверку, ИИ-корректуру, проверки глоссария, участие продуктовой команды, пилоты и ограничения приватности. Это почти тот же операционный подход, который статья рекомендует эстонским командам, работающим с эстонским, английским, русским, финским и клиентской терминологией.

Научиться вводить ИИ в локализацию так, чтобы человек сохранял ответственность за смысл, тон, терминологию и финальное утверждение.

УверенныйИИ для бизнеса
18 мин

AWS re:Invent 2025 - Implementing Human-in-the-Loop Controls for Multi-Agent AI Systems (CNS428)

AWS Events. Этот короткий доклад называет бизнес-моменты, где нужен человеческий контроль: решения с высоким риском, необратимые действия, регуляторные требования, этап построения доверия, неоднозначные исключения и управляемое ухудшение. Он также показывает конкретные механизмы: MCP elicitations, ожидание callback в Step Functions и approval nodes.

Увидеть, как точки утверждения можно реализовать как явные контрольные точки процесса, а не как неформальную ручную проверку после сбоя.

УверенныйАвтоматизация
17 мин

12-Factor Agents: Patterns of reliable LLM applications — Dex Horthy, HumanLayer

AI Engineer. Dex Horthy объясняет, почему надёжные агентные системы в основном состоят из дисциплинированного программного обеспечения вокруг нескольких вызовов LLM: контролируйте инструкцию, контролируйте контекстное окно, держите поток управления детерминированным и используйте вызовы инструментов для обращения к человеку, когда процесс требует суждения. Это напрямую связано с паттернами утверждения, исключений и эскалации из статьи.

Научиться проектировать ИИ-процессы, которые могут остановиться, продолжиться, запросить человеческое решение и отделить бизнес-состояние от предположений модели.

УверенныйАвтоматизация
7 мин

Лучший RAG и AI-агенты с Docling

IBM Technology. Объясняет сторону загрузки данных в RAG и агентах: как подготовить PDF и другие файлы, чтобы структура документа, таблицы и макет сохранились для поиска. Это поддерживает предупреждение статьи: качество и безопасность RAG начинаются до embeddings, особенно для сложных бизнес-документов.

Понять, почему парсинг документов, сохранение структуры и quality gates на этапе загрузки важны до построения RAG поверх PDF и смешанных форматов файлов.

ЭкспертБезопасность ИИ и приватность данных
59 мин

От хайпа к привычке: как технологические компании масштабируют ИИ дальше экспериментов

Propeller Consulting. Обсуждает управление, операционную дисциплину, внедрение среди сотрудников и измерение ROI как связанные части масштабирования ИИ за пределы экспериментов. Это подходит модели зрелости из статьи, потому что внедрение рассматривается как изменённая работа с владельцами и метриками, а не как использование инструментов или посещение workshop.

Связать зрелость внедрения ИИ с измерениями на уровне рабочих процессов, управлением, операционным здоровьем и устойчивым изменением поведения.

ЭкспертИИ для бизнеса
41 мин

Private AI против cloud: как лидерам принимать более умные build-or-buy решения

World Wide Technology. Связывает решения build-or-buy с бизнес-результатами, размещением нагрузок, экономикой облака, суверенитетом данных, безопасностью, готовностью инфраструктуры и гибридными операционными моделями. Это полезно для выбора между покупкой инструмента, расширением платформы, тонким собственным слоем или большим владением стеком развёртывания.

Принимать AI build-vs-buy решения вокруг результата, контроля данных, экономики нагрузки, готовности инфраструктуры и операционного владения.

ЭкспертИИ для бизнеса
20 мин

Права и access control для RAG: глубокий tutorial

Paragon. Проходит через проблему разрешений в production RAG и сравнивает вызовы инструментов, пространства имён, ACL-таблицы и разрешения на основе отношений. Это напрямую поддерживает главное правило статьи: поиск должен возвращать только источники, доступные текущему пользователю.

Оценить практические паттерны контроля доступа для RAG по знаниям компании перед индексацией чувствительных внутренних документов.

ЭкспертБезопасность ИИ и приватность данных
48 мин

Как строить надёжных AI-агентов: контекст и evals

Arize AI. Объясняет, почему агенты в продакшене ломаются без правильного контекста, данных для оценки, трассировки и доменной экспертизы. Это хорошо ложится на реестр отказов из статьи: отделяйте поиск от рассуждения, определяйте ожидаемые результаты, оценивайте вызовы инструментов и трассируйте ошибки до смены модели.

Проектировать рабочие процессы с ИИ вокруг контекста, оценок качества и наблюдаемости, чтобы сбои в продакшене можно было назвать, измерить и исправить.

ЭкспертБезопасность ИИ и приватность данных
35 мин

Генерация кода с ИИ: успехи, провалы и будущее

IBM Technology. Обсуждает неровное качество разработки с ИИ, владение архитектурой, оркестрацию агентов, ограничения контекста, открытые и закрытые инструменты, а также то, почему модель может решить сложную задачу, но провалить обычную инженерную деталь.

Построить реалистичную ментальную модель того, когда кодовые агенты с контекстом репозитория помогают и где всё ещё нужен контроль senior-инженера.

ЭкспертИИ для бизнеса
37 мин

Возможности VMware Private AI Foundation и обновление от Broadcom

Tech Field Day. Показывает приватный ИИ как многослойную инфраструктуру: контролируемые вычисления, изолированные среды, Kubernetes, контейнеры для инференса, управление моделями, самообслуживание, совместное использование GPU и мониторинг. Это напрямую соответствует предупреждению статьи: приватность зависит от границ, логов, доступа и операций, а не от слова «локально».

Оценивать приватный ИИ как решение об инфраструктуре и управлении, а не автоматически выбирать SaaS или самостоятельное размещение.

ЭкспертПриватный и локальный ИИ
6 мин

AI-голосовые агенты: как они работают и почему звучат так по-человечески

CX Foundation. Разбирает голосового агента как практический конвейер: распознавание речи, языковая модель, API бизнес-систем, синтез речи и обработка перебиваний. Это даёт техническую основу для рамки внедрения из статьи перед выбором Twilio, Retell, Vapi, LiveKit или другой платформы.

Узнать базовую архитектуру голосового агента и точки отказа, которые влияют на доверие клиента в реальных звонках.

ЭкспертАвтоматизация
33 мин

Руководство AI-инженера: как пережить Закон ЕС об ИИ

GOTO Conferences. Связывает Закон ЕС об ИИ с качеством данных, MLOps, документацией и мониторингом после внедрения. Это хорошо поддерживает базовую SME-модель из статьи: работа начинается с понимания системы, данных, владельца, цели и контролей, а не с покупки compliance-платформы.

Понять, почему готовность к AI Act зависит от инвентаризации AI-систем, управления данными, инженерных контролей и понятного владельца.

ЭкспертБезопасность ИИ и приватность данных
42 мин

Vertical AI Agents Could Be 10X Bigger Than SaaS

Y Combinator. Ведущие Lightcone прорабатывают, почему вертикальные ИИ-агенты — а не горизонтальные обёртки — это защитимая форма для компаний прикладного слоя, с конкретными примерами и трезвым взглядом на то, какие категории провайдеры моделей съедят. Это и есть та ловушка отсутствия рва, о которой предупреждает статья, выраженная как позитивный плейбук.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
34 мин

How AI is Reinventing Software Business Models ft. Bret Taylor of Sierra

Sequoia Capital. Брет Тейлор проходит по сдвигу от per-seat SaaS к ценообразованию по результату — за что цепляться (resolution, CSAT, NPS), почему инкумбентам трудно следовать и как вертикальная специализация создаёт ценовую власть. Напрямую отзеркаливает разделы статьи про ценообразование и маржу.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
32 мин

Fast LLM Serving with vLLM and PagedAttention

Anyscale. Проходит, почему наивный LLM-serving тратит впустую 60–80% памяти GPU, как PagedAttention заимствует пейджинг в стиле OS, чтобы это починить, и почему continuous batching даёт те самые 24× по throughput, на которые опирается арифметика статьи. После этого фраза статьи «вам повезёт попасть в 50% утилизации» перестаёт казаться абстрактной.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертПриватный и локальный ИИ
56 мин

Build Hour: Prompt Caching

OpenAI. Собственный Build Hour OpenAI по prompt caching — порог в 1024 токена, требование стабильности префикса, кеширование аудио с 99% скидкой для realtime, влияние на time-to-first-token на длинных вводах. Полезно, когда вы оцениваете инженерные усилия для надёжного попадания в кеш на ваших продакшен-промптах.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
19 мин

Is This the End of RAG? Anthropic's NEW Prompt Caching

Prompt Engineering. Проходит prompt caching от Anthropic против context caching от Gemini с конкретными сокращениями латентности и стоимости по сценариям (long-document чат, few-shot, multi-turn). Разбивка надбавки за запись в кеш против скидки за чтение из кеша — ровно то, что предполагает статья, говоря, когда кеширование окупается.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
17 мин

Defending LLM - Prompt Injection

LiveOverflow. Проходит реальный плейбук эшелонированной защиты — taint-анализ вывода LLM, ограничение ожидаемой формы вывода, изоляция пользователей, few-shot каркасы, fine-tuning, температура 0 для детерминизма, избыточность на критических путях. Совпадает с разделом про защитный стек в статье почти пункт в пункт.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертБезопасность ИИ и приватность данных
13 мин

Attacking LLM - Prompt Injection

LiveOverflow. Рамкует prompt injection как классическую injection-атаку против систем, которые смешивают инструкции и недоверенные данные — с конкретным примером модерации контента, где атакующий подставляет невинного пользователя. Сдвиг ментальности с «целью является модель» на «целью является приложение» — ровно тот ход, с которого начинает статья.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертБезопасность ИИ и приватность данных
8 мин

Anthropic's Claude Computer Use Is A Game Changer | YC Decoded

Y Combinator. Гэрри Тан проходит по тому, что computer use реально меняет для неавтоматизируемого длинного хвоста софта — легаси-приложения, внутренние порталы, всё без API. Рамка здесь — ровно аргумент статьи «браузер — это универсальный интерфейс», но с более бизнесово-реалистичным взглядом на то, где это окупится в первую очередь.

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

ЭкспертАвтоматизация
5 мин

Claude has taken control of my computer...

Fireship. Самое ясное короткое объяснение на YouTube цикла screenshot–action–screenshot, включая честные режимы отказа (Claude уходит смотреть Йеллоустоун, расход токенов, латентность на шаг). Fireship по дизайну скуп на продакшен-детали — за этим в статью — но он оставляет вас с правильной интуицией того, почему такие системы дороги и хрупки, прежде чем вы поставите одну из них в свой стек.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
44 мин

Building Brain-Like Memory for AI | LLM Agent Memory Systems

Adam Lucek. Более длинная реализационная проходка по категориям из когнитивной науки — эпизодическая, семантическая, рабочая, процедурная — встроенным в агента в коде. Стоит посмотреть после концептуального видео LangChain, если хочется более мнённую ментальную модель и рабочий пример, который можно стащить.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
7 мин

Memory for agents (conceptual video)

LangChain. Короткий разбор без кода: разделение short-term-vs-long-term, три формы, которые обычно принимает долгосрочная память (инструкции, профиль, список объектов), и компромисс «горячий путь vs. фоновая запись». Раздел про архитектуру памяти в статье предполагает ровно эту таксономию.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация

Показано 24 из 157

Недавно проверено

Свежепроверенные видео и связанные рекомендации из библиотеки AI Expert.