Valitud videokogu

Videod

Vaata selgemaid kaasvideoid ilma kogu kogu korraga läbi kammimata. Vali õpiteekond, jätka poolelijäänut või kasuta filtreid, kui tead täpselt, mida otsid.

157 tulemust
4 minutit

Introducing EmbeddingGemma: The Best-in-Class Open Model for On-Device Embeddings

Google for Developers. Video tutvustab mitmekeelseid tekstivektoreid, mis saavad töötada lokaalselt ning toetada semantilist otsingut ja RAG-i ilma iga dokumenti majutatud API-sse saatmata. Eesti ettevõtetele on see tehniline täiendus artikli siseteadmiste otsingu mustrile: mitmekeelne otsing on kasulik ainult siis, kui see austab ka andmete asukohta, ligipääsuõigusi ja allika autoriteeti.

Saad aru, miks mitmekeelsed embedding-mudelid on olulised privaatse siseotsingu jaoks ja kus kohalik otsing võib vähendada andmete paljastamise riski.

EdasijõudnudAI ettevõttes
32 minutit

How to Build Human-Centered AI Workflows in Localization with Shashi Bhushan

Crowdin. Shashi Bhushan alustab töövoo kaardistamisest, mitte tööriista valimisest, ning räägib lähtekeele kvaliteedist, inimese ülevaatusest, AI-korrektuurist, terminisõnastiku kontrollidest, tootetiimi kaasamisest, pilootidest ja privaatsuspiirangutest. See on väga lähedal töökorraldusele, mida artikkel soovitab Eesti tiimidele, kes töötavad eesti, inglise, vene, soome ja kliendispetsiifilise terminoloogiaga.

Õpid lisama AI-d lokaliseerimisse nii, et inimene säilitab vastutuse tähenduse, tooni, terminoloogia ja lõpliku kinnituse eest.

EdasijõudnudAI ettevõttes
18 minutit

AWS re:Invent 2025 - Implementing Human-in-the-Loop Controls for Multi-Agent AI Systems (CNS428)

AWS Events. See lühiettekanne nimetab ärilised hetked, kus inimese kontroll on vajalik: kõrge mõjuga otsused, tagasipööramatud tegevused, regulatiivsed nõuded, usalduse kasvatamise faas, ebaselged erandid ja kontrollitud taandumine. Samuti näitab see konkreetseid mehhanisme, näiteks MCP täpsustusküsimusi, Step Functionsi callback-ootamist ja kinnitussõlmi.

Näed, kuidas kinnitusväravaid saab ehitada selgete töövoo kontrollpunktidena, mitte mitteametliku käsitsi ülevaatusena pärast probleemi tekkimist.

EdasijõudnudAutomatiseerimine
17 minutit

12-Factor Agents: töökindlate LLM-rakenduste mustrid — Dex Horthy, HumanLayer

AI Engineer. Dex Horthy selgitab, miks töökindlad agentide süsteemid on peamiselt distsiplineeritud tarkvara mõne LLM-kutse ümber: halda ise juhist, halda kontekstiakent, hoia juhtvoog deterministlik ja kasuta tööriistakutseid inimese poole pöördumiseks siis, kui töövoog vajab otsust. See sobib otseselt artikli kinnitamise, erandite ja eskalatsiooni mustritega.

Õpid disainima AI-töövooge, mis saavad peatuda, jätkata, küsida inimeselt otsust ja hoida äriseisundi mudeli oletustest eraldi.

EdasijõudnudAutomatiseerimine
7 minutit

Parem RAG ja AI agendid Doclinguga

IBM Technology. Selgitab RAG-i ja agentide sisestuspoolt: kuidas PDF-id ja muud failid ette valmistada, et dokumendi struktuur, tabelid ja paigutus säiliksid otsingu jaoks. See toetab artikli hoiatust, et RAG-i kvaliteet ja ohutus algavad enne embeddinguid.

Mõista, miks dokumendi parsimine, struktuuri säilitamine ja sisestuse kvaliteedikontrollid on vajalikud enne RAG-i ehitamist PDF-ide ja segafailide peale.

EkspertAI-ohutus ja andmeprivaatsus
59 minutit

Hüppest harjumuseks: kuidas tehnoloogiaettevõtted skaleerivad AI-d eksperimendist kaugemale

Propeller Consulting. Arutab juhtimist, töökorraldust, töötajate kasutuselevõttu ja ROI mõõtmist kui ühtset AI skaleerimise süsteemi. See sobib artikli küpsusmudeliga, sest AI kasutuselevõttu käsitletakse muutunud tööna, mitte tööriista kasutuse või koolitusel osalemisena.

Siduda AI kasutuselevõtu küpsus töövoo mõõdikute, juhtimise, operatsioonilise tervise ja püsiva käitumismuutusega.

EkspertAI ettevõttes
41 minutit

Privaatne AI vs pilv: kuidas juhid saavad teha targemaid build-or-buy otsuseid

World Wide Technology. Seob build-or-buy valikud äritulemuste, töökoormuse paigutuse, pilveökonoomika, andmesuveräänsuse, turbe, infrastruktuuri valmisoleku ja hübriidsete töökorraldustega. See aitab otsustada, millal osta tööriist, laiendada platvormi, ehitada õhuke kohandatud kiht või omada suuremat osa juurutusest.

Teha AI build-vs-buy otsuseid tulemuse, andmekontrolli, töökoormuse hinna, infrastruktuuri valmisoleku ja operatsioonilise omandi järgi.

EkspertAI ettevõttes
20 minutit

RAG-i õigused ja ligipääsukontroll: süvitsi õpetus

Paragon. Käib läbi tootmise RAG-i õiguste probleemi ning võrdleb tööriistakutseid, namespace’e, ACL-tabeleid ja relatsioonipõhiseid õigusi. See toetab artikli põhireeglit: otsing peab tagastama ainult need allikad, mida praegune kasutaja tohib näha.

Hinnata praktilisi ligipääsukontrolli mustreid ettevõtte teadmiste RAG-i jaoks enne tundlike sisemiste dokumentide indekseerimist.

EkspertAI-ohutus ja andmeprivaatsus
48 minutit

Kuidas ehitada usaldusväärseid AI agente: kontekst ja evalid

Arize AI. Selgitab, miks tootmisagendid ebaõnnestuvad, kui süsteemil pole õiget konteksti, hindamisandmeid, trace’e ja domeeniekspertiisi. See sobib artikli vearegistriga: eralda otsing arutlusest, defineeri oodatud tulemus, hinda tööriistakutseid ja jälgi vigu enne mudeli vahetamist.

Disainida AI töövooge konteksti, evalide ja observability ümber, nii et tootmisvead oleksid nimetatavad, mõõdetavad ja parandatavad.

EkspertAI-ohutus ja andmeprivaatsus
35 minutit

AI koodigeneratsioon: võidud, läbikukkumised ja tulevik

IBM Technology. Räägib AI koodigeneratsiooni ebatasasest tulemuskõverast, arhitektuuri omandist, agentide orkestreerimisest, kontekstipiiridest, avatud ja kinnistest tööriistadest ning sellest, miks mudel võib lahendada raske ülesande, aga eksida tavalises inseneridetailis.

Luua realistlik mõttemudel selle kohta, millal repo-teadlikud koodiagendid aitavad ja kus on endiselt vaja senior-inseneri kontrolli.

EkspertAI ettevõttes
37 minutit

VMware Private AI Foundationi võimekused ja uuendused Broadcomilt

Tech Field Day. Näitab privaatset AI-d kihilise infrastruktuurina: kontrollitud arvutus, eraldatud keskkonnad, Kubernetes, inferentsikonteinerid, mudelihaldus, iseteenindus, GPU jagamine ja monitooring. See sobib artikli hoiatusega, et privaatsus sõltub piiridest, logidest, ligipääsust ja operatsioonidest, mitte sõnast "lokaalne".

Hinnata privaatset AI-d infrastruktuuri ja juhtimise otsusena, mitte valida SaaS-i või isehostimise vahel kõhutunde põhjal.

EkspertPrivaatne ja lokaalne AI
6 minutit

AI hääleagendid: kuidas need päriselt töötavad ja miks need nii inimlikult kõlavad

CX Foundation. Jagab hääleagendi praktiliseks toruks: kõnetuvastus, keelemudel, ärisüsteemide API-d, kõnesüntees ja katkestustega toimetulek. See annab artikli juurutusraamistikule tehnilise aluse enne Twilio, Retelli, Vapi, LiveKiti või muu platvormi valimist.

Tunda ära hääleagendi põhiarhitektuur ja need veakohad, mis mõjutavad päriskõnedes kliendi usaldust.

EkspertAutomatiseerimine
33 minutit

AI-inseneri juhis EL-i AI Actiga toime tulemiseks

GOTO Conferences. Seob EL-i AI Acti andmekvaliteedi, MLOps-i, dokumentatsiooni ja kasutusejärgse seirega. See sobib artikli VKE juhtimisbaasiga: töö algab süsteemi, andmete, omaniku, eesmärgi ja kontrollide tundmisest, mitte vastavusplatvormi ostmisest.

Mõista, miks AI Acti valmisolek sõltub praktilisest süsteemide inventuurist, andmejuhtimisest, tehnilistest kontrollidest ja selgest omanikust.

EkspertAI-ohutus ja andmeprivaatsus
42 minutit

Vertikaalsed AI-agendid võivad olla 10X SaaS-ist suuremad

Y Combinator. Lightcone'i juhid töötavad läbi, miks vertikaalsed AI-agendid — mitte horisontaalsed mähised — on rakenduskihi ettevõtetele kaitstav kuju, koos konkreetsete näidetega ja selge pilguga selle peale, millised kategooriad mudelipakkujad ära söövad. See on anti-vallikraavi lõks, mille eest artikkel hoiatab, väljendatud positiivse mängukavana.

Saad tehnilise mustri teemal "LLM-toote välja saatmine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
34 minutit

Kuidas AI tarkvara ärimudeleid taasleiutab ft. Bret Taylor Sierrast

Sequoia Capital. Bret Taylor käib läbi nihke per-seat SaaS-ilt tulemustepõhisele hinnastamisele — millele kinnituda (lahendamine, CSAT, NPS), miks etableeritud tegijatel on raske järele tulla ja kuidas vertikaalne spetsialiseerumine loob hinnastamisjõudu. See peegeldab otseselt artikli hinnastamise ja marginaali sektsioone.

Saad tehnilise mustri teemal "LLM-toote välja saatmine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
32 minutit

Kiire LLM-serveerimine vLLM-i ja PagedAttentioniga

Anyscale. Käib läbi, miks naiivne LLM-serveerimine raiskab 60–80% GPU mälust, kuidas PagedAttention laenab OS-i stiilis pagineerimist seda parandama ja miks pidev batching toodab 24× läbilaskvuse numbreid, mida artikkel oma matemaatikas kasutab. Pärast seda lakkab artikli "õnneks tabad 50% kasutusastet" rida abstraktne olemast.

Saad tehnilise mustri teemal "Ise-hostitud vs hostitud inference" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertPrivaatne ja lokaalne AI
56 minutit

Build Hour: Prompt Caching

OpenAI. OpenAI enda Build Hour prompti caching'ust — 1024-tokeni künnis, eesliite-stabiilsuse nõue, audio caching 99% soodustusega realtime'i jaoks, time-to-first-token mõjud pikkade sisendite korral. Kasulik, kui mõõdad inseneri-pingutust, mida nõuab cache'i päriselt usaldusväärselt tabamine oma produktsiooni-promptidel.

Saad tehnilise mustri teemal "Inference'i kulu-optimeerimine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
19 minutit

Kas see on RAG-i lõpp? Anthropicu UUS prompti caching

Prompt Engineering. Käib läbi Anthropicu prompti caching'u vs Gemini konteksti-caching'u koos konkreetsete latentsuse ja kulu vähenemistega kasutusjuhtumi kohta (pikkade dokumentide chat, few-shot, multi-turn). Cache-write lisatasu vs cache-read soodustuse lahtimõtestamine on täpselt see, mida artikkel eeldab, kui ta räägib sellest, millal caching ennast ära tasub.

Saad tehnilise mustri teemal "Inference'i kulu-optimeerimine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
17 minutit

LLM-i kaitsmine - Prompt Injection

LiveOverflow. Käib läbi tegeliku sügava kaitse mängukava — taint-analüüs LLM-i väljundil, oodatavate väljundvormide piiramine, kasutaja isoleerimine, few-shot tellingud, fine-tuning, temperatuur 0 determineerituse jaoks, kriitiliste radade liiasus. See vastab artikli kaitsestäki sektsioonile peaaegu punkt punktilt.

Saad tehnilise mustri teemal "Prompt injection ja LLM-turvalisus" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-ohutus ja andmeprivaatsus
13 minutit

LLM-i ründamine - Prompt Injection

LiveOverflow. Raamib prompt injectioni klassikalise injection-rünnakuna süsteemide vastu, mis segavad juhiseid ja usaldamatuid andmeid — koos konkreetse sisu-modereerimise näitega, kus ründaja süüdistab süütut kasutajat. Mõtteline nihe "mudel on sihtmärk" → "rakendus on sihtmärk" on täpselt see käik, millega artikkel avab.

Saad tehnilise mustri teemal "Prompt injection ja LLM-turvalisus" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-ohutus ja andmeprivaatsus
8 minutit

Anthropicu Claude Computer Use on mängumuutja | YC Decoded

Y Combinator. Garry Tan käib läbi, mida computer use päriselt muudab tarkvara automatiseerimatu pika saba jaoks — pärandrakendused, sisemised portaalid, kõik, millel API-d ei ole. Raamistus siin on täpselt artikli "brauser on universaalne liides" argument, äri-realistlikuma vaatega sellele, kus see esmalt ennast ära tasub.

Saad otsustusraami teemal "Computer use ja brauseri-agendid produktsioonis" ning oskad hinnata mõju, riske ja rakendusvalikuid.

EkspertAutomatiseerimine
5 minutit

Claude on mu arvuti üle võtnud...

Fireship. Selgeim lühike selgitus YouTube'is ekraanipilt–tegevus–ekraanipilt silmusest, sealhulgas ausad vigade režiimid (Claude rändab Yellowstone'i vaatama, tokeni põletamine, sammu-kaupa latentsus). Fireship on tahtlikult kerge produktsiooni-detailides — loe selleks artiklit — aga see jätab sulle õige intuitsiooni selle kohta, miks need süsteemid on kallid ja haprad enne, kui ühele oma stäki annad.

Saad tehnilise mustri teemal "Computer use ja brauseri-agendid produktsioonis" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
44 minutit

Aju-laadse mälu ehitamine AI-le | LLM-agendi mälusüsteemid

Adam Lucek. Pikem implementatsiooni-läbikäik kognitiivteadusest inspireeritud kategooriate kaudu — episoodiline, semantiline, töötav, protseduuriline — agendis koodiga ühendatud. Tasub vaadata pärast LangChaini kontseptuaalset videot, kui tahad arvamuserikkamat mõttemudelit ja töötavat näidet, millest kopeerida.

Saad tehnilise mustri teemal "Mälu ehitamine kauakestvatele agentidele" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
7 minutit

Mälu agentidele (kontseptuaalne video)

LangChain. Lühike, ilma koodita läbikäik lühi-vs-pikaajalisest jaotusest, kolmest kujust, milleks pikaajaline mälu kipub jagunema (juhised, profiil, objektide nimekiri), ja kuum-rada-versus-taust kompromissist, millal kirjutada. Artikli mälu-arhitektuuri sektsioon eeldab täpselt seda taksonoomiat.

Saad tehnilise mustri teemal "Mälu ehitamine kauakestvatele agentidele" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine

Näitan 24 / 157

Hiljuti üle vaadatud

Hiljuti üle vaadatud videod ja nendega seotud soovitused AI Experti kogust.