Valitud videokogu

Videod

Vaata selgemaid kaasvideoid ilma kogu kogu korraga läbi kammimata. Vali õpiteekond, jätka poolelijäänut või kasuta filtreid, kui tead täpselt, mida otsid.

48 tulemust
7 minutit

Parem RAG ja AI agendid Doclinguga

IBM Technology. Selgitab RAG-i ja agentide sisestuspoolt: kuidas PDF-id ja muud failid ette valmistada, et dokumendi struktuur, tabelid ja paigutus säiliksid otsingu jaoks. See toetab artikli hoiatust, et RAG-i kvaliteet ja ohutus algavad enne embeddinguid.

Mõista, miks dokumendi parsimine, struktuuri säilitamine ja sisestuse kvaliteedikontrollid on vajalikud enne RAG-i ehitamist PDF-ide ja segafailide peale.

EkspertAI-ohutus ja andmeprivaatsus
59 minutit

Hüppest harjumuseks: kuidas tehnoloogiaettevõtted skaleerivad AI-d eksperimendist kaugemale

Propeller Consulting. Arutab juhtimist, töökorraldust, töötajate kasutuselevõttu ja ROI mõõtmist kui ühtset AI skaleerimise süsteemi. See sobib artikli küpsusmudeliga, sest AI kasutuselevõttu käsitletakse muutunud tööna, mitte tööriista kasutuse või koolitusel osalemisena.

Siduda AI kasutuselevõtu küpsus töövoo mõõdikute, juhtimise, operatsioonilise tervise ja püsiva käitumismuutusega.

EkspertAI ettevõttes
41 minutit

Privaatne AI vs pilv: kuidas juhid saavad teha targemaid build-or-buy otsuseid

World Wide Technology. Seob build-or-buy valikud äritulemuste, töökoormuse paigutuse, pilveökonoomika, andmesuveräänsuse, turbe, infrastruktuuri valmisoleku ja hübriidsete töökorraldustega. See aitab otsustada, millal osta tööriist, laiendada platvormi, ehitada õhuke kohandatud kiht või omada suuremat osa juurutusest.

Teha AI build-vs-buy otsuseid tulemuse, andmekontrolli, töökoormuse hinna, infrastruktuuri valmisoleku ja operatsioonilise omandi järgi.

EkspertAI ettevõttes
20 minutit

RAG-i õigused ja ligipääsukontroll: süvitsi õpetus

Paragon. Käib läbi tootmise RAG-i õiguste probleemi ning võrdleb tööriistakutseid, namespace’e, ACL-tabeleid ja relatsioonipõhiseid õigusi. See toetab artikli põhireeglit: otsing peab tagastama ainult need allikad, mida praegune kasutaja tohib näha.

Hinnata praktilisi ligipääsukontrolli mustreid ettevõtte teadmiste RAG-i jaoks enne tundlike sisemiste dokumentide indekseerimist.

EkspertAI-ohutus ja andmeprivaatsus
48 minutit

Kuidas ehitada usaldusväärseid AI agente: kontekst ja evalid

Arize AI. Selgitab, miks tootmisagendid ebaõnnestuvad, kui süsteemil pole õiget konteksti, hindamisandmeid, trace’e ja domeeniekspertiisi. See sobib artikli vearegistriga: eralda otsing arutlusest, defineeri oodatud tulemus, hinda tööriistakutseid ja jälgi vigu enne mudeli vahetamist.

Disainida AI töövooge konteksti, evalide ja observability ümber, nii et tootmisvead oleksid nimetatavad, mõõdetavad ja parandatavad.

EkspertAI-ohutus ja andmeprivaatsus
35 minutit

AI koodigeneratsioon: võidud, läbikukkumised ja tulevik

IBM Technology. Räägib AI koodigeneratsiooni ebatasasest tulemuskõverast, arhitektuuri omandist, agentide orkestreerimisest, kontekstipiiridest, avatud ja kinnistest tööriistadest ning sellest, miks mudel võib lahendada raske ülesande, aga eksida tavalises inseneridetailis.

Luua realistlik mõttemudel selle kohta, millal repo-teadlikud koodiagendid aitavad ja kus on endiselt vaja senior-inseneri kontrolli.

EkspertAI ettevõttes
37 minutit

VMware Private AI Foundationi võimekused ja uuendused Broadcomilt

Tech Field Day. Näitab privaatset AI-d kihilise infrastruktuurina: kontrollitud arvutus, eraldatud keskkonnad, Kubernetes, inferentsikonteinerid, mudelihaldus, iseteenindus, GPU jagamine ja monitooring. See sobib artikli hoiatusega, et privaatsus sõltub piiridest, logidest, ligipääsust ja operatsioonidest, mitte sõnast "lokaalne".

Hinnata privaatset AI-d infrastruktuuri ja juhtimise otsusena, mitte valida SaaS-i või isehostimise vahel kõhutunde põhjal.

EkspertPrivaatne ja lokaalne AI
6 minutit

AI hääleagendid: kuidas need päriselt töötavad ja miks need nii inimlikult kõlavad

CX Foundation. Jagab hääleagendi praktiliseks toruks: kõnetuvastus, keelemudel, ärisüsteemide API-d, kõnesüntees ja katkestustega toimetulek. See annab artikli juurutusraamistikule tehnilise aluse enne Twilio, Retelli, Vapi, LiveKiti või muu platvormi valimist.

Tunda ära hääleagendi põhiarhitektuur ja need veakohad, mis mõjutavad päriskõnedes kliendi usaldust.

EkspertAutomatiseerimine
33 minutit

AI-inseneri juhis EL-i AI Actiga toime tulemiseks

GOTO Conferences. Seob EL-i AI Acti andmekvaliteedi, MLOps-i, dokumentatsiooni ja kasutusejärgse seirega. See sobib artikli VKE juhtimisbaasiga: töö algab süsteemi, andmete, omaniku, eesmärgi ja kontrollide tundmisest, mitte vastavusplatvormi ostmisest.

Mõista, miks AI Acti valmisolek sõltub praktilisest süsteemide inventuurist, andmejuhtimisest, tehnilistest kontrollidest ja selgest omanikust.

EkspertAI-ohutus ja andmeprivaatsus
42 minutit

Vertikaalsed AI-agendid võivad olla 10X SaaS-ist suuremad

Y Combinator. Lightcone'i juhid töötavad läbi, miks vertikaalsed AI-agendid — mitte horisontaalsed mähised — on rakenduskihi ettevõtetele kaitstav kuju, koos konkreetsete näidetega ja selge pilguga selle peale, millised kategooriad mudelipakkujad ära söövad. See on anti-vallikraavi lõks, mille eest artikkel hoiatab, väljendatud positiivse mängukavana.

Saad tehnilise mustri teemal "LLM-toote välja saatmine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
34 minutit

Kuidas AI tarkvara ärimudeleid taasleiutab ft. Bret Taylor Sierrast

Sequoia Capital. Bret Taylor käib läbi nihke per-seat SaaS-ilt tulemustepõhisele hinnastamisele — millele kinnituda (lahendamine, CSAT, NPS), miks etableeritud tegijatel on raske järele tulla ja kuidas vertikaalne spetsialiseerumine loob hinnastamisjõudu. See peegeldab otseselt artikli hinnastamise ja marginaali sektsioone.

Saad tehnilise mustri teemal "LLM-toote välja saatmine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
32 minutit

Kiire LLM-serveerimine vLLM-i ja PagedAttentioniga

Anyscale. Käib läbi, miks naiivne LLM-serveerimine raiskab 60–80% GPU mälust, kuidas PagedAttention laenab OS-i stiilis pagineerimist seda parandama ja miks pidev batching toodab 24× läbilaskvuse numbreid, mida artikkel oma matemaatikas kasutab. Pärast seda lakkab artikli "õnneks tabad 50% kasutusastet" rida abstraktne olemast.

Saad tehnilise mustri teemal "Ise-hostitud vs hostitud inference" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertPrivaatne ja lokaalne AI
56 minutit

Build Hour: Prompt Caching

OpenAI. OpenAI enda Build Hour prompti caching'ust — 1024-tokeni künnis, eesliite-stabiilsuse nõue, audio caching 99% soodustusega realtime'i jaoks, time-to-first-token mõjud pikkade sisendite korral. Kasulik, kui mõõdad inseneri-pingutust, mida nõuab cache'i päriselt usaldusväärselt tabamine oma produktsiooni-promptidel.

Saad tehnilise mustri teemal "Inference'i kulu-optimeerimine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
19 minutit

Kas see on RAG-i lõpp? Anthropicu UUS prompti caching

Prompt Engineering. Käib läbi Anthropicu prompti caching'u vs Gemini konteksti-caching'u koos konkreetsete latentsuse ja kulu vähenemistega kasutusjuhtumi kohta (pikkade dokumentide chat, few-shot, multi-turn). Cache-write lisatasu vs cache-read soodustuse lahtimõtestamine on täpselt see, mida artikkel eeldab, kui ta räägib sellest, millal caching ennast ära tasub.

Saad tehnilise mustri teemal "Inference'i kulu-optimeerimine" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI ettevõttes
17 minutit

LLM-i kaitsmine - Prompt Injection

LiveOverflow. Käib läbi tegeliku sügava kaitse mängukava — taint-analüüs LLM-i väljundil, oodatavate väljundvormide piiramine, kasutaja isoleerimine, few-shot tellingud, fine-tuning, temperatuur 0 determineerituse jaoks, kriitiliste radade liiasus. See vastab artikli kaitsestäki sektsioonile peaaegu punkt punktilt.

Saad tehnilise mustri teemal "Prompt injection ja LLM-turvalisus" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-ohutus ja andmeprivaatsus
13 minutit

LLM-i ründamine - Prompt Injection

LiveOverflow. Raamib prompt injectioni klassikalise injection-rünnakuna süsteemide vastu, mis segavad juhiseid ja usaldamatuid andmeid — koos konkreetse sisu-modereerimise näitega, kus ründaja süüdistab süütut kasutajat. Mõtteline nihe "mudel on sihtmärk" → "rakendus on sihtmärk" on täpselt see käik, millega artikkel avab.

Saad tehnilise mustri teemal "Prompt injection ja LLM-turvalisus" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-ohutus ja andmeprivaatsus
8 minutit

Anthropicu Claude Computer Use on mängumuutja | YC Decoded

Y Combinator. Garry Tan käib läbi, mida computer use päriselt muudab tarkvara automatiseerimatu pika saba jaoks — pärandrakendused, sisemised portaalid, kõik, millel API-d ei ole. Raamistus siin on täpselt artikli "brauser on universaalne liides" argument, äri-realistlikuma vaatega sellele, kus see esmalt ennast ära tasub.

Saad otsustusraami teemal "Computer use ja brauseri-agendid produktsioonis" ning oskad hinnata mõju, riske ja rakendusvalikuid.

EkspertAutomatiseerimine
5 minutit

Claude on mu arvuti üle võtnud...

Fireship. Selgeim lühike selgitus YouTube'is ekraanipilt–tegevus–ekraanipilt silmusest, sealhulgas ausad vigade režiimid (Claude rändab Yellowstone'i vaatama, tokeni põletamine, sammu-kaupa latentsus). Fireship on tahtlikult kerge produktsiooni-detailides — loe selleks artiklit — aga see jätab sulle õige intuitsiooni selle kohta, miks need süsteemid on kallid ja haprad enne, kui ühele oma stäki annad.

Saad tehnilise mustri teemal "Computer use ja brauseri-agendid produktsioonis" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
44 minutit

Aju-laadse mälu ehitamine AI-le | LLM-agendi mälusüsteemid

Adam Lucek. Pikem implementatsiooni-läbikäik kognitiivteadusest inspireeritud kategooriate kaudu — episoodiline, semantiline, töötav, protseduuriline — agendis koodiga ühendatud. Tasub vaadata pärast LangChaini kontseptuaalset videot, kui tahad arvamuserikkamat mõttemudelit ja töötavat näidet, millest kopeerida.

Saad tehnilise mustri teemal "Mälu ehitamine kauakestvatele agentidele" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
7 minutit

Mälu agentidele (kontseptuaalne video)

LangChain. Lühike, ilma koodita läbikäik lühi-vs-pikaajalisest jaotusest, kolmest kujust, milleks pikaajaline mälu kipub jagunema (juhised, profiil, objektide nimekiri), ja kuum-rada-versus-taust kompromissist, millal kirjutada. Artikli mälu-arhitektuuri sektsioon eeldab täpselt seda taksonoomiat.

Saad tehnilise mustri teemal "Mälu ehitamine kauakestvatele agentidele" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
22 minutit

Kontekstiinseneeria agentidele

LangChain. Lance Martini raamistik — write, select, compress, isolate — koos konkreetsete näidetega, millal kokku võtta tegevuste ajalugu, millal olekut failidesse maha laadida ja millal käivitada alam-agente puhtalt vanema konteksti kaitsmiseks. Kaardistub peaaegu otse artikli sektsioonile 1M-tokeniliste akende haldamisest praktikas.

Saad tehnilise mustri teemal "Kontekstiinseneeria" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-juhiste koostamine
8 minutit

Context Rot: kuidas sisendtokenite kasv mõjutab LLM-i jõudlust

Chroma. Kelly Hong käib läbi Chroma uuringu 18 mudeli kohta — miks needle-in-haystack tulemused on eksitavad, kuidas jõudlus halveneb mitmetähenduslikkuse ja häirivate elementidega, miks isegi lihtne stringi-kordamise ülesanne degradeerub pärast 500 tokenit. Lühike, tõenduspõhine ja täpselt see argument, mille artikkel sul tõsiselt võtta tahab enne inseneri-käikude juurde jõudmist.

Saad tehnilise mustri teemal "Kontekstiinseneeria" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAI-juhiste koostamine
66 minutit

CrewAI õpetus: täielik kiirkursus algajatele

aiwithbrandon. Sama tüüpi ehitus, aga CrewAI roll-eesmärk-taustalugu stiilis — agendid kui tiimi liikmed, ülesanded kui tarned, raamistik peidab täitmissilmuse. Vaata see kohe pärast LangGraphi kursust; kontrast selles, kui palju raamistik su eest otsustab, on täpselt see, mida artikkel sul kaaluda palub.

Saad tehnilise mustri teemal "LangGraph vs CrewAI vs otsene API" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine
190 minutit

LangGraphi täiskursus algajatele – keerukad AI-agendid Pythoniga

freeCodeCamp.org. Pikk koos-koodimisega ehitus LangGraphi olekugraafide, sõlmede, servade, tingimusliku marsruutimise, checkpointide ja tööriistakasutusega. Lõpuks on sul tüpiseeritud-oleku, "iga üleminek on selgesõnaline" mudeli kohta piisav tunnetus, et artikli võrdlus CrewAI-ga ja otsese-API koodiga lakkab olemast abstraktne.

Saad tehnilise mustri teemal "LangGraph vs CrewAI vs otsene API" ning oskad hinnata riske, piire ja järgmist sammu.

EkspertAutomatiseerimine

Näitan 24 / 48