Teema

Privaatne, kohalik ja ise majutatud AI

Kohalikud mudelid, privaatse juurutuse mustrid, ise majutatud käitus ja hübriidarhitektuurid.

10 lugu (4 artiklit · 6 videot)

Alusta siit

Mõned head esimesed materjalid enne kogu voo sirvimist.

Veel selles teemas

37 minutit
Video

VMware Private AI Foundationi võimekused ja uuendused Broadcomilt

Tech Field Day. Näitab privaatset AI-d kihilise infrastruktuurina: kontrollitud arvutus, eraldatud keskkonnad, Kubernetes, inferentsikonteinerid, mudelihaldus, iseteenindus, GPU jagamine ja monitooring. See sobib artikli hoiatusega, et privaatsus sõltub piiridest, logidest, ligipääsust ja operatsioonidest, mitte sõnast "lokaalne".
Ekspert
13 min lugemist
Artikkel

Peenhäälestus 2026. aastal: millal LoRA võidab RAG-i ja kuidas seda teha ilma klastrita

LoRA-põhine peenhäälestus on muutunud väikestele tiimidele kättesaadavamaks. Millal peenhäälestus võidab RAG-i, millised mustrid töötavad ja milline on praktiline töövoog andmete ettevalmistamisest juurutamiseni.

Hindad, millal peenhäälestus on vajalik, milliseid andmeid see nõuab ja kuidas vältida kallist lahendust vales probleemis.

Ekspert
32 minutit
Video

Kiire LLM-serveerimine vLLM-i ja PagedAttentioniga

Anyscale. Käib läbi, miks naiivne LLM-serveerimine raiskab 60–80% GPU mälust, kuidas PagedAttention laenab OS-i stiilis pagineerimist seda parandama ja miks pidev batching toodab 24× läbilaskvuse numbreid, mida artikkel oma matemaatikas kasutab. Pärast seda lakkab artikli "õnneks tabad 50% kasutusastet" rida abstraktne olemast.
Ekspert
59 minutit
Video

LLM-i arendamine: ehitamine, treenimine, finetuning

Sebastian Raschka. Sebastian Raschka aeglasem läbikäik sellest, kus fine-tuning laiemas LLM-treeningu konveieris istub — instruction tuning, klassifikatsiooni fine-tuning, parameetri-tõhusad meetodid ja kompromissid, mida artikkel välja toob enne LoRA soovitamist. Hea kalibreerimine enne alustamist, eriti kui su tiim arutleb, kas fine-tuning on üldse õige samm.
Ekspert
157 minutit
Video

LLM-mudelite fine-tuning – generatiivse AI kursus

freeCodeCamp.org. Pikk, teooria-siis-kood kursus, mis katab kvantiseerimise, LoRA, QLoRA ja täis-PEFTi Llama 2 ja Gemma peal — riistvaral, mis enamikul arendajatel päriselt olemas on. See on YouTube'is kõige lähemal "vaata üle õla kellelegi, kes seda teinud on" kogemusele ja sobib artikli "sul pole vaja klastrit" väitega koos konkreetsete VRAM-eelarvetega.
Ekspert
6 minutit
Video

LM Studio õpetus: käivita suuri keelemudeleid (LLM) oma sülearvutil

Kevin Stratvert. Sama töövoog mis Ollama, aga GUI-s: laadi LM Studio alla, tõmba Llama või Gemma mudel, vestle, kukuta PDF sisse ja küsi selle kohta küsimusi. Hea lugejatele, kes pigem terminalis ei elaks — kasulik ka selle jaoks, et saada tunnetus, kuidas 1B–3B mudel raskema vastu päriselt esineb.
Edasijõudnud
14 minutit
Video

Õpi Ollama selgeks 15 minutiga - käivita LLM mudeleid lokaalselt TASUTA

Tech With Tim. Tihke, asjalik Ollama läbikäik — paigaldus, mudeli tõmbamine, vestlus, siis lokaalse HTTP API torkimine Pythonist ja kohandatud mudeli loomine Modelfile'iga. Katab täpselt selle töövoo, mida artikkel Macis igapäevaseks kasutamiseks kirjeldab, sealhulgas kuidas mõelda mudeli suurusest vs su masina RAM-i kohta.
Edasijõudnud