Prompt Engineering. Käib läbi Anthropicu prompti caching'u vs Gemini konteksti-caching'u koos konkreetsete latentsuse ja kulu vähenemistega kasutusjuhtumi kohta (pikkade dokumentide chat, few-shot, multi-turn). Cache-write lisatasu vs cache-read soodustuse lahtimõtestamine on täpselt see, mida artikkel eeldab, kui ta räägib sellest, millal caching ennast ära tasub.
Saad tehnilise mustri teemal "Inference'i kulu-optimeerimine" ning oskad hinnata riske, piire ja järgmist sammu.
Jätka sama õpiteekonda järgmiste hoolikalt valitud kaasvideotega.