Ehita isiklik RAG: vestle oma dokumentidega (ilma koodita)
Ehita alla tunni ajaga oma dokumentidel põhinev vestlus, ilma koodita. Kolm no-code valikut, mida 2026. aastal tasub kasutada, kompromissid ja mustrid, mis eristavad kasulikku RAG-i tüütust RAG-ist.
Outcome: Ehitad dokumendipõhise assistendi ja tead, millal aegunud, madala kvaliteediga või skoobivälised allikad muudavad vastused ebaturvaliseks.
RAG — Retrieval-Augmented Generation — on tehniline termin selleks, et "luba AI-l minu dokumentide abil mu küsimustele vastata". Kuni 2024. aastani oli see peamiselt arendajate võimekus. 2026. aastaks on saadaval suurepärased koodita valikud, mille seadistamine võtab viisteist minutit ja annab tulemusi, mis võistlevad kohandatud süsteemidega.
See artikkel käib läbi kolm no-code teed isikliku RAG-i ehitamiseks, millal kumbagi kasutada ja disainivalikud, mis eristavad kasulikku RAG-i tüütust RAG-ist. Eesmärk ei ole "lae kõik üles". Eesmärk on luua piiritletud, allikapõhine assistent, mille vastuseid saad kontrollida.
Isiklik RAG on ainult nii turvaline kui dokumendid, mille üles laadid, ja teenus, mis neid hoiab. Ära lae üles lepinguid, kliendiandmeid, personalidokumente, lähtekoodi ega reguleeritud materjali, kui tööriist, konto, säilitussätted ja ettevõtte poliitika seda ei luba.
Mida "isiklik RAG" tegelikult tähendab
Isiklik RAG on vestlusliides, kus:
- Sa laed üles oma dokumendid (PDF, Word, tekst, veebilehed, transkriptsioonid).
- Süsteem indekseerib need, et neid saaks otsida.
- Kui sa küsid küsimuse, otsib süsteem oma dokumentidest kõige asjakohasemad lõigud välja ja söödab need koos su küsimusega LLM-ile.
- LLM toodab vastuse, mis põhineb sinu dokumentidel, koos viidetega.
Eelis tavalise ChatGPT või Claude'i ees: mudel kasutab sinu konkreetseid dokumente, mitte oma treeningandmeid. See tähendab:
- Vastused on tõenduspõhised — iga väide on seotud allikaga.
- Mudel saab vastata küsimustele sisu kohta, mida ta pole kunagi näinud (sinu sisedokumendid, hiljutised paberid, nišiteadmised).
- Hallutsinatsioon langeb skoobi-sisestel küsimustel dramaatiliselt.
Piirang: kõik, mida sinu dokumentides pole, on väljaspool skoopi. Süsteem kas ütleb "mul pole sellist infot" või — halvemal juhul — pöördub tagasi treeningandmete juurde ja võib hallutsineerida.
Kolm no-code teed
90% isikliku RAG-i kasutusjuhtumite jaoks 2026. aastal on üks neist kolmest õige vastus:
Tee 1: NotebookLM (kõige lihtsam)
Juba käsitletud meie algajatele mõeldud NotebookLM-i artiklis. Korduskoht:
- Loo märkmik aadressil notebooklm.google.com.
- Lae üles kuni ~50 allikat (PDF, Docs, veebilehti, YouTube, audio).
- Vestle märkmikuga — iga vastus on tõenduspõhine ja viidatud.
- Audio Overview genereerib taskuhäälingu-stiilis kokkuvõtte.
Tugevused: Lihtsaim seadistus, parim tõenduspõhisus, viidatud vastused, audio overview on tõeliselt kasulik.
Piirangud: Piiratud integratsioonid (puudub automaatne sünk sinu dokumentidega, käsitsi uuesti üleslaadimine, kui allikad muutuvad). Allikate arvu piirid. Pole mujale sissepõimitav.
Sobib kõige paremini: Isiklikuks õppimiseks, dokumendianalüüsiks, teadustööks, projektiteadmusteks — igal pool, kus sinu allikad on kindel komplekt.
Tee 2: Claude Projects (kõige paindlikum)
Claude'i Projects-funktsioon laseb sul luua kausta, milles on:
- Kohandatud juhised projekti käitumise jaoks.
- Teadmusfailid (üleslaaditud dokumendid, millele assistent saab viidata).
- Kõik vestlused, mida sa projekti sees pead.
Tugevused: Parem vestluskvaliteet kui NotebookLM-il (Claude'i kirjutamistugevus), paindlikum käitumise konfiguratsioon, mugavam jätkutööks.
Piirangud: Vähem allikatüüpe toetatud (peamiselt tekst, PDF-id, kood). Puudub natiivne veebist tõmbamine. Käsitsi uuesti üleslaadimine, kui dokumendid muutuvad.
Sobib kõige paremini: "Projekti teadmusbaas", mille juurde sa korduvalt naased. Isiklikud uurimisvaldkonnad. Domeenispetsiifilised assistendid (juriidiline, tehniline, sisemine ettevõtte teadmus).
Tee 3: Low-code RAG-pipeline (kõige võimekam)
Kohandatud seadistus koodita töövooplatvormi kasutades (n8n, Make) või vähese koodi tööriist (Langflow, Flowise). LangChain ise on koodipõhine raamistik, mitte koodita tööriist — aga Langflow/Flowise istuvad sarnaste ehitusklotside peal visuaalse redaktoriga. Kummalgi juhul paned RAG-pipeline'i ise kokku:
- Sissevedu: automaatne sünk sinu allikatest (Google Drive, Notion, kaust, andmebaas).
- Tükeldamine ja embedding: jaga dokumendid, loo vektor-embeddingud.
- Vektorisalvestus: Pinecone, Qdrant, Weaviate või iseserveriversioon Chroma.
- Otsing: semantiline otsing tagastab iga päringu jaoks asjakohased tükid.
- Genereerimine: tükid pluss päring lähevad LLM-ile.
- Liides: vestlus n8n-i webhooki ja kasutajaliidese kaudu või tööriistaga nagu Open WebUI.
Tugevused: Täielik kontroll. Automaatne dokumentide sünk. Kohandatud otsinguloogika. Saab kuhu tahes sisse põimida.
Piirangud: Tunde, mitte minuteid seadistuseks. Pidev hooldus. Vaja mõista tükeldamist, embeddinguid, otsingukvaliteeti.
Sobib kõige paremini: Meeskonna või osakonna teadmusbaasid. Kliendile suunatud chatbotid. Kõik, kus allikad muutuvad sageli või kus süsteem peab integreeruma teiste tööriistadega.
Kolme vahel valimine
Otsustusreegel:
Vali NotebookLM, kui: allikad on stabiilsed, sa tahad asja töötama 15 minutiga, kasutusjuhtum on õppimine või analüüs (mitte teistesse töövoogudesse põimitud).
Vali Claude Projects, kui: sa tahad pidevat assistenti jätkuvas valdkonnas (nt "kõik, mis puudutab meie Euroopa maksuvastavust"), sa hindad vestluskvaliteeti ja oled juba Claude'i kasutaja.
Vali kohandatud n8n/LangChain seadistus, kui: allikad muutuvad sageli, sa vajad automaatset sünki, sa tahad vestlust põimida teise tööriista või äppi, või sa ehitad seda meeskonnale.
Claude Projects-i ehituse läbikäik
Kuna NotebookLM-i käsitlesime eraldi, käime läbi Claude Projects RAG-ehituse, mis on enamiku keskmise taseme kasutajate jaoks õige kuldne kesktee.
Samm 1: Loo projekt. Aadressil claude.ai kliki Projects → New Project. Nimeta see valdkonna järgi (nt "EU Tax Compliance Assistant").
Samm 2: Kirjuta juhised. Siin peitub enamik väärtusest. Usaldusväärne mall:
You are a [domain] assistant for [your role/team]. Your job is to answer questions grounded in the documents I've uploaded as knowledge.
Always:
- Cite the specific document and section your answer comes from.
- Mark anything you are inferring with [my inference].
- Say "I don't have information about that" when the knowledge files don't cover the question — never invent or fall back to general knowledge unless I explicitly ask you to.
When I ask:
- A factual question: quote the specific passage.
- A how-to question: produce a step-by-step answer with references.
- A comparison: produce a table where helpful.
- An open-ended question: structure your answer with clear sections.
If documents contradict each other: surface the contradiction explicitly.
If a document is outdated (older than 2 years): mention this when citing.Samm 3: Lae dokumendid üles. Kliki "Add knowledge" ja lae üles oma PDF-id, Word-dokumendid, tekstifailid. Kuni paar tosinat dokumenti töötab hästi; rohkemate puhul kvaliteet langeb.
Paar tava:
- Eelista puhast tekstipõhist PDF-i skaneeritud PDF-ile.
- Jaga väga pikad PDF-id, kui need katavad mitut teemat. Otsing töötab paremini fokuseeritud dokumentidega.
- Märgista failinimes. "2026-04-tax-guidance-Estonia.pdf" võidab "document1.pdf-i". Claude saab failinime konteksti kasutada.
- Väldi duplikaate. Kolm versiooni samast dokumendist ajab otsingu segadusse.
Samm 4: Testi. Küsi küsimus, mille vastust sa tead. Veendu, et vastus põhineb õigel dokumendil ja viitab sellele. Kui mitte, viimistle juhiseid või dokumente.
Samm 5: Kasuta. Iga vestlus, mille sa selle projekti sees alustad, kasutab dokumente alusena. Vestlused on salvestatud projekti sees, nii et saad nende juurde tagasi tulla.
Enne allikate lisamist küsi iga dokumendi kohta:
- Kes seda dokumenti omab?
- Kas see sisaldab isikuandmeid, kliendiandmeid, paroole, lepinguid, terviseandmeid või konfidentsiaalset hinnastust?
- Kas see on vastamiseks piisavalt ajakohane?
- Kas see on autoriteetne allikas või mustand/arvamus?
- Kas see allikas peaks olema eraldi RAG-is, sest auditoorium või õigused erinevad?
Selle artikli kaasnev allikaauditi mall annab selleks kerge tabeli.
Hoia õiguste piir selge
Isiklik RAG ebaõnnestub sageli sotsiaalselt enne, kui tehniliselt. Otsing võib olla täpne, aga vale inimene võib näha vale allikat. Hoia iga RAG piiritletud auditooriumi ja õigustega:
| Piir | Turvaline muster | Riskantne muster | | --- | --- | --- | | Isiklik õppimine | Sinu märkmed ja avalikud allikad | Tööfailid segamini isiklike märkmetega | | Tiimi teadmus | Tiimi dokumendid, mida kõik tiimis näevad | Eri õigustega osakondade dokumendid koos | | Klienditugi | Heakskiidetud abidokumendid ja avalik tooteteave | Sisemised eskalatsioonimärkmed ja kliendikirjed samas korpuses | | Õigus/vastavus | Avalikud seadused, poliitikad, üle vaadatud juhised | Lepingumustandid, privilegeeritud märkmed ja avalik juhis koos |
Kui kaks auditooriumi ei tohiks näha sama allikat, ei tohiks nad jagada sama RAG-i. No-code tööriistas on eraldi projekt või märkmik tavaliselt lihtsaim õiguste mudel.
Läbitöötatud näide: isiklik õigusküsimuste assistent
Oletame, et tahad isiklikku RAG-i Eesti tööõiguse, GDPR-i ja üldise ärivastavusega seotud küsimuste käsitlemiseks.
Allikad:
- Eesti töölepingu seadus (PDF Riigi Teatajast).
- GDPR-i täistekst (PDF EUR-Lexist).
- ICO ja Andmekaitse Inspektsiooni juhenddokumendid.
- Sinu varasemad lepingud ja poliitikadokumendid.
- Paar kvaliteetset õigusblogi postitust, mis võtavad kokku levinud probleemid.
Juhised (projekti sees):
You are a legal-compliance assistant for a 50-person Estonian B2B SaaS company. Your job is to answer questions grounded in Estonian employment law, GDPR, and our internal policies.
Always:
- Cite the specific article, section, or document you're referencing.
- Mark anything you are inferring or extrapolating with [my inference].
- For GDPR questions, distinguish between hard requirements and best practices.
- For Estonian-specific employment questions, default to Estonian law unless I ask about another jurisdiction.
Always end with:
"This is informational, not legal advice. For binding interpretations, consult a qualified Estonian employment lawyer."
If a question would benefit from a lawyer's review: say so explicitly.Nüüd on sul isiklik assistent, mis vastab töö- ja GDPR-i küsimustele tegelike allikdokumentide põhjal. See ei asenda juristi — aga 80% küsimustest, millel on selged vastused allikdokumentides, on see oluliselt kiirem kui ise regulatsioonidesse kaevumine.
Levinud lõksud ja kuidas neid vältida
Paar konkreetset lõksu isiklikus RAG-is, mille otsa inimesed satuvad:
Lõks 1: aegunud dokumendid. Sa laadisid üles regulatsiooni 2023. aasta versiooni, ja 2026. aasta versioon on muutunud. RAG vastab ustavalt aegunud materjali põhjal.
Lahendus: Kuupäevasta dokumente failinimedes. Auditi perioodiliselt ja asenda. Sageli uuenevate allikate puhul kaalu automaatse sünkroniseerimisega töövooplatvormi RAG-i.
Lõks 2: madala kvaliteediga allikad. Sa laadisid üles SEO-rämpsartikleid, mis näevad autoriteetsed välja, aga sisaldavad vigu. RAG vastab nende põhjal.
Lahendus: Kureeri allikaid halastamatult. Kolm suurepärast allikat võidab kümme keskpärast. Veendu enne üleslaadimist iga allika usaldusväärsuses.
Lõks 3: skoobi laienemine. RAG oli "Eesti tööõiguse" jaoks, aga sa lisasid ka mõned üldised HR-artiklid, mõned läbirääkimisnõuanded ja paar lepingumalli. Nüüd on otsing hägusem ja vastused segavad õigusliku allika arvamuslugudega.
Lahendus: Üks projekt skoobi kohta. Ehita eraldi projektid eraldi valdkondadele.
Lõks 4: küsimused väljaspool korpust. Kasutajad (või sa) küsivad küsimusi, mida dokumendid ei kata. Mudel pöördub tagasi treeningu juurde ja hallutsineerib.
Lahendus: Tugevad juhised ("ära kunagi leiuta — ütle, et mul pole sellist infot"). Testi äärejuhtumeid. Kaalu mudeli seadistamist nii, et ta keelduks üldteadmistele tagasi pöördumast.
Lõks 5: tükeldamine loeb isegi no-code'is. Kaasaegsed no-code tööriistad käsitlevad tükeldamist automaatselt, aga kui sinu dokumendid on imelikult vormindatud (tabelid, veerud, koodiplokid), langeb otsingukvaliteet.
Lahendus: Eeltöötle, kus võimalik. Konverteeri keerukad PDF-id enne üleslaadimist puhtaks Markdowniks. Jaga väga pikad dokumendid fokuseeritud osadeks.
Testi keeldumist, mitte ainult otsingut
Enamik inimesi testib RAG-i küsimustega, millele allikad kindlasti vastavad. See tõestab ainult õnneliku tee. Testi ka küsimusi, millele korpus ei peaks vastama.
| Test | Näide | Hea käitumine | | --- | --- | --- | | Korpusest väljas | "Mis on meie 2027 hinnastrateegia?", kui hinnadokumente pole üles laaditud | Keeldub või ütleb, et korpus seda ei sisalda | | Aegunud allikas | "Mis on praegune poliitika?", kui on ainult vanad dokumendid | Mainib allika kuupäeva ja ebakindlust | | Õiguste piir | "Võta kokku kliendikaebused tugipiletitest", kui tugipileteid pole lisatud | Keeldub, mitte ei leiuta | | Vastuolu | Kaks üles laaditud dokumenti on eriarvamusel | Näitab mõlemat allikat ja küsib, kumb on autoriteetne | | Viitekontroll | "Tsiteeri jaotist, mida kasutasid" | Annab viidatud lõigu või ütleb, et ei leia seda |
Need testid eristavad dokumendiabilist enesekindlast vastusegeneraatorist, mille kõrval on lihtsalt dokumendikaust.
Üle no-code'i: millal edasi liikuda
Tuleb hetk, kus no-code RAG jõuab oma piirideni ja sa pead liikuma võimekamale seadistusele. Levinud päästikud:
Allikate maht. Sul on 500+ dokumenti ja kvaliteet langeb põhiliste üleslaadimismehhanismide juures.
Automaatne sünk. Sinu dokumendid uuenevad pidevalt (Notioni lehed, Google Docs, Slacki sõnumid, sisewikid) ja käsitsi uuesti üleslaadimine pole jätkusuutlik.
Sissepõimitud vestlus. Sa tahad, et kasutajad räägiksid RAG-iga sinu äpi, sinu Slacki, sinu veebilehe sees — mitte Claude'i kasutajaliideses.
Spetsiifilised otsinguvajadused. Sa vajad metaandmete järgi otsingu filtreerimist (osakond, dokumenditüüp, kuupäev) või hübriidotsingut (semantiline + märksõnaline) või tulemuste rerankimist.
Kulu optimeerimine. Sinu kasutus on piisavalt suur, et tokeni-kulu kontroll loeb.
Iga selle jaoks vajad kohandatud RAG-i. Järgmine samm on kas:
- n8n vektorisalvestuse noode'dega. No-code märkimisväärse kontrolliga.
- LangChain, LlamaIndex või Haystack. Pythoni teegid. Päris kood, aga hästi dokumenteeritud.
- Majutatud RAG-teenus (Vectara, Unstructured, Ragie, Pinecone'i RAG-as-a-service). Vähem kontrolli, vähem tööd.
Meil on eraldi süvendatud artikkel tootmis-RAG-i kohta. Praegu tuvasta lävi ja liigu edasi, kui sa selleni jõuad.
Mõned mustrid, mis koguvad
Mõned harjumused, mis muudavad isikliku RAG-i aja jooksul kasulikumaks:
Kureeri, ära kalla. Kiusatus on laadida üles kõike. Tegelikkus on, et rohkem ei ole parem; parem on parem. Kolm suurepärast allikat vastavad enamikule küsimustest; 50 keskpärast vastab neile halvemini.
Dokumenteeri oma skoop. Pane kirja, milleks RAG on ja mis on väljaspool skoopi. Hoia sellest kinni. Pane vastu kiusatusele mõtlematult laieneda.
Ehita väikseid eraldi RAG-e eraldi valdkondade jaoks. Üks RAG "isiklikuks juriidikaks", teine "minu firma tooteteadmusteks", kolmas "minu magistriõppe materjali jaoks". Väiksem skoop, paremad vastused.
Retesti perioodiliselt. Kord kuus küsi RAG-ilt viit küsimust, mida sa algselt testisid. Kui kvaliteet on hõljunud (uute lisatud dokumentide või mudeli muutuste tõttu), märka ja värskenda.
Kombineeri üld-AI-ga. Küsimustel, mis liiguvad RAG-i skoobi ja laiema teadmise piiril, kasuta RAG-i, et saada vastuse tõenduspõhine osa, ja vii see siis üld-AI-le laiema konteksti jaoks. See on juba mitme tööriista töövoog.
Märkus kulu kohta
NotebookLM on tasuta heldete limiitideni. Claude Projects kasutab Claude Pro / Max tellimust (~20-200 dollarit kuus sõltuvalt tasemest). Kohandatud n8n/vektor-salvestuse seadistus maksab 10-100 dollarit kuus sõltuvalt mahust, pluss sinu aeg ehitamiseks ja hoolduseks.
Enamiku üksikkasutajate jaoks on isikliku RAG-i hind sisuliselt ühe AI-tellimuse hind, pluss minimaalne marginaalne kulu salvestusele ja API-kasutusele. Tootlikkuse tasu on dramaatiline küsimustel, milleks RAG sobib.
Kokkuvõte
Isiklik RAG 2026. aastal pole enam ainult arendajate võimekus. NotebookLM annab sulle töötava RAG-i 15 minutiga. Claude Projects annab paindlikuma assistendi 30-ga. Kohandatud n8n seadistus annab täieliku kontrolli paari tunniga.
Vali oma kasutusjuhtumi jaoks õige. Kureeri allikaid hoolikalt. Häälesta juhiseid. Testi. Itereeri. Nädala jooksul on sul tööriist, mis muudab "leia sellele küsimusele vastus meie dokumentidest" 20-minutilisest ülesandest 30-sekundiliseks.
See on praegu üks võimendatumaid AI-investeeringuid ja enamik inimesi, kes võiksid sellest kasu saada, ei ole seda veel ehitanud. Vali valdkond, kus sa regulaarselt dokumentidest asju otsid, sea see nädal projekt üles ja vaata, mis muutub.