Privaatsuse algkursus: mida ChatGPT mäletab, näeb ja jagab
Aus vaade sellele, mida AI-assistendid sinu andmetega tegelikult teevad: mida salvestatakse, mida kasutatakse treenimiseks, mida privaatsusseaded päriselt tähendavad ja millised kolm muudatust tasub täna ära teha.
Outcome: Otsusta, milliseid tööandmeid on AI-tööriistades ohutu kasutada ja millised vajavad rangemaid kontrolle.
Enamik AI privaatsuse arutelusid on kas liiga paanikat tekitavad ("nad salvestavad kõike, mida sa ütled!") või liiga hooletud ("ära lihtsalt midagi tähtsat sisse kopeeri"). Kumbki ei aita. See artikkel on rahulik kesktee: mida need süsteemid sinu andmetega tegelikult teevad, mida privaatsusseaded päriselt tähendavad ja millised kolm muudatust tasub täna ära teha.
Keskendume ChatGPT-le, sest seda kasutatakse kõige rohkem. Sama loogika kehtib peaaegu samamoodi ka Claude'i, Gemini ja Copiloti puhul.
Mida salvestatakse
Kui kasutad ChatGPT-d või mõnda muud suurt AI-assistenti, salvestatakse vaikimisi järgmised asjad:
- Iga sinu saadetud sõnum ja iga vastus.
- Kõik failid, mille üles laadid: PDF-id, pildid, tabelid ja muu.
- Häälrežiimi kasutamisel helisalvestused.
- Osa tehnilisi metaandmeid: IP-aadress, seade, aeg, kasutatud mudel.
- Kõik, mida palud ChatGPT-l enda kohta mäletada, kui mälu on sisse lülitatud.
See ei ole AI-le ainuomane. Peaaegu iga pilveteenus salvestab sinu tegevust mingil kujul. Küsimus on selles, mis selle salvestatud infoga edasi juhtub.
Käsitle salvestamist, treenimist, mälu ja vestluste ajalugu nelja eraldi küsimusena. Treenimise väljalülitamine ei tähenda, et teksti poleks kunagi salvestatud. Mälu väljalülitamine ei kustuta vanu vestlusi.
Mida kasutatakse treenimiseks
Siin saab enamik inimesi asjast valesti aru. See, kas sinu vestlusi kasutatakse tulevaste AI-mudelite treenimiseks, sõltub kasutatavast paketist ja sinu valitud seadetest.
Free ja Plus paketid vaikimisi: sinu vestlusi võidakse kasutada tulevaste mudelite parandamiseks, kui sa ei ole sellest loobunud. Praktikas võib OpenAI lasta inimülevaatajatel hinnata väikest valimit vestlustest ning koondatud andmed võivad mõjutada tulevast treenimist.
Free ja Plus paketid, kui oled loobunud: selle saad välja lülitada teekonnal Settings -> Data Controls -> "Improve the model for everyone." Kui see on väljas, ei kasutata sinu vestlusi mudelite treenimiseks. Need on endiselt salvestatud, et leiaksid need vestluste ajaloost, kuid neid ei saadeta tagasi treeningandmetesse.
ChatGPT Team ja Enterprise: vestlusi ei kasutata treenimiseks. See on lepinguline garantii, mitte lihtsalt seade. Kui tööandja maksab Team või Enterprise paketi eest, on töövestlused sinu organisatsiooni sees privaatsed.
API kasutus: sama nagu Enterprise - API liiklust ei kasutata vaikimisi treenimiseks.
Claude'i, Gemini ja teiste suuremate pakkujate puhul on üldine muster sarnane, kuigi vaikeseaded võivad erineda. Kontrolli alati konkreetse pakkuja andmepoliitikat.
Mida mälu teeb
Mälu on treenimisest eraldi funktsioon. Kui mälu on sisse lülitatud, jätab ChatGPT vestluste üleselt meelde teatud faktid sinu kohta: nime, töö, eelistused ja muud asjad, mida oled palunud tal mäletada. Neid kasutatakse vastuste isikupärastamiseks, et sa ei peaks iga kord kõike uuesti seletama.
Sa saad:
- mälu sisse või välja lülitada (Settings -> Personalisation -> Memory);
- vaadata täpselt, mida on meelde jäetud ("Manage memory");
- kustutada üksikuid mälestusi või tühjendada kõik;
- paluda vestluses midagi meelde jätta või unustada, näiteks: "Pea meeles, et töötan Eesti pangas."
Mälu on mugav. Samas on see lihtsaim viis isikliku info AI salvestusse lekkimiseks. Kui räägid ChatGPT-le midagi privaatset, et vastus oleks isikupärasem, elab see fakt mälus seni, kuni selle kustutad. Kui jagad kontot kellegagi, võib ta sinu mälestusi näha. Kui vahetad kontot, mälestused kaasa ei tule.
Tööl on turvalisem vaikimisi kitsam hoiak: ära salvesta mällu klientide nimesid, konfidentsiaalseid projektinimesid, sisemisi finantsandmeid ega töötajate privaatseid detaile. Pane korduvad eelistused custom instructions'isse; tundlik kontekst pane ainult konkreetsesse heakskiidetud töövestlusse, kus seda on vaja.
Mida vestluste ajalugu teeb
Vestluste ajalugu tähendab täpselt seda, mida nimi ütleb: kõik vestlused salvestatakse külgribale ja on otsitavad. See on treenimisest ja mälust eraldi. See on kasulik, sest saad kolme nädala taguse mustandi juurde tagasi minna ja tööd jätkata. See on ka andmejälg. Kui keegi saab sinu kontole ligi, võib ta lugeda kõiki sinu varasemaid vestlusi.
Sa saad:
- kustutada üksikuid vestlusi külgribalt;
- lülitada vestluste ajaloo täielikult välja (Settings -> Data Controls). Kui see on väljas, vestlusi ei salvestata ega näidata külgribal; need kaovad akna sulgemisel. See sobib tundlike ühekordsete küsimuste jaoks;
- eksportida kõik oma andmed (Settings -> Data Controls -> Export) - allalaaditav arhiiv kõigest.
Kolm seadet, mida tasub täna muuta
Sa ei pea OpenAI tervet privaatsuspoliitikat läbi lugema. Kolm muudatust, mis parandavad privaatsust kõige rohkem, on järgmised.
1. Lülita välja "Improve the model for everyone." Settings -> Data Controls. See peatab sinu vestluste kasutamise tulevaste mudelite treenimiseks. See ei maksa midagi. Soovitatav kõigile, kes vahel kopeerivad sisse tööalast sisu, isiklikke küsimusi või midagi, mida nad ei tahaks võõrale inimesele näidata.
2. Otsusta, kas mälu peaks olema sees või väljas. Settings -> Personalisation -> Memory. Kui kasutad ChatGPT-d peamiselt isiklikult ja sulle meeldib isikupärastamine, võib mälu sisse jääda, aga vaata aeg-ajalt üle, mida see mäletab. Kui oled privaatsuse suhtes ettevaatlik või kasutad sama kontot nii isiklikuks kui tööks, lülita mälu välja - vajaliku konteksti saad alati ühes promptis anda.
3. Puhasta aeg-ajalt vestluste ajalugu. Ava külgriba ja kustuta vestlused, mida enam ei vaja, eriti tundlikud. Tõeliselt tundlike ühekordsete vestluste jaoks kasuta Temporary Chat'i ehk mudelivaliku juures olevat läbikriipsutatud silma ikooni; seda ei salvestata ega kasutata treenimiseks.
Isiklikuks kasutuseks ongi see kogu põhiline privaatsusseadistus. Kokku umbes kaks minutit.
Isiklik konto või töökonto
Peamine viga on nende segamine. Isiklik konto sobib õppimiseks, avaliku info töötlemiseks, isiklikeks mustanditeks ja kahjututeks näideteks. Tööandja heakskiidetud konto on vajalik siis, kui sisu kuulub sinu tööandjale, klientidele, töötajatele, partneritele või reguleeritud protsessile.
| Andmetüüp | Isiklik konto | Tööks heakskiidetud konto | | --- | --- | --- | | Avalik blogipostitus või veebitekst | Tavaliselt sobib | Sobib | | Privaatpäevik, tervisemärkmed, pereandmed | Pigem väldi, välja arvatud ajutiselt ja vajadusel | Tavaliselt ei ole tööjuhtum | | Klientide nimed, e-postid, tugiajalugu | Ei | Ainult kui see on selle andmeklassi jaoks heaks kiidetud | | Lähtekood, lepingud, finantsid, strateegiadokumendid | Ei | Ainult ettevõtte poliitika järgi | | Anonüümitud näidisandmed | Tavaliselt sobib | Sobib |
Selle artikliga seotud kontrollnimekiri muudab selle 30-sekundiliseks otsuseks.
Mis jääb ikkagi riskiks
Isegi kui kõik kolm seadet on õigesti paika pandud, on tarbijakontol riske, mida sa täielikult ei kõrvalda.
Kohtukutsed ja õiguslikud nõuded. Nagu iga pilveteenus, võivad AI-pakkujad olla kohustatud kasutajaandmeid kohtu korraldusel üle andma. Üksikkasutaja puhul on see harv, aga päris.
Sisemine ligipääs. Osa volitatud pakkuja töötajaid võib kasutajaandmetele ligi pääseda toe või ohutuse töövoogudes. Suurtel pakkujatel on ligipääsukontrollid ja auditid, aga aus vastus on "mõned inimesed, mõnikord, logidega", mitte "mitte keegi, mitte kunagi".
Tulevased poliitikamuudatused. See, mida salvestatakse, kui kaua hoitakse või milleks kasutatakse, võib muutuda. Loe e-kirju, kui pakkuja oma poliitikat uuendab.
Konto ülevõtmine. Kui keegi saab sinu kontole ligi, saab ta lugeda vestlusi, näha mälestusi ja esineda sinu nimel AI ees. Kasuta tugevat unikaalset parooli ja kaheastmelist autentimist.
Tööandmete puhul - kliendiinfo, lähtekood, finantsandmed, terviseandmed, GDPR-i või tööandja poliitikaga kaetud sisu - ei ole tarbijataseme seaded piisav garantii. Kasuta ettevõtte heakskiidetud paketti või ära kleebi seda sisse. Kiire ChatGPT teene ei ole andmelekke riski väärt.
Lihtne mõttemudel
Kasulik küsimus iga asja kohta, mille plaanid AI-sse panna:
"Kas mul oleks piinlik või probleem, kui täpselt see tekst ilmuks aasta pärast lekkinud andmebaasis?"
Kui vastus on jah - see on privaatne, tuvastatav, konfidentsiaalne või tundlik -, peatu. Redigeeri see enne sisestamist anonüümseks, kasuta tugevamate andmekaitsegarantiidega kontot või ära lisa seda üldse.
See ei ole üleskutse paranoiaks. Tarbija-AI privaatsusintsidentide baasrisk on madal. Aga selle küsimuse küsimine ei maksa peaaegu midagi ja sisukategooriad, mille puhul see loeb, on ilmsed.
Konkreetne märkus Euroopa kasutajatele
Kui oled EL-is, kohaldub AI-pakkujate andmetöötlusele GDPR. Sul on õigus küsida, milliseid andmeid sinu kohta hoitakse, paluda nende kustutamist ja mõnel juhul piirata töötlemist. OpenAI-l, Anthropicil ja Google'il on GDPR-i päringute jaoks vastavad lehed ja vormid. Praktiline mõte on lihtne: kui tahad kunagi konto täielikult kustutada lasta, saad seda taotleda ja pakkuja peab nõuet järgima.
Kokkuvõte
AI privaatsus ei tähenda "nad luuravad sinu järel" ega ka "kõik on korras, ära muretse". See tähendab: sul on kolm päriselt olulist seadet - treenimine, mälu, ajalugu -, üks mõttemudel - kas mind häiriks selle lekkimine - ja üks reegel tööandmete jaoks: kasuta ettevõtte paketti või ära kleebi andmeid sisse.
Võta täna viis minutit ja tee need kolm muudatust ära. Siis saad AI-d edasi kasutada teadlikult, mitte pimesi.