RULE-BOT 1998
Odpovídá jen na předem napsané otázky.
Vyber nahoře otázku a podívej se, jak zareaguje rigidní program.
Interaktivní průvodce · 8 kapitol
Asi za čtvrt hodiny si zkusíš, proč chatbot odpovídá tak, jak odpovídá. Žádné rovnice, žádný žargon. Jen pár sandboxů, ve kterých uvidíš, co se uvnitř AI děje.
Klasický chatbot je seznam pravidel. Moderní AI funguje jinak. Žádná pravidla, jen z miliard textů odhadla, co s čím obvykle souvisí. Tady to máš vedle sebe.
Odpovídá jen na předem napsané otázky.
Vyber nahoře otázku a podívej se, jak zareaguje rigidní program.
Odhaduje, co bys chtěl slyšet, ze všeho, co kdy četla.
Vyber nahoře otázku a podívej se, jak zareaguje moderní AI.
Klasický bot zná jen to, co někdo ručně napsal. AI hádá, co se k otázce hodí, i když ji nikdy přesně neviděla.
Tady je ten zlom. Model nezpracovává význam jako člověk. Rozseká větu na malé kousky (tokeny) a pak počítá, jaké slovo se nejspíš hodí jako další. A pak další. A další.
Klikni na slovo a věta poroste.
AI nepíše odpověď celou najednou. Skládá ji po jednom tokenu a vždy vybírá ten, co statisticky sedí nejlíp. Plynulá věta = řetěz dobrých odhadů.
Stejnou otázku můžeš položit šestnácti způsoby a dostat šestnáct různých odpovědí. Tady je sandbox: měň přepínače a sleduj, jak se odpověď proměňuje v reálném čase.
Kvalita odpovědi nezáleží jen na modelu, ale hlavně na tom, co po něm chceš. Lepší prompt = lepší výsledek.
AI nemá paměť jako ty. Vidí jen poslední kus konverzace, co se vejde do tzv. kontextového okna. Zbytek pro ni neexistuje. Posuň posuvníkem a uvidíš to.
Čím méně kontextu, tím obecnější a často horší odpověď. Když chceš dobrou odpověď, dej AI všechny souvislosti.
AI vždycky hledá pravděpodobnou odpověď, ne pravdivou. Když nemá data, hladce si je vymyslí. Vedle vidíš, jak by se měla chovat „čestnější" verze modelu.
Vyber otázku.
⚠︎ obsahuje smyšlené detailyVyber otázku.
✓ přiznaná nejistotaModel nerozlišuje mezi „znám" a „neznám". Generuje to nejpravděpodobnější pokračování věty, a když neví, vyplní mezeru tím, co vypadá věrohodně. Bez vnějších nástrojů (vyhledávání, citace) si nemá jak ověřit, jestli tvrzení odpovídá realitě.
Jistota v textu není to samé co pravda. U faktů AI vždycky ověř. Nebo se rovnou zeptej, čím si je jistá a čím ne.
Textový prompt se v modelu rozloží na atributy: co tam má být, v jakém stylu, světle a kompozici. Pak model krok po kroku skládá pixely podle naučených vzorců. Tady je zjednodušený simulátor, který ti princip ukáže.
-
Změna pár slov v promptu úplně otočí výsledek. Skutečná text-to-image AI pracuje podobně, jen místo pár vrstev má naučených miliardy vzorců.
Pět otázek. Žádné chytáky. Po každé odpovědi krátké vysvětlení, abys odcházel s jistotou, ne s tipovaným číslem.
Krátké odpovědi na to, co lidi o AI nejčastěji googlí. Když ti něco nesedí, vrať se do příslušné kapitoly výš.
ChatGPT a podobné modely neumí přemýšlet. Tvoji větu rozsekají na tokeny a postupně předpovídají, jaký token bude nejspíš následovat. Plynulá odpověď je řetěz dobrých statistických odhadů, ne logická úvaha. Viz kapitola 02.
Token je nejmenší kousek textu, se kterým AI pracuje. Někdy je to celé slovo, někdy slabika, někdy jen kousek slova. Model nepřemýšlí o významu vět, ale o pravděpodobnostech navazujících tokenů.
Halucinace je situace, kdy AI s jistotou tvrdí něco, co není pravda. Model vždycky hledá nejpravděpodobnější pokračování věty, ne pravdu. Když nemá data, vyplní mezeru tím, co zní věrohodně. Viz kapitola 05.
Prompt je text, kterým se AI ptáš nebo ji instruuješ. Kvalita odpovědi ohromně závisí na kvalitě promptu. Stejnou otázku můžeš zformulovat desítkou způsobů a dostat desítku různých odpovědí. Vyzkoušej si to v kapitole 03.
Kontextové okno je množství textu, které AI vidí v jednom dotazu. Vše, co se do něj nevejde, pro model neexistuje. Proto AI ztrácí přehled v dlouhých konverzacích, pokud jí starší zprávy nepřipomeneš. Viz kapitola 04.
Moderní velké modely (GPT-4o, Claude, Gemini) zvládají češtinu velmi dobře, protože byly trénované i na obrovském množství českých textů. U menších a starších modelů kvalita češtiny rychle klesá.
Velké jazykové modely se učí na miliardách textů z internetu, knih a dalších zdrojů. Při tréninku se model snaží předpovídat zakryté tokeny, díky čemuž si zafixuje statistické vzorce jazyka. Po základním tréninku přichází fáze ladění podle lidských preferencí.
Text-to-image modely (Midjourney, DALL-E, Stable Diffusion) prompt rozloží na atributy a postupně přeměňují náhodný šum na obraz odpovídající zadání. Pracují s naučenými vzorci miliard obrázků z internetu. Princip simuluje kapitola 06.
Záleží na produktu a tarifu. U bezplatného ChatGPT, Gemini i Claude se může to, co zadáš, dostat do tréninkových dat (často to lze v nastavení vypnout). Placené API a firemní tarify mají v podmínkách napsáno, že tréninková data odtud neberou. Praktické pravidlo: nikdy do veřejné AI nevkládej věci, které by neměly opustit firmu - hesla, smluvní data, klientské tabulky, zdrojáky. Co se jednou dostane do modelu, už zpátky nedáš.
Model má tzv. knowledge cutoff - datum, kdy skončil jeho trénink. Vše po tomto datu pro něj neexistuje, dokud někdo nepustí nový trénink. Některé chatboty (ChatGPT, Claude, Gemini) umí v reálném čase sáhnout do vyhledávače - pak ti aktuální data dohledají, ale samy je „vědomě" neznají. Když ti AI odpovídá o nedávné události, ptej se, odkud čerpá.