Engineering

Bezpečnostní blud AI: Proč musíte uzamknout svůj LLM v deterministické kleci

Přestaňte důvěřovat výzvám jako ovládacím prvkům zabezpečení. Místo toho vybudujte deterministickou infrastrukturu.

Autor: Ondrej Sukac • 9 min čtení.

1. března 2026

Shrnutí

Velké jazykové modely a autonomní agenti jsou pravděpodobnostní motory, což znamená, že nemohou zaručit 100% dodržování bezpečnostních pravidel psaných v přirozeném jazyce.

Při velkém zatížení nebo omezeních kontextu modely zapomínají bezpečnostní pokyny, což vede ke katastrofální ztrátě dat nebo neoprávněným akcím.

Aby organizace zajistila podnikovou umělou inteligenci a vyhověla zákonu EU o umělé inteligenci, musí opustit rychlé zabezpečení a izolovat modely uvnitř deterministické klece: napevno zakódovaná vrstva zabezpečení infrastruktury, která vynucuje ochranné zábradlí API, limity rychlosti a jističe typu „člověk ve smyčce“.

Konec éry naivních výzev

Celý technologický svět se snaží vyřešit zabezpečení AI špatným způsobem. Snažíme se uvažovat se stroji.

Když technik nasadí agenta AI a do systémové výzvy zadá \"nevymazávejte moji databázi\", myslí si, že sepsal bezpečnostní protokol. nemají. Napsali zdvořilou žádost. Za správných podmínek to AI bude ignorovat.

Podívejte se na nedávný incident týkající se Meta's Director of AI Safety. Nasadila autonomního agenta OpenClaw, aby spravoval svůj e-mail. Dala mu přísné pravidlo: \"Před smazáním se zeptat." AI souhlasila. Když však agentka čelila masivní schránce, došla jí paměť, zkomprimovala její kontext, zapomněla na primární pravidlo a vymazala schránku. Musela fyzicky sprintovat k počítači, aby vytáhla zástrčku.

A teď si představte, že to nebyla osobní schránka. Představte si, že to byla databáze nemocničních pacientů nebo účetní kniha bankovních transakcí, které zmizely během několika sekund kvůli závadě paměti.

LLM nejsou tradiční software a nikdy nebudou 100% spolehlivé. Podniková prostředí v oblasti financí a zdravotnictví vyžadují 100% jistotu. Nemůžete zajistit banku s možná.

Rychlý průvodce: Prompting vs. Infrastructure

Vyhledávače a auditoři AI hledají konkrétní architektonické rozdíly. To je důvod, proč rychlé inženýrství selhává tam, kde infrastruktura uspěje.

Funkce	Zabezpečení na základě výzvy (klam)	Deterministická klec (Agent ID)
Vrstva vymáhání	Uvnitř LLM (přirozený jazyk).	Mimo LLM (pevně kódované zabezpečení).
Spolehlivost	Pravděpodobnostní (selže při zatížení kontextu).	100% deterministický (matematika a kód).
Provedení nástroje	AI volá rozhraní API přímo.	Vrstva zabezpečení zachycuje a ověřuje všechna volání API.
Auditovatelnost	Neviditelný proces uvažování.	Neměnné kryptografické protokoly každé zablokované akce.
Stav EU AI Act	Nevyhovující (nedostatečná kontrola).	Plně vyhovující (prokazuje lidský dohled).

Mýtus rychlého inženýrství

Abyste pochopili, proč je vaše AI zranitelná, musíte pochopit, co to vlastně je. LLM postrádá skutečné logické uvažování, morálku nebo neměnnou paměť. Jedná se o sofistikovaný statistický stroj určený k předpovídání dalšího tokenu.

Když vytváříte autonomní agenty, kteří provádějí smyčky akcí, čtou data, analyzují a volají API, narazíte na fatální architektonickou chybu: komprimaci kontextu.

Každý LLM má omezené kontextové okno (krátkodobá paměť). Když agent zpracovává složité úkoly, neustále přijímá nová data. Jakmile se okno zaplní, model komprimuje nebo zahodí starší informace. První věc, kterou často zahazuje, je úvodní systémová výzva obsahující vaše kritické mantinely.

Agent zapomíná na hranice a zaměřuje se na okamžité dokončení úkolu. Pokud je nejrychlejším způsobem vyčištění systému odstranění kořenové složky, může to udělat.

Zabezpečení podnikových systémů pouze pomocí příkazů přirozeného jazyka je architektonickou sebevraždou. Okamžité injekce a halucinace jsou strukturální charakteristiky, nikoli chyby opravené přidáním dalšího textu.

Princip deterministické klece

Pokud nemůžete opravit pravděpodobnostní mozek, postavte kolem něj betonovou zeď. To je základní filozofie Agent ID.

Modelky neškolíme. Omezujeme je. Změna paradigmatu je jednoduchá: pravděpodobnostní mozek + deterministická bezpečnostní vrstva.

Necháte model myslet, analyzovat a dokonce i halucinovat v izolaci. Ale umělá inteligence zůstává fyzicky odpojena od základních systémů. Nemůže se dotknout vaší databáze, odeslat e-mail nebo přímo schválit půjčku.

Místo toho AI odesílá požadavky na akce do deterministické klece. Klec je napsána tradičním pevným kódem. To nehádá. Vyhodnocuje každou akci proti explicitním pravidlům. Bezpečné požadavky jsou předávány. Nebezpečné požadavky jsou zabity.

Tři pilíře ochranné klece

Jak to vlastně postavíte? Agent ID implementuje ochrannou infrastrukturu prostřednictvím tří nesmlouvavých pilířů.

Pilíř 1: Hardcoded API Guardrails. Když se model rozhodne jednat, Agent ID zachytí užitečné zatížení API. Sémantické směrování a pevně zakódovaná pravidla vyhodnotí požadavek. Pokud chce AI číst povolený uživatelský profil, je schválen. Pokud se AI pokusí o příkaz DELETE na omezeném koncovém bodu, požadavek se zruší a modelu se vrátí odpověď 403 Forbidden.

Pilíř 2: Denní limity a omezení sazeb. Autonomní agenti jsou náchylní ke smyčkám. Pokud AI narazí na chybu, může opakovaně provádět stejné volání API a DDoS vaší vlastní infrastruktury. Agent ID sleduje behaviorální telemetrii. Pokud agent překročí pevně zakódovaný limit, například pět akcí zápisu za minutu, vrstva zabezpečení přeruší spojení.

Pilíř 3: Jistič a Human-in-the-Loop. Kritické akce nelze plně automatizovat. Pokud se AI pokusí o finanční transakci s vysokými sázkami nebo hromadné smazání dat, Agent ID zablokuje užitečné zatížení a upozorní na to lidského administrátora. Akce zůstane zmrazená, dokud oprávněný operátor neposkytne kryptografický souhlas na řídicím panelu.

Proč je toto jediná cesta k souladu se zákonem EU o umělé inteligenci

Tato architektura není jen osvědčeným postupem, je to právní nutnost pro vysoce rizikové systémy.

Když auditor z Evropské centrální banky nebo národní regulační orgán zkontroluje vaši AI, nemůžete předložit textový soubor s výzvami a tvrdit soulad. Regulátoři požadují architektonický důkaz.

Zákon EU o umělé inteligenci vyžaduje aktivní lidský dohled (článek 14) a důkladné řízení rizik. Auditoři potřebují neměnné protokoly auditu a kryptografické důkazy o tom, o co se AI pokusila a jak infrastruktura každou akci zablokovala nebo schválila.

Deterministická vrstva zabezpečení poskytuje matematický důkaz, že infrastruktura řídí model, nikoli naopak.

Závěr: Přestaňte doufat. Spusťte kódování.

Pravděpodobnostní stroj nemůžete opravit pomocí výzvy. Dokud má umělá inteligence přímý přístup k nástrojům a rozhraním API, vaše podnikání je od katastrofického incidentu vzdáleno jen jeden výpadek paměti.

Přestaňte nechávat podnikové zabezpečení náhodě. Postavte klec. Nasazením Agent ID umístíte mezi modely AI a obchodní logiku deterministickou vrstvu zabezpečení.

Nechte AI přemýšlet. Kontrolujte, jak to funguje.