Privát AI vállalatoknak: miért és hogyan futtass saját LLM-et házon belül (akár teljesen internet nélkül)?

Képzeld el a helyzetet: a CFO rád ír Teamsen, hogy „küldd át a 2026-os árazási logikát, meg a top 20 ügyfél szerződésének kivonatát, és kérlek, nézesd át AI-val”.

Te pedig ott ülsz, és két gondolat csap össze a fejedben:

„Ez mennyire lenne gyors egy ChatGPT-szerű felhős megoldással.”
„És ezt vajon tényleg ki merem engedni a céges hálóból?”

Na, itt kezdődik a privát AI története. Nem hype, nem divat — hanem egy nagyon prózai kérdés: hol vannak az adataid, és ki férhet hozzájuk?

Felhő vs. házon belüli LLM: ugyanaz a „varázslat”, nagyon más kockázattal

Van egy félreértés, amit sok nagyvállalatnál látok: „ha egy AI okos, akkor biztos csak a felhőben lehet”. 2026-ban ez már egyszerűen nem igaz.

Mit kapsz a felhőben (OpenAI és társai), ami tényleg csábító?

A felhő olyan, mint egy bérelt Forma–1-es autó: azonnal gyors, nem te szervizeled, és általában brutál jó a teljesítmény.

Top modellminőség: erős általános képességek, sok esetben multimodális (szöveg+kép+hang) workflow-k.
Gyors bevezetés: nem kell GPU-t vadászni, nem kell MLOps csapatot felépíteni.
Skálázás: ha holnap 10× akkora terhelés jön, jellemzően „csak” pénz kérdése.

A gond? A Forma–1-es autóval közúton mész. És a közút itt az internet.

Mit kapsz házon belül (Ollama, Llama 3 alapú modellek), amiért sokan váltanak?

A házon belüli (on-prem) LLM olyan, mint egy saját páncélszobában tartott dokumentumtár: a kulcs nálad marad.

Adatkontroll: a promptok, a dokumentumok, a válaszok nem hagyják el a vállalati környezetet.
Saját szabályok: logolás, jogosultság, titkosítás, retention policy — mind a te IT-biztonsági standardod szerint.
Air-gapped lehetőség: ha kell, nulla internet (igen, tényleg).

Őszintén: a házon belüli megoldás bonyolultabb, és ritkán lesz „kattintásra kész”. De cserébe olyan kockázatokat veszel ki a képletből, amik egy nagyvállalatnál nem „ha”, hanem „mikor” alapon fájnak.

Mi az az air-gapped AI, és miért szeretik a biztonságos iparágak?

Az air-gapped annyit jelent, hogy a rendszer fizikailag el van választva az internettől. Nem „tűzfal mögött van”, nem „VPN-en át megy” — hanem nincs út kifelé.

Kicsit olyan, mint amikor a legkritikusabb tervrajzot nem emailben küldözgetik, hanem egy zárt szobában, beléptetővel nézik.

Mikor indokolt a teljes internetmentesség?

Tipikusan akkor, amikor:

üzleti titkok (árazás, tenderstratégia, M&A anyagok) kerülnek a rendszerbe,
szabályozott adat van játékban (pl. pénzügy, egészségügy, kritikus infrastruktúra),
a kockázat nem reputációs szinten fáj, hanem jogi és milliárdos szinten.

„De hát akkor az AI nem frissül, nem tanul!”

Ez az a pont, ahol sokan félrecsúsznak.

Egy LLM-et nem úgy „tanítasz” vállalati adatokkal, hogy ráöntöd az összes belső doksit és majd okos lesz.

A gyakorlatban a legtöbb vállalati use case-hez RAG kell (Retrieval-Augmented Generation): a modell válaszol, de közben visszakeres a belső tudástárból, és abból dolgozik.

Ha ezt a logikát szeretnéd tisztán megérteni, itt egy jó kapaszkodó: a Generative Engine Optimization (GEO): A SEO új korszaka cikkünkben közérthetően le van bontva, miért lett a RAG a „keresés és válaszadás” új alapmintája.

Mini sztori: „nem történt semmi”, aztán mégis

Egy nagyvállalati IT-security vezető mondta egyszer:

„Nem az a baj, hogy ellopták az adatot. Az a baj, hogy sosem tudom biztosan, hogy nem.”

A felhős használatnál sokszor nem az a para, hogy a szolgáltató „rossz”, hanem hogy a támadási felület nagyobb: több integráció, több hozzáférés, több emberi hiba.

Összefoglalva: az air-gapped AI nem mindenkinek kell — de ahol kell, ott nagyon kell.

Hogyan néz ki egy vállalati privát LLM architektúra a valóságban?

Ne úgy képzeld, hogy „felrakunk egy modellt és kész”. Ez inkább olyan, mint egy jó belső ügyfélszolgálat felépítése: kell hozzá tudásbázis, jogosultság, naplózás, és egy csomó apró „mi van, ha…” szabály.

A modell (LLM) – például Llama 3 futtatva Ollamával

2026-ban a „helyi LLM” tipikus belépője:

Ollama: egyszerű futtatás, verziózás, modellek menedzselése.
Llama 3-alapú modellek (különböző méretek/finomhangolások): jó általános kiindulópont, főleg ha nem regényt íratsz, hanem üzleti feladatokat oldasz.

Őszinte rész: ha nagyon magas minőséget akarsz minden feladatban, a felhő gyakran előnyben lesz. De a vállalati belső asszisztensnél sokszor nem „irodalmi Nobel” kell, hanem:

pontos belső információ,
ellenőrizhető hivatkozás,
jogosultságok betartása.

A „titkos fegyver”: RAG + vektoradatbázis

Ha van egy LLM-ed, attól még nem fogja ismerni a te belső folyamataidat. A RAG abban segít, hogy a modell a kérdéshez releváns belső dokumentumokat megtalálja.

Itt jön be a vektoradatbázis: ez olyan, mint egy extra okos keresőindex, ami nem kulcsszavak alapján, hanem jelentés alapján talál.

Ha kíváncsi vagy, ez miért lett 2026-ra ennyire alap, itt van hozzá egy közérthető háttér: Mi az a Vector Database és miért lesz a GEO új alapja?

Tudásbázis és governance: különben káosz lesz

A „privát AI” sok helyen ott csúszik el, hogy mindenki ráönt mindent: régi PDF-eket, ellentmondó SOP-kat, félkész policy-ket.

Az AI pedig… hát, udvariasan szólva is: szépen fogja összekeverni.

A megoldás nem varázslat, hanem szervezet:

mi számít „single source of truth”-nak,
ki frissítheti,
mi a verziókezelés,
mi a jóváhagyási folyamat.

Ebben sokat segít, ha van egy rendes vállalati Knowledge Base (nem csak egy mappastruktúra). Ehhez ajánlom: Knowledge Base a vállalatirányításban: hogyan építsd be a szervezetbe, és hol hoz azonnali üzleti értéket?

Összefoglalva: a modell csak egy motor. A kormány, fék, szabályok és útvonalterv a rendszer többi része.

Adatszivárgás: a leggyakoribb „nem is gondoltunk rá” pontok

Na, beszéljünk a kellemetlen részről. Az adatszivárgás nem mindig „hack”. Sokszor csak egy ártatlannak tűnő döntés.

Promptok, logok, és a „majd később rendbe tesszük” csapda

Ha egy AI-rendszer logol (márpedig sokszor kell), akkor a logokban ott lehet:

üzleti titok,
ügyféladat,
belső azonosító,
szerződésrészlet.

Ezeket ugyanúgy védeni kell, mint az eredeti dokumentumot. Titkosítás, hozzáférés, retention — nincs kibúvó.

Jogosultságkezelés: az AI ne legyen „mindenki mindent lát” kapu

A legjobb privát LLM is veszélyes, ha:

a RAG indexbe minden belekerül,
és a chatbot mindenkinek mindent kiad.

A jó minta: a felhasználó csak azt a dokumentumot „találhatja meg” az AI-val, amihez amúgy is hozzáférése van.

„Plugin chatbot” vs. céges tudásra épített belső asszisztens

Sokan ott hibáznak, hogy vesznek egy kész, pluginos chatbotot, aztán csodálkoznak, hogy vagy nem tud semmit, vagy túl sokat tud (rossz helyről).

A vállalati érték jellemzően ott van, ha a bot a saját tudásodra támaszkodik, és nem csak „szép szöveget generál”. Erről írtunk bővebben itt: Valós (RAG) alapú chatbot fejlesztés: mit kapsz egy „plugin chatbottal”, és miért éri meg céges tudásra építeni?

Extra kontroll: mit „tanulhat meg” rólad egy AI?

Még ha házon belül is futtatsz mindent, a vállalat kommunikációja kifelé (weboldal, dokumentáció, nyilvános anyagok) ugyanúgy „táplálék” a külső modelleknek.

Ezért fontos téma, hogy mit engedsz indexelni/hasznosítani. Jó gyakorlati kiindulópont: Az llms.txt bemutatása: Hogyan szabályozd, mit tanulhat meg rólad egy AI?

Összefoglalva: a legtöbb szivárgás nem hollywoodi. Inkább „egy rossz jogosultság”, „egy túl bő log”, „egy túl kényelmes integráció”.

Konklúzió

Ha biztonságtudatos nagyvállalat vagy, a kérdés nem az, hogy használsz-e AI-t, hanem az, hogy milyen kontroll mellett. A felhő gyors és erős, a házon belüli (akár air-gapped) LLM pedig azt adja vissza, ami a legtöbb cégnél a legdrágább: bizalom az adatútvonalban.

Következő lépésnek azt javaslom: válassz ki 1-2 „nagy értékű, de kezelhető” use case-t (pl. belső policy Q&A, tenderdoksi-összefoglalás, IT incident tudásbázis), és csinálj egy privát pilotot — előbb jogosultságokkal és logolással, utána csillogó funkciókkal.

GYIK

Mennyibe kerül egy házon belüli LLM 2026-ban?

Attól függ, milyen terhelés és milyen válaszminőség kell. A költség tipikusan három részből áll: hardver (GPU-s szerverek), üzemeltetés (monitoring, frissítések, biztonság), és a tudásréteg (RAG/vektoradatbázis + dokumentumfeldolgozás). Pilotot gyakran lehet egy kisebb кластерrel elindítani, de nagyvállalati szinten a TCO-t érdemes 2–3 évre számolni.

Lesz olyan jó a helyi modell, mint a felhős?

Általános kreatív feladatokban sokszor a felhő előnyben van. Vállalati környezetben viszont a „jó” gyakran azt jelenti: pontos, visszakereshető, jogosultság-kompatibilis válasz. RAG-gel és jó tudásbázissal a helyi rendszer üzletileg nagyon erős lehet, még ha nem is ez írja a legszebb marketing-szöveget.

Mitől lesz tényleg „air-gapped” egy AI rendszer?

Nem attól, hogy „nem hív API-t”. Akkor air-gapped, ha hálózati szinten sincs internet-kapcsolat (és ezt ellenőrzött módon tartjátok). Emellett kell offline frissítési folyamat, csomag- és modell-ellenőrzés, valamint szigorú hozzáférés-kezelés a belső hálón belül is.

Mi a leggyakoribb hiba privát LLM bevezetésnél?

A „rakjunk bele minden dokumentumot” megközelítés. Ettől nem okosabb lesz, hanem zavarosabb. Kell tudásgazdák kijelölése, verziózás, és egy olyan RAG réteg, ami minőségileg szűr (különben az AI magabiztosan fog rossz választ adni).

Hogyan bizonyítom auditon, hogy nem szivárog adat?

Olyan kontrollokkal, amiket az auditor ért: hálózati szeparáció (air-gap vagy szigorú egress), titkosítás (at-rest/in-transit), naplózás és hozzáférési audit trail, jogosultság-öröklés a dokumentumforrásból a RAG indexig, valamint dokumentált adatmegőrzési és törlési szabályok.