Cele mai multe companii romanesti care vor sa foloseasca AI peste documentele lor interne se opresc in fata aceleiasi intrebari: cum trimit contractele, procedurile sau corespondenta clientilor catre ChatGPT fara sa incalc GDPR sau cerintele NIS2? Raspunsul nu este sa renunti la AI - este sa muti AI-ul in interiorul perimetrului tau de date.
Construim infrastructura AI privata: RAG peste documentele clientului, LLM-uri open weights (Llama 3, Mistral, Qwen, DeepSeek) rulate self-hosted cu Ollama sau vLLM, vector DB Qdrant sau pgvector si integrare directa cu Active Directory, Exchange si SharePoint. Daca un Azure tenant privat este acceptabil, integram Azure OpenAI cu retentie zero. Diferenta fata de serviciul nostru de Agenti AI si Automatizare este simpla: acolo agentul executa actiuni in sisteme externe folosind API-uri LLM publice; aici scopul este sa raspunda pe baza documentelor interne, fara ca acele documente sa paraseasca reteaua. Practica de baza in AI/Azure este confirmata de certificarea Microsoft Certified: Azure AI Fundamentals a fondatorului (vezi /despre-noi#certificari); peste 30 de ani de experienta senior-led in integrari Microsoft (Active Directory, Exchange, SharePoint, SQL Server) aduc fundatia tehnica pentru aceste deployment-uri.
AI peste documentele tale interne nu inseamna sa le trimiti pe internet. Inseamna sa aduci modelul in reteaua ta.
Ce include
- RAG peste documente interne: PDF, Word, Excel, PowerPoint, email .pst/.eml, intranet, baze de cunostinte
- LLM self-hosted cu Ollama sau vLLM: Llama 3, Mistral, Qwen, Phi-3, DeepSeek (7B pana la 70B+)
- Vector databases self-hosted: Qdrant (preferat), pgvector pe PostgreSQL existent, Weaviate, ChromaDB
- Embedding-uri locale cu suport limba romana: bge-m3, multilingual-e5, e5-mistral
- Integrare cu Active Directory si Entra ID pentru SSO si filtrare per permisiuni utilizator
- Conectori pentru Microsoft Exchange, SharePoint on-prem si Online, fileshare SMB, SQL Server, PostgreSQL
- Guardrails si filtre PII (Microsoft Presidio, LLM Guard) inainte ca datele sa ajunga la model
- Audit log complet al interogarilor, surselor citate si raspunsurilor, retentie configurabila pentru NIS2
- Deployment on-premise pe Hyper-V sau Proxmox, sau in Azure tenant privat (Azure OpenAI, Azure AI Foundry)
- Sizing hardware: CPU-only pentru modele 7-13B cuantizate, GPU NVIDIA (RTX 4090, L40S, H100) pentru 70B+
- Evaluation harness cu seturi de teste in limba romana pentru detectarea regresiilor la fiecare update
Beneficii pentru companie
- Datele nu parasesc reteaua clientului - by-design pentru entitati NIS2 esentiale, medical si financiar
- Conformitate GDPR fara DPA separat cu furnizor LLM extern
- Cost predictibil: CapEx hardware plus electricitate, fara surprize la facturarea token-urilor API
- Control complet pe model, prompt-uri si versiuni - fara breaking changes impuse de furnizor
- Integrare nativa cu stack-ul Microsoft existent (AD, Exchange, SharePoint, SQL Server)
- Citari cu sursa pentru fiecare raspuns - utilizatorul vede din ce document a venit informatia