Suwerenność danych
Dokumenty oznaczone jako poufne są przetwarzane wyłącznie lokalnie. Polityka poufności jest wymuszana centralnie w silniku — to mechanizm w kodzie, nie marketingowa obietnica.
Suwerenna platforma dokumentowa
DocAI daje moc sztucznej inteligencji — OCR, wyszukiwanie semantyczne i automatyczną ekstrakcję danych — w całości na Twojej infrastrukturze. Dokumenty poufne nigdy nie opuszczają Twojego serwera.
Problem
Kancelarie, placówki medyczne, urzędy i działy finansowe chcą korzystać z automatycznej klasyfikacji, ekstrakcji i wyszukiwania semantycznego. Komercyjne usługi typu „Drive z AI” wymagają jednak wysłania dokumentów na serwery dostawcy — co przy tajemnicy zawodowej, RODO czy wymogu suwerenności danych jest po prostu nie do przyjęcia.
Dlaczego DocAI
Dokumenty oznaczone jako poufne są przetwarzane wyłącznie lokalnie. Polityka poufności jest wymuszana centralnie w silniku — to mechanizm w kodzie, nie marketingowa obietnica.
Jeden przenośny, audytowalny kontener niesie źródło, artefakty, wektory znaczeniowe i pełną historię. Bez uzależnienia od jednego dostawcy — dokument zabiera swój kontekst AI ze sobą.
Wyszukiwanie pełnotekstowe i semantyczne w jednym pasku, z inteligentną fuzją wyników (RRF). Znajdujesz dokument zarówno po dosłownej frazie, jak i po znaczeniu.
Reguły oparte na LLM wyciągają z dokumentów daty, kwoty, NIP czy IBAN — z walidacją — prosto do raportów i kolekcji. Nie tylko TAK/NIE, lecz konkretne, typowane wartości.
Dla kogo
Akta spraw i korespondencja pod ochroną tajemnicy zawodowej.
Dokumentacja medyczna i dane wrażliwe zgodnie z RODO i prawami pacjenta.
Digitalizacja archiwów i dokumentów urzędowych na własnej infrastrukturze.
Faktury, umowy i dokumenty KYC/AML bez wysyłki na zewnątrz.
Organizacje z wymogiem suwerenności i kontroli nad infrastrukturą.
Prywatny, inteligentny „Drive” bez abonamentu SaaS.
Funkcje
Pełny cykl pracy z dokumentem: od wprowadzenia, przez przetwarzanie AI, po organizację i wyszukiwanie — wszystko na Twoim serwerze.
Wektory znaczeniowe (embeddingi) mogą być liczone lokalnie lub — opcjonalnie — przez model chmurowy; dla dokumentów poufnych routing wg poufności wymusza przetwarzanie lokalne.
Jak to działa
Prześlij plik, zaimportuj gotowy kontener albo podłącz skrzynkę e-mail (IMAP). Każde źródło trafia do przenośnego kontenera .docai.
Silnik kolejno wykonuje OCR, ekstrakcję, podział na fragmenty, wektory znaczeniowe i reguły LLM. Routing wg poufności decyduje, czy przetwarzanie odbywa się lokalnie, czy — opcjonalnie — w chmurze.
Wyniki, metadane i historia są zapisywane z powrotem do .docai — pozostaje on jednym, audytowalnym źródłem prawdy.
Magazyn indeksuje wektory i metadane w bazie grafowej, udostępniając hybrydowe wyszukiwanie, inteligentne foldery i filtry.
Automatyczne tagowanie, encje, powiązania między dokumentami oraz raporty z eksportem do CSV — z pełną historią zmian.
Zastosowania
Skany i pliki akt trafiają do platformy. DocAI wykonuje OCR z dbałością o polskie znaki, taguje dokumenty i wyciąga daty oraz sygnatury, a prawnik przeszukuje całość po znaczeniu.
Wartość: Błyskawiczne odnajdywanie informacji przy pełnym zachowaniu tajemnicy zawodowej.
Dokumentacja pacjentów oznaczona jako poufna jest przetwarzana wyłącznie lokalnie. Wyszukiwanie semantyczne pomaga odnaleźć historię i powiązane dokumenty.
Wartość: Inteligentna praca z dokumentacją medyczną bez ryzyka wycieku danych; łatwe usuwanie danych zgodnie z RODO.
Faktury wpływają z przesyłania plików i poczty. Reguły LLM wyciągają datę, kontrahenta, NIP i kwotę, a raport zestawia je i eksportuje do CSV.
Wartość: Automatyzacja segregacji i raportowania faktur bez wysyłania dokumentów na zewnątrz.
Urząd digitalizuje archiwum dokumentów urzędowych i druków w języku polskim. Pełnotekstowe i semantyczne wyszukiwanie udostępnia zasób pracownikom, a wdrożenie pozostaje na własnej infrastrukturze.
Wartość: Suwerenny, lokalny dostęp do zasobów dokumentowych dopasowany do języka polskiego.
Mały zespół używa DocAI jako prywatnego, inteligentnego „Drive”: inteligentne foldery, automatyczne tagowanie, powiązania dokumentów i doraźne pytania do treści (Ask AI).
Wartość: Funkcjonalność komercyjnego „Drive z AI” przy pełnej kontroli nad danymi.
Historyczna korespondencja z Gmaila trafia do platformy, a roczna archiwizacja zwalnia limit miejsca u dostawcy. Maile pozostają przeszukiwalne, z zachowaniem oryginalnych plików EML.
Wartość: Odzyskanie limitu skrzynki przy zachowaniu pełnego, audytowalnego archiwum.
Architektura
DocAI to ekosystem współpracujących serwisów .NET zbudowanych wokół jednego standardu danych — kontenera .docai. Całość działa self-hosted na infrastrukturze klienta.
Silnik przetwarzania: transformacje AI, harmonogram zadań, routing wg poufności.
Magazyn, organizacja i hybrydowe wyszukiwanie — „inteligentny Drive”.
Cienki adapter poczty: e-mail w kontener .docai i dalej do Vault.
Przenośny, audytowalny standard wymiany (ZIP+JSON) — źródło prawdy.
Orkiestracja zasobów obliczeniowych: rejestr usług, health-check i model subskrypcji.
Bezframeworkowa biblioteka UI dla spójnych, dostępnych interfejsów.
Rozwój
Budujemy otwarcie. To, co już działa, znajdziesz wyżej; poniżej kierunki w przygotowaniu.
Szyfrowanie .docai w spoczynku: AES-256-GCM, klucze obwiedniowe, podział metadanych na jawne i szyfrowane.
Przydzielanie mocy obliczeniowej na żądanie z limitami kosztów i automatycznym sprzątaniem zasobów.
Obecnie wspierany jest Google; kolejnym dostawcą w kolejce jest Microsoft.
Treść HTML i załączniki przy tworzeniu wiadomości (obecnie obsługiwany jest tekst zwykły).
Chcesz zobaczyć DocAI w działaniu na swoich dokumentach? Napisz — pokażemy demo i omówimy wdrożenie na Twojej infrastrukturze.