Pracownicy w polskich firmach codziennie wklejają umowy, faktury i CV do ChatGPT, Claude i Gemini. Compliance officer dowiaduje się ostatni — albo nigdy. Typly Anonimizator rozwiązuje ten problem: 14 kategorii polskich danych osobowych usuwamy przed wysłaniem do LLM, dane wracają w odpowiedzi.
Dziś otwieramy publiczne demo na typly.app/anonimizator/.
Co dokładnie wykrywamy
14 kategorii polskich identyfikatorów, wszystkie z dedykowaną walidacją — nie „jakieś 11 cyfr", tylko realny PESEL po sprawdzeniu sumy kontrolnej:
- PESEL (mod-10), NIP (mod-11), IBAN (mod-97)
- REGON, KRS, dowód osobisty, księga wieczysta, sygnatura akt sądowych
- Numer sprawy administracyjnej (np.
OS.6220.4.2024) - Kod pocztowy, telefon, e-mail, data
- Plus nazwiska i nazwy firm wykrywane z polskim kontekstem językowym (
Sp. z o.o.,S.A.,Sp. k.)
Dla każdej kategorii wybiera się strategię: redact (placeholder bez odwracania, dla publikacji w BIP), index ([PERSON_1] z mapping, dla LLM round-trip), hash (deterministyczny pseudonim z soli klienta, dla logów), keep_format (struktura zachowana, wartość usunięta — dla numerów spraw).
Format-preserving redaction
Klient z urzędu nie chce surowego tekstu — chce PDF zwrócony jako PDF, DOCX jako DOCX. Z tym samym układem, tabelami, fontami i nagłówkami, ale bez danych osobowych. Obsługujemy:
- PDF (tekstowe i skanowane — wbudowane OCR z polskim modelem)
- DOCX, PPTX, ODT
- JPG / PNG / TIFF ze zsanityzowanymi metadanymi pliku
- Plus TXT i EML dla integracji pipeline
Nazwy plików zawierające PII są neutralizowane (303456Korycki.pdf → dokument-anonimizowany-{hash}.pdf), metadane PDF (/Author, /Title, /Subject) zastępowane neutralnymi wartościami.
Walidowane na realnym korpusie
Typly Anonimizator zwalidowaliśmy w ramach programu INFOSTRATEG IV (NCBR) — strategicznego programu rozwoju nowoczesnych technologii dla polskiej administracji publicznej. W projekcie przeanonimizowano ponad 1 000 000 dokumentów z urzędów miast i gmin: zapytania mieszkańców, faktury, decyzje administracyjne, korespondencję urzędową, wezwania, zaświadczenia.
Realny mix, nie syntetyczny test set. Konkretnych nazw urzędów-partnerów nie ujawniamy zgodnie z partnership agreement — dla compliance officera ważniejszy jest sam korpus i charakter dokumentów niż nazwa.
Compliance jako fundament
- Pseudonimizacja zgodna z RODO art. 4 pkt 5 — mapping pozwala na odwrócenie
- Anonimizacja zgodna z motywem 26 RODO — strategia redact bez mapy = dane wyłączone spod RODO
- Audit trail dla rozliczalności (art. 5 ust. 2) — każda anonimizacja zwraca listę encji z pozycjami, gotową do
decision_log - AI Act compliance — anonimizacja PII to fundament dla high-risk AI systems
- Konfigurowalny salt per klient w strategii hash — pseudonimy nie krzyżują się między organizacjami
Demo i deployment
- Demo publiczne na typly.app/anonimizator/ — 10 anonimizacji dziennie/IP, tekst lub plik, bez rejestracji. Treść nie ląduje na naszych dyskach.
- Self-service API: 1000 anonimizacji/dzień z kluczem na anon.typly.app
- On-premise w Twojej infrastrukturze — pełen produkt offline, dla sektora publicznego, banków, ubezpieczeń, ochrony zdrowia
- Hosted w EOG — serwery w Europejskim Obszarze Gospodarczym, zero amerykańskich subprocessorów dla treści którą anonimizujesz
Razem z Faktura Insight Hub — to nasze dwa flagowe produkty B2B na 2026. Oba wyrosły z badań NCBR, oba są EU-first w hostingu, oba odpowiadają na konkretne dziury operacyjne polskich firm i instytucji publicznych.
Co dalej
Jeśli Twoja organizacja używa AI nieoficjalnie i Twój compliance officer nie sypia — umów demo live na 15 minut na calendly.com/krzysztof-typly/30min. Pokażemy działanie na piśmie z Twojej organizacji (anonimizowanym wcześniej do testu). NDA podpisujemy przed demo na Waszych pismach. Bez slajdów handlowych.
Zobacz też: Strona produktu Typly Anonimizator · Faktura Insight Hub