Caveman.PrivacyGuard

Copia Link

Con l'adozione di massa dei Large Language Models (LLM) e dei sistemi di intelligenza artificiale generativa all'interno dei software aziendali, gli sviluppatori si trovano davanti a una sfida cruciale: come sfruttare la potenza dell'AI senza mandare in fumo la compliance e la privacy dei dati degli utenti? Inviare accidentalmente un codice fiscale, un IBAN o una chiave di accesso a un'API esterna può costare caro, sia in termini di reputazione che di sanzioni pecuniarie (GDPR in primis). La soluzione non è bloccare l'innovazione, ma implementare un gateway di sicurezza on-premise affidabile.

Proteggere i dati nell'era dell'AI: Guida a Caveman.PrivacyGuard

Inviare accidentalmente un codice fiscale, un IBAN o una chiave di accesso a un'API esterna può costare caro, sia in termini di reputazione che di sanzioni pecuniarie (GDPR in primis). La soluzione non è bloccare l'innovazione, ma implementare un gateway di sicurezza on-premise affidabile.

Nasce così Caveman.PrivacyGuard, una libreria .NET 8 leggera, fulminea e configurabile pensata appositamente per rilevare, valutare e mascherare i dati sensibili prima che lascino il perimetro aziendale.

🌍 Copertura Universale: 27 Paesi UE in un Unico Strumento

Validare i dati sensibili a livello internazionale è storicamente un incubo normativo e tecnico. Ogni paese ha i propri standard: il Codice Fiscale in Italia, la Steuer-ID in Germania, il numero NIR/SSN in Francia.

Caveman.PrivacyGuard risolve questo problema nativamente. Include regole precompilate per tutti i 27 paesi dell'Unione Europea, combinando tre livelli di verifica:

Regex precompilate ad alte prestazioni.
Validatori algoritmici reali (es. Luhn per carte di credito, IBAN MOD97 e checksum nazionali).
Analisi dell'entropia di Shannon per intercettare stringhe casuali ad alta densità (come password e token).

⚠️ Disclaimer Legale: Nessun tool software sostituisce il parere di un DPO (Data Protection Officer) o una DPIA formale, ma PrivacyGuard fornisce lo scudo tecnico indispensabile per abilitare l'Anonymization by Design.

📐 L'Architettura del Rischio: Il Privacy Score

Non tutti i leak di dati hanno lo stesso peso. Trovare una stringa isolata che assomiglia a un ID ha un impatto diverso rispetto a trovare un intero blocco di testo contenente nomi, email e codici bancari affiancati dalla parola "password".

Per questo motivo la libreria calcola un Privacy Score (0-100) dinamico basato su una precisa formula matematica:

$$Score Finale = (BaseScore \times CorrelationMultiplier) + (ContextBoost \times 12) + (DensityBonus \times 18)$$

Matrice delle Soglie di Rischio

Score	Livello	Azione Consigliata
0-15	✅ Sicuro (AI Ready)	Invio diretto all'LLM senza restrizioni
16-35	⚠️ Basso	Logging interno + monitoraggio
36-60	⛔ Medio	Anonimizzazione obbligatoria prima dell'invio
61-85	🚨 Alto	Sandbox isolata o sostituzione con dati sintetici
86-100	🛑 Critico	Blocco assoluto della richiesta, processing solo on-premise

🚀 Integrazione in 3 Passaggi

La libreria è stata progettata per essere integrata in pochi minuti in qualsiasi ecosistema ASP.NET Core o microservizio.

1. Installazione del pacchetto NuGet

Bash

dotnet add package Caveman.PrivacyGuard

2. Analisi Multilingua in Runtime

La libreria è in grado di variare i messaggi di avviso e la logica di contesto in base alla lingua della richiesta:

var analyzer = new PrivacyAnalyzer { EnableAutoMasking = true };

// Analisi in lingua Italiana

var resIt = analyzer.Analyze("CF: RSSMRA80A01H501U, email: test@x.com", "it");

Console.WriteLine($"[IT] Rischio: {resIt.RiskLevel}\n{resIt.WarningMessage}");

3. Auto-Masking per gli LLM

La funzionalità più potente per chi lavora con l'AI generativa è il mascheramento automatico contestuale:

var text = "Cliente: Mario Rossi, email mario@azienda.it, IBAN: IT60X0542811101000000123456";

var result = analyzer.Analyze(text);

Console.WriteLine(result.MaskedText);

// Output: Cliente: Mario Rossi, email [EMAIL], IBAN: [IBAN]

⚙️ Estendibilità e Performance Estreme

Spesso le librerie di analisi del testo soffrono di grossi problemi di memoria e rallentano i flussi ad alto traffico. Caveman.PrivacyGuard è nata per ovviare a questo problema sfruttando le ultime ottimizzazioni dell'ecosistema .NET 8:

RegexOptions.NonBacktracking: Protegge l'applicazione da attacchi di tipo ReDoS (Regular Expression Denial of Service).
Zero Allocazioni Ridondanti: Elaborazione efficiente della memoria per non impattare sul Garbage Collector.
Thread-Safe: Gestione della concorrenza ottimizzata tramite ReaderWriterLockSlim e cache interna delle espressioni regolari.

Personalizzazione YAML-Driven

Le regole interne sono definite in un file rules.yaml embedded, ma possono essere estese a runtime senza dover ricompilare la libreria. È possibile registrare validatori custom in pochi passaggi:

ValidatorRegistry.Register("MY_CUSTOM_ID", value =>

value.Length == 10 && value.StartsWith("XYZ") && value.All(char.IsDigit));

🔐 Compliance Pronta all'Uso

Al termine dell'analisi, l'oggetto PrivacyAnalysisResult restituisce un set di ComplianceFlags che collegano automaticamente le violazioni intercettate ai framework normativi internazionali come GDPR (Art.4), PCI-DSS (per i dati finanziari) e NIST 800-53. Questo permette ai sistemi aziendali di instradare i log o bloccare le transazioni in base alle policy di conformità interne in modo totalmente automatizzato.

Se stai sviluppando un'applicazione enterprise basata su LLM, l'anonimizzazione non è più un optional, ma un requisito fondamentale.

Caveman.PrivacyGuard è distribuito sotto licenza MIT. Puoi testarlo, personalizzarlo e integrarlo oggi stesso nel tuo prossimo progetto .NET.

Tecnologie

.net

Risorse

GitHub NuGet MIT

Visita Progetto

Progetti correlati