Il compressore universale di token che fa respirare il vostro portafoglio (e i vostri AI Agent)
Se sviluppate con gli LLM, conoscete il dramma: i loop degli agenti che ripetono continuamente lo stesso contesto, i file JSON giganteschi che intasano la context window e quelle fatture API di fine mese che fanno venire i brividi.
Per questo ho deciso di lanciare Synthelion — un Token Compressor e Prompt Manager universale progettato per tagliare l'uso dei token fino al 70%, velocizzando le risposte dei modelli senza perdere un briciolo di significato.
E sì, c'è una citazione a cui non ho saputo resistere:
"Perché usare molti token quando pochi token fanno stesso lavoro?" — Un uomo di Neanderthal (e il vostro portafoglio).
🔥 Cos'è Synthelion e come funziona?
Synthelion si interpone tra il vostro codice (o il vostro agente) e l'LLM. Analizza il prompt, rimuove tutto il "packaging grammaticale" superfluo (articoli, preposizioni, congiunzioni) e riduce le parole alla loro forma base (lemmatizzazione). L'IA riceve la stessa identica informazione essenziale, ma distillata.
Il prima e il dopo (Qualche esempio pratico)
- Prosa in Italiano (Risparmio ~52%):
- Prima: Vorrei sapere se è possibile ricevere informazioni sui ristoranti economici a Roma, per favore.
- Dopo:
sapere possibile ricevere informazione ristorante economico Roma - Array JSON (Risparmio ~69%):
- Prima: Un JSON classico con chiavi ripetute per ogni oggetto.
- Dopo: Viene convertito automaticamente in una tabella Markdown pulita e lossless, che i modelli digeriscono nativamente con una frazione dei token.
- Pagine HTML, Log di build e Git Diff:
- Synthelion integra un Content Router intelligente: capisce cosa gli state passando (codice, log, tabelle o testo) e applica l'algoritmo di compressione perfetto per quel formato.
🛠️ Integrazione Universale (Zero configurazione)
Synthelion è nato per essere inserito ovunque in 5 minuti:
- 🔌 Protocollo MCP: Supporto nativo per Claude Code, Cursor, Windsurf, e Claude Desktop. Vi basta aggiungere una riga al file di configurazione per dare al vostro IDE i superpoteri di compressione.
- 🐍 Plugin per OpenAI & LangChain: Strumenti già pronti per essere passati come
toolsall'API di OpenAI o nei vostri agenti ReAct su LangGraph. - 💻 Interfaccia CLI e Python API: Potete usarlo direttamente da terminale in pipeline Bash o integrarlo nei vostri script con
pip install synthelion.
🌍 Sostenibilità e Numeri alla mano
Non è solo una questione di costi (che su volumi da 10M di token al giorno significano migliaia di dollari risparmiati all'anno), ma anche di impatto ambientale.
Synthelion include un energy estimator integrato: ogni token risparmiato evita circa 0.005 mWh di energia di calcolo e 0.002 mg di CO₂. Potete tracciare l'efficienza direttamente dal vostro codice:
Python
📦 Da dove iniziare?
Il progetto è open-source, supporta più di 50 lingue out-of-the-box (rilevate automaticamente) e non richiede alcun modello IA per funzionare localmente. È l'evoluzione naturale di un mio precedente progetto in C# (Caveman), riprogettato da zero per l'ecosistema Python e degli AI Agents.
- 🐍 PyPI:
pip install synthelion - 🛠️ GitHub Repository: francescopaolopassaro/synthelion