F.A.I.T.H. — AI locale-first
Flexible AI Tool for Hybridization — chat, documenti, web, immagini e video in un’unica interfaccia che gira sul tuo hardware. Niente abbonamenti API, niente dati che escono dalla rete: ogni operazione può essere tracciata in Wh e CO₂ reali.
Cosa funziona oggi
Non una demo: moduli reali in produzione su stable v5, con accesso graduale tramite waitlist e crediti legati all’energia misurata.
LLM Chat
Conversazione via Ollama (Qwen e modelli locali). Proxy compatibile per Cline e tool esterni. Niente token cloud.
PDF & Web RAG
Analisi semantica di PDF, ricerca vettoriale e sintesi di fonti web — i documenti restano sul nodo locale.
Image Gen (FLUX)
FLUX.2 Klein 4B su GPU dedicata, fallback SDXL. Attribuzione energetica nei metadati PNG al download.
Video (LTX)
Text-to-video, image-to-video e transizione start→end con LTX-Video su RTX 3060. Output effimeri, isolamento per utente.
Energy Monitor
Consumi GPU/CPU, CO₂ e costo stimato per operazione. Standby orchestrato (WoL, Home Assistant). Unico nel segmento consumer.
Waitlist & crediti Wh
Accesso graduale alla beta. ~1 € = 20 crediti Wh (energia reale). Soci SIE: canale CYMEX separato.
Musica
MusicGen in locale. Modulo presente ma non sempre attivo (compete per VRAM con LLM e generazione pesante).
Lingue & Trainer
STT/TTS/traduzione e fine-tuning audio nello stream sperimentale devel/ (Streamlit). Prossima fase open source.
Giugno 2026: prima cover editoriale generata in locale con il nuovo modulo immagini (FLUX, 1.54 Wh in ~39 s, metadati nel PNG). Vedi anche l’articolo sul blog: VirtualBox → Proxmox.
Perché F.A.I.T.H.
I servizi AI cloud costano decine o centinaia di euro al mese, richiedono connessione costante e mandano i tuoi dati su server di terze parti. Ollama, LM Studio e ComfyUI risolvono un pezzo alla volta — ma non si parlano tra loro e non ti dicono quanto consuma ogni risposta.
F.A.I.T.H. unifica tutto in un’unica interfaccia, gira su hardware consumer (anche recuperato), misura l’energia per operazione e non archivia i tuoi output in cloud: quello che generi è temporaneo finché non lo salvi tu.
Segui la storia
Il diario di laboratorio racconta settimana per settimana come nasce un’infrastruttura AI su hardware riusato: RAID, termica, GPU, cavi introvabili e accesso graduale alle persone.
- 20 Mag 2026 — Settimana 1
- 24 Mag 2026 — Settimana 2
- 3 Giu 2026 — Settimana 3
- 20 Giu 2026 — Giugno
- 24 Giu 2026
Stack
- Backend: Python 3.11, FastAPI, Ollama, HuggingFace Diffusers (FLUX, LTX), PyTorch.
- Frontend: PHP/JS unificato, proxy verso backend via tunnel SSH.
- Infrastruttura: Proxmox su DiabloArc, 2× NVIDIA RTX 3060 12 GB, hardware recuperato.
- Deploy: nodo inference locale + vetrina su dustnet.cloud (output effimeri, niente cloud storage).
Roadmap
-
Completato — 2026
v5 beta (FastAPI + frontend), waitlist, crediti Wh, FLUX immagini con metadati, video LTX su 3060, orchestrazione energia/standby.
-
Prossimi mesi
Apertura graduale waitlist, CI e doc install, open source ramo
devel/(second brain, Streamlit), agent e memoria persistente. -
Visione
Architettura plugin, marketplace moduli community, companion mobile, offerta privacy-preserving per team e PMI.
♥ Sostieni lo sviluppo
Non stai pagando un abbonamento cloud: finanzi laboratorio aperto — hardware riusato, software libero, energia misurata, codice pubblicato su GitHub.
Cosa finanzia la tua donazione:
- Liberapay → tempo di sviluppo, ricambi, corrente del nodo DiabloArc
- Lista d’attesa → accesso graduale alla beta (non è una paywall)
- CYMEX (soci SIE) → crediti Wh per usare l’app quando è online
DiabloArc lavora con 2× RTX 3060 12 GB su hardware recuperato. L’obiettivo dei 40 €/sett. corrisponde a circa una giornata a settimana dedicata solo a F.A.I.T.H.; oggi la raccolta è ancora agli inizi — ogni nuovo patron conta.