F.A.I.T.H. — quando l’AI locale incontra la realtà dell’hardware recuperato
F.A.I.T.H. non nasce in un laboratorio perfetto, ma dentro una sfida concreta: costruire un’infrastruttura di AI locale, sostenibile e riusabile partendo da hardware che il mercato considera già vecchio, scomodo o poco appetibile. Oggi, che tu sia un'azienda, un'associazione o un privato, i tuoi dati digitali sono un patrimonio prezioso e delicato. Scegliere dove e come conservarli non è solo una questione tecnica, ma una scelta etica che riflette quanto valore attribuiamo alla nostra privacy, alla sicurezza e all'impatto ambientale delle tecnologie che utilizziamo.
F.A.I.T.H. — quando l’AI locale incontra la realtà dell’hardware recuperato
In questa pagina puoi scegliere due modi diversi di leggere la stessa storia: una versione tecnica, con dettagli hardware, comandi e problemi reali affrontati, e una versione narrativa, pensata per chi vuole capire il senso del progetto senza perdersi nei log.
Versione tecnica — diario di laboratorio di F.A.I.T.H.
Il nodo su cui sto lavorando è una macchina nata per il riuso, non per stupire: componenti recuperati, controller vecchi ma ancora utili, GPU consumer, test veri, limiti veri e nessuna promessa di perfezione.
Il primo ostacolo serio è stato uno di quei problemi che raccontano bene cosa significhi fare infrastruttura sostenibile oggi: recuperare i cavi AXXGPGPUCABLE, ormai quasi introvabili. Ne ho acquistati due su eBay, perché senza quei cavi questa macchina non sarebbe mai arrivata a gestire correttamente le due GPU previste per il progetto.
In un contesto “enterprise” moderno tutto questo sarebbe stato banale: ordini il ricambio, aspetti il corriere, rimonti e vai avanti. Nel riuso vero, invece, ogni piccolo componente fuori produzione può diventare un collo di bottiglia più importante di una GPU stessa.
Perché questa macchina conta
F.A.I.T.H. è pensata come AI locale-first: niente dipendenza costante dal cloud, niente costi per token, maggiore controllo dei dati e una sola interfaccia per moduli diversi. L’obiettivo non è soltanto far girare un modello, ma costruire una piattaforma utile, accessibile e coerente con una visione di sostenibilità tecnica.
Il target dichiarato del progetto include hardware eterogeneo, con fallback GPU/CPU e attenzione ai consumi, proprio perché il punto non è inseguire solo il ferro più nuovo, ma far funzionare bene ciò che esiste già.
Il fronte RAID: quando il recupero diventa chirurgia
Dopo aver raggiunto il controllo delle GPU, il collo di bottiglia si è spostato sullo storage: un controller Intel RS25DB080 con firmware MegaRAID, collegato a un array RAID6 di SSD SATA. Durante i test sono comparsi dischi in stato degradato, unità marcate come missing e rebuild contemporanei su più slot.
Nel corso della diagnostica sono stati usati, fra gli altri, questi comandi:
storcli /c0 show storcli /c0 show all storcli /c0 /eall /sall show storcli /c0/e252/s0 show all storcli /c0/e252/s3 show all storcli /c0/e252/s0 set good force storcli /c0/e252/s0 insert dg=0 array=0 row=0 storcli /c0/e252/s0 start rebuild storcli /c0/eall/sall show rebuild storcli /c0/e252/s0 show rebuild storcli /c0/e252/s3 show rebuild storcli /c0 show temperature storcli /c0 show all | grep -i 'temperature\|roc' storcli /c0 set alarm=silence
La situazione, a un certo punto, era questa: due SSD risultavano in rebuild nello stesso array, mentre il controller continuava a riportare il volume come degradato fino al completamento della ricostruzione.
Ma il vero problema non era solo il rebuild. Il vero problema era chiedersi: il controller sta leggendo correttamente lo stato dei dischi, oppure sta già lavorando fuori specifica termica?
La temperatura “da eruzione” del controller
Il motivo è emerso guardando fisicamente la scheda: durante uno spostamento si sono spezzate le clip plastiche a molla che tenevano premuto il dissipatore del controller RAID. Tradotto: il chip non era più raffreddato come avrebbe dovuto.
I comandi di controllo termico hanno restituito un dato incompatibile con una situazione sana:
storcli /c0 show temperature storcli /c0 show all | grep -i 'temperature\|roc'
Il controller ha riportato una ROC temperature di 133 °C. A quel punto la decisione più responsabile non è stata “provare ancora un po’”, ma fermarsi.
Continuare i rebuild in quelle condizioni avrebbe reso inaffidabile qualsiasi conclusione: se il controller è vicino a temperature critiche, non posso sapere con certezza se eventuali anomalie sui dischi dipendano davvero dalle unità, dal backplane o dal controller stesso.
Il fix temporaneo in stile Restarters
Il fix temporaneo adottato è perfettamente nello spirito del riuso: un bloccaggio artigianale con tasselli per riportare pressione sul dissipatore e non lasciare il controller completamente “libero”. È il tipo di soluzione che in un contesto Restarters o Repair Café ha senso come misura di emergenza per diagnosi e messa in sicurezza.
Va detto con chiarezza: non è la soluzione finale. Prima del riavvio operativo servono pasta termica nuova, verifica della superficie di contatto e un fissaggio migliore, più stabile e ripetibile.
Cosa dimostra tutto questo
Questa storia mostra una cosa semplice: costruire AI locale e sostenibile non significa solo installare modelli. Significa anche cercare ricambi fuori produzione, capire controller vecchi, monitorare temperature reali, fermarsi quando serve e documentare tutto.
F.A.I.T.H. non è la fantasia di un’infrastruttura pulita e perfetta. È il tentativo concreto di trasformare hardware reale, limiti reali e manutenzione reale in una base utile per progetti che hanno bisogno di AI locale, trasparente e controllabile.
Versione narrativa — la barca, i ricambi e il ferro dimenticato
F.A.I.T.H. nasce da una convinzione molto semplice: non tutto ciò che il mercato chiama “obsoleto” ha davvero finito il proprio lavoro. Molte macchine smettono di essere usate non perché siano inutili, ma perché è più facile comprarne un’altra che capire come rimetterle in servizio.
Questo progetto prova a fare l’opposto. Prende hardware vissuto, pezzi difficili da trovare, cavi quasi scomparsi dai cataloghi e prova a trasformarli in qualcosa che abbia ancora senso: una AI locale, sobria nei costi, più controllabile, più vicina alle persone che la usano.
Il simbolo di questa fase sono stati due cavi quasi invisibili: gli AXXGPGPUCABLE. Non sono spettacolari, non fanno marketing, non impressionano nessuno in una foto. Eppure senza di loro due GPU restavano mute, e un pezzo del progetto restava fermo.
È così che funziona spesso il riuso tecnologico: non vieni fermato da ciò che è grande, ma da ciò che è piccolo e introvabile. Un cavetto. Una clip. Una staffa. Un ricambio che nessuno produce più perché il mondo si aspetta che tu butti tutto.
Quando finalmente la macchina ha iniziato a prendere forma, il problema si è spostato sul RAID. Anche lì la storia sembrava quasi archeologia digitale: controller vecchio, SSD consumate, rebuild da seguire con pazienza e la sensazione costante di dover distinguere tra “guasto vero” e “sintomo di un altro problema”.
Poi la scoperta: il dissipatore del controller non era più fissato come doveva. Le clip in plastica, spezzate durante uno spostamento, avevano trasformato una parte banale del montaggio in un rischio serio.
A quel punto la temperatura non era più un dettaglio tecnico, ma il confine tra il continuare testando e il fermarsi per non raccontarsi una bugia. Se un controller lavora vicino a temperature da eruzione, non puoi più fidarti del contesto in cui stai leggendo gli errori.
E allora sì, c’è stato anche un fix temporaneo da officina del riuso: tasselli per tenere premuto il dissipatore e riportare un minimo di ordine dove l’hardware aveva perso la sua forma originale. Una soluzione provvisoria, utile per non peggiorare la situazione, ma non abbastanza per chiamarla definitiva.
Domani serviranno pasta termica, un fissaggio migliore e un nuovo passaggio di verifica. Perché sostenibilità non vuol dire arrangiarsi male. Vuol dire prolungare la vita delle cose con intelligenza, cura e onestà tecnica.
Questa è, in fondo, la storia di F.A.I.T.H.: non la corsa alla macchina perfetta, ma la costruzione paziente di un’infrastruttura possibile. Un progetto che prova a dimostrare che l’AI locale non deve per forza nascere da hardware nuovo e budget enormi, ma può crescere anche dal recupero, dalla riparazione e dalla volontà di non lasciare indietro ciò che può ancora servire.
English technical version — F.A.I.T.H. field notes
F.A.I.T.H. is being built on reused hardware, not on an ideal lab setup. That means real-world constraints, mixed components, aging enterprise parts, consumer GPUs, fallback strategies and a lot of documentation.
One of the first real blockers was not a GPU, not a motherboard and not software. It was the AXXGPGPUCABLE: a small, almost forgotten cable that is now difficult to find. I had to buy two of them on eBay, and without them this machine would not have reached proper dual-GPU control.
This is one of the hidden truths of sustainable computing: when you work with reuse, the hardest part is often not performance. It is logistics, compatibility and the disappearing spare-part ecosystem around hardware labeled obsolete.
Once the GPU side became usable, the next issue moved to storage. The machine relies on an Intel RS25DB080 RAID controller with a RAID6 array built on SATA SSDs. During troubleshooting, the workflow included topology checks, per-slot inspection, rebuild monitoring, alarm silencing and controller temperature verification.
storcli /c0 show storcli /c0 show all storcli /c0 /eall /sall show storcli /c0/e252/s0 show all storcli /c0/e252/s3 show all storcli /c0/e252/s0 set good force storcli /c0/e252/s0 insert dg=0 array=0 row=0 storcli /c0/e252/s0 start rebuild storcli /c0/eall/sall show rebuild storcli /c0/e252/s0 show rebuild storcli /c0/e252/s3 show rebuild storcli /c0 show temperature storcli /c0 show all | grep -i 'temperature\|roc' storcli /c0 set alarm=silence
At one point two drives were rebuilding in the same RAID6 array. Under normal conditions, that would already require caution. But then the physical cause behind the controller overheating became visible.
During transport, the plastic spring clips holding the RAID controller heatsink broke. That meant the heatsink was no longer properly pressed against the chip.
The controller then reported a ROC temperature of 133 °C. At that stage, continuing the RAID investigation without fixing cooling first would have made the diagnostic process unreliable. I could no longer be sure whether disk detection behavior came from the drives themselves or from a controller operating too close to thermal failure.
A temporary Restarters-style fix was applied using wall plugs as a makeshift retention solution to keep pressure on the heatsink. It worked as an emergency stabilization step, but it is explicitly not the final fix.
Before going back to production work, the controller needs fresh thermal paste, a better mechanical mounting solution and another round of validation.
This is what F.A.I.T.H. really looks like behind the scenes: not just models and interfaces, but repairability, thermal checks, RAID recovery, scarce spare parts and the discipline to stop when hardware conditions make the results untrustworthy.
English narrative version — the hidden cost of keeping old hardware alive
F.A.I.T.H. is not a story about chasing the newest machine. It is a story about refusing to believe that useful hardware stops mattering the moment the market loses interest in it.
Building local AI on reused devices means accepting a different kind of challenge. You are not only training models or wiring interfaces. You are also looking for forgotten cables, recovering old parts, rebuilding trust in machines that most people would replace without a second thought.
In this phase, that story began with two almost invisible components: AXXGPGPUCABLEs. Hard to find, unglamorous, easy to overlook and absolutely essential. Without them, the GPUs could not become part of the system in the way the project needed.
Then came the RAID issues, and with them another reminder: sustainable technology is not romantic by default. It is careful, uncertain, sometimes frustrating work.
The real turning point arrived when I found out why the RAID controller temperature was so extreme. The plastic spring fasteners holding the heatsink had broken during transport. A tiny failure in a tiny retention system had suddenly become a major infrastructure risk.
That led to a temporary fix inspired by repair culture: improvised retention with wall plugs, just enough to keep the heatsink in place until a proper repair can be done. It is not elegant, and it is not final, but it belongs to the same philosophy that drives the whole project: keep things alive responsibly, document everything and do not pretend a temporary workaround is the same as a completed repair.
Tomorrow means fresh thermal paste, a better mounting solution and another careful test. That is part of the point. Reuse is not denial. Reuse is maintenance, honesty and the willingness to stop before unreliable hardware turns effort into damage.
F.A.I.T.H. grows exactly there, in that space between repair and ambition: where sustainability is not a slogan, but the hard work of giving machines, parts and ideas a second life.