Salta al contenuto

Monitorare il Homelab: Uptime Kuma e Grafana per Tenere Tutto Sotto Controllo

Un homelab che funziona è un homelab silenzioso: nessuna notifica, nessun servizio irraggiungibile, nessun disco che riempie senza preavviso. Il problema

Monitorare il Homelab: Uptime Kuma e Grafana per Tenere Tutto Sotto Controllo

Un homelab che funziona è un homelab silenzioso: nessuna notifica, nessun servizio irraggiungibile, nessun disco che riempie senza preavviso. Il problema è che il silenzio inganna. Senza un sistema di monitoraggio, scopri che qualcosa si è rotto solo quando provi a usarlo — di solito nel momento meno opportuno. Monitorare significa anticipare il guasto invece di subirlo, e per farlo a casa bastano due strumenti gratuiti: Uptime Kuma per sapere se un servizio è vivo, e Grafana per capire come sta andando nel tempo.

In questa guida vediamo come impostare un monitoraggio sensato per un laboratorio domestico, senza trasformarlo in un secondo lavoro. L’obiettivo non è raccogliere mille metriche, ma le poche che ti avvisano in tempo quando qualcosa sta per andare storto.

Uptime Kuma: sapere subito quando un servizio cade

Uptime Kuma è un monitor di disponibilità open source, leggero e con un’interfaccia immediata. Lo installi in un container Docker in pochi minuti e inizi ad aggiungere “monitor”: un controllo HTTP sul tuo Nextcloud, un ping verso il router, un controllo TCP sulla porta del database, una verifica del certificato HTTPS che scade. Ogni monitor ha un intervallo di controllo (60 secondi è un buon punto di partenza) e una soglia di tentativi prima di dichiarare il servizio “down”.

La parte che cambia davvero la vita sono le notifiche. Uptime Kuma supporta decine di canali — Telegram, email, Gotify, Discord, webhook generici — e ti permette di ricevere un messaggio nel momento esatto in cui un servizio smette di rispondere e quando torna online. Configurare almeno un canale push (Telegram è il più semplice) è il primo passo: un monitoraggio che non ti avvisa è solo una dashboard carina che nessuno guarda.

Un consiglio pratico: non monitorare il servizio dal server che lo ospita. Se il nodo cade, cade anche il monitor e non ricevi nulla. Se hai più macchine, fai girare Uptime Kuma su un nodo diverso, o sfrutta la sua funzione di “status page” pubblica per avere un riscontro esterno. Per chi gestisce più segmenti di rete, separare il monitor su una VLAN dedicata aiuta a isolare i guasti: trovi i principi di base nella guida al networking domestico con VLAN e pfSense.

Grafana: dalle metriche alle tendenze

Uptime Kuma risponde alla domanda “è vivo?”. Grafana risponde a “come sta andando?”. È uno strumento di visualizzazione che disegna dashboard a partire da una sorgente di dati temporali. Da solo non raccoglie nulla: ha bisogno di un database di serie temporali, e la coppia più diffusa nei homelab è Prometheus (che interroga gli “exporter” e immagazzina i dati) più Grafana (che li mostra).

Il flusso tipico è questo: installi node_exporter su ogni macchina da monitorare, Prometheus raccoglie le metriche a intervalli regolari, e Grafana le trasforma in grafici. In pochi minuti hai sotto controllo carico CPU, uso della RAM, temperatura, traffico di rete e — soprattutto — spazio disco. La maggior parte dei problemi seri in un homelab nasce da un disco che si riempie senza che nessuno se ne accorga: un grafico dello spazio libero nel tempo ti mostra la tendenza e ti dà giorni di preavviso invece di una sorpresa improvvisa.

Il bello di Grafana è la community: esistono migliaia di dashboard preconfezionate da importare con un semplice ID. La dashboard “Node Exporter Full” è il classico punto di partenza e copre quasi tutto quello che serve a una macchina Linux. Da lì puoi personalizzare, rimuovere i pannelli che non guardi mai e tenere solo l’essenziale.

Cosa vale davvero la pena monitorare a casa

La tentazione di chi inizia è monitorare tutto. È un errore: troppe metriche generano rumore, e troppe notifiche portano a ignorarle. Per un homelab domestico, la lista essenziale è corta. Disponibilità dei servizi critici (quelli che usi ogni giorno e che la famiglia nota se cadono). Spazio disco su ogni volume, con un alert sotto il 15% di spazio libero. Temperatura di CPU e dischi, soprattutto in estate o in armadi poco ventilati. Stato dei backup: un backup che fallisce in silenzio è peggio di nessun backup.

Per chi ha un NAS, vale la pena monitorare anche lo stato dei dischi e dei volumi RAID, perché un disco che inizia a degradare dà segnali misurabili prima di morire del tutto. Se stai ancora scegliendo l’hardware di archiviazione, la guida al NAS Synology DS923+ spiega come impostare un sistema affidabile fin dall’inizio.

Notifiche utili, non rumore

Una regola d’oro: ogni notifica deve corrispondere a un’azione. Se ricevi un avviso e la tua reazione è “vabbè, ignoro”, quella soglia è sbagliata e va corretta. Meglio pochi alert significativi che decine di messaggi che addestrano il cervello a non guardare il telefono. Imposta soglie realistiche, usa un periodo di “grace” prima di dichiarare un down (per evitare falsi positivi da micro-interruzioni di rete), e raggruppa le notifiche per servizio.

Grafana permette anche di definire alert basati sulle metriche — per esempio “avvisami se lo spazio disco scende sotto il 10% per più di 30 minuti”. È qui che il monitoraggio diventa proattivo: non aspetti che il servizio cada, intervieni quando vedi la tendenza che porta al guasto. La combinazione tra l’allerta immediata di Uptime Kuma e gli alert predittivi di Grafana copre entrambi i fronti.

Partire semplice e crescere col tempo

Non serve costruire un osservatorio il primo giorno. Inizia con Uptime Kuma e tre o quattro monitor sui servizi che usi davvero, collega Telegram, e lascialo girare per una settimana. Quando ti sei abituato a quel ritmo, aggiungi Grafana con node_exporter su una sola macchina e importa una dashboard pronta. Da lì espandi un nodo alla volta.

Il monitoraggio è uno di quei tasselli del homelab che non danno soddisfazione immediata ma che ti salvano nei momenti critici. La prima volta che ricevi un avviso di disco quasi pieno con due giorni di anticipo, o scopri che un servizio è caduto mentre eri fuori casa e non quando ne avevi bisogno, capisci perché valeva la pena dedicarci mezza giornata. Un homelab monitorato non è solo più affidabile: è anche meno stressante da gestire.