divido in due parti il mio primo post su questo forum a beneficio dei più. I dettagli sono per ... i più curiosi
1°
Ho installato Ubuntu Server 14.04.1 LTS 64bit su un server HP ML110 G4 e ogni tanto (dai 2 ai 20 giorni) il sistema si blocca senza alcun motivo apparente: led verde acceso, nessuna attività sul disco, la tastiera non funziona, non risponde ai ping e non è possibile accedere via rete anche se il relativo led continua a lampeggiare. Riprende solo spegnendo e riaccendendo, anche solo dal pulsante anteriore.
Ho rovistato più volte nei vari log e non ho trovato niente di anomalo, kernel panic o altro. In /var/log/syslog la riga che precede quella che notifica il boot risale al momento in cui il sistema ha smesso di funzionare. L'ultima volta tra queste due righe ho trovato una serie di chiocciole (@): probabilmente un problema in fase di scrittura....
Il problema è che non riesco a capire la causa, se software o hardware, anche se propendo per quest'ultima.
Cosa posso installare/configurare/attivare per cercare di individuare il problema?
2°
Ora, per chi volesse approfondire, ecco i dettagli.
Il sistema funziona principalmente come mail server (iRedMail) e firewall perimetrale (iptables/fwbuilder) per una rete di circa 40 computer. So che non è il massimo ma in attesa di tempi migliori viene utilizzato anche come file server ma il traffico è veramente molto basso.
Il sistema ha funzionato senza problemi fino ad Agosto scorso (l'ultimo boot risaliva a oltre 1 anno prima), quando si è deciso di dargli una rinfrescata:
- sostituzione del caro 8.04.1 LTS col 14.04.1;
- sostituzione dei 2 HDD da 160GB con 2 da 1TB;
- aggiunti 2x2GB di RAM ECC Crucial ai 2x1GB Kingston esistenti: i nuovi moduli sono quelli risultanti da una ricerca fatta su it.crucial.com specificando il modello del server e chiaramente hanno le stesse identiche caratteristiche dei precedenti.
Il risultato è un Pentium 4 D 2.8GHz, 6GB, 2x1TB in RAID1 software + 1x1TB, 2xEth (LAN on-board driver=tg3, WAN PCI driver=3c59x).
Durante la normale operatività si arriva a picchi di 400 task ma la CPU è quasi sempre sotto al 20%. La memoria invece sembra essere utilizzata tutta, anche se lo swap arriva al massimo a 20KB. Sui nuovi dischi sono state create due sole partizioni: una di swap da 2GB, l'altra con lo spazio rimanente formattata in EXT4, il tutto gestito in RAID1. Lo spazio libero abbonda.
Dalle specifiche HP risulta che la massima capacità di questa macchina è di 2TB (4 HDD x 500GB) ma il 3° disco da 1TB è in funzione dal 2008 senza problemi ed anche i nuovi vengono "visti" regolarmente dal controller SATA integrato (ICH7), per cui non penso che l'anomalia dipenda da questo.
BIOS e tutto il software installato sono aggiornati ad oggi e, fatta eccezione per Webmin, non è stato aggiunto niente al di fuori dei repo di default: amavisd-new, apache2, bind9, clamav, dovecot-*, esets, fail2ban, kernel 3.13.0.34.40, iptables, mysql-*, openssh-*, openssl, php5*, openldap, postfix, postfix-cluebringer*, python*, samba*, spamassassin, webmin, iRedMail-0.8.7 .
Non ho ancora potuto fare il test della memoria con MemTest86 ma appena possibile ...
Software o hardware?
Cos'altro mi suggerite?