No description
- Shell 100%
| config.env | ||
| ilo_monitor.sh | ||
| install.sh | ||
| README.md | ||
iLO Monitor
Et selvhostet overvåkingsscript som poller HP iLO-grensesnitt via IPMI og sender varsler via ntfy når temperaturer er for høye eller kritiske feil oppdages.
Laget for HP ProLiant G9 (iLO 4) kjørende i et Proxmox-miljø.
Hvordan det fungerer
Scriptet kjøres automatisk av cron hvert 5. minutt og gjør følgende:
- Temperaturovervåking - Henter temperaturdata fra iLO via IPMI og sender varsel hvis en sensor rapporterer kritisk status.
- SEL-sjekk - Sjekker iLO-loggen for kritiske hendelser som PSU-feil, fan failure og hardware degradation. Varsler kun første gang en ny feil oppdages.
- IPMI-tilgjengelighet - Hvis iLO ikke svarer gjøres ett nytt forsøk etter 60 sekunder før det sendes varsel om manglende respons.
- Cooldown - Scriptet husker hvilke feil som allerede er varslet så du ikke drukner i gjentatte meldinger.
Krav
- Debian 12 LXC på Proxmox
ipmitoologcurl(installeres automatisk avinstall.sh)- iLO-bruker med nettverkstilgang fra LXC-en
- Selvhostet ntfy-instans
Installasjon
Steg 1 - Opprett en Debian LXC
Bruk community-scripts på Proxmox-hosten:
bash -c "$(curl -fsSL https://raw.githubusercontent.com/community-scripts/ProxmoxVE/main/ct/debian.sh)"
Steg 2 - Klon repoet inne i LXC-en
apt-get install -y git
git clone https://git.grandedata.no/GrandeData/ilo-monitor
cd ilo-monitor
Steg 3 - Fyll inn config.env
Åpne config.env og fyll inn dine egne verdier:
nano config.env
Du må endre folgende:
| Variabel | Hva du fyller inn |
|---|---|
ILO_G9_IP |
IP-adressen til iLO-grensesnittet på serveren |
ILO_G9_USER |
Brukernavn i iLO-panelet (standard: Administrator) |
ILO_G9_PASS |
Passordet du har satt i iLO-panelet |
ILO_G9_NAME |
Valgfritt visningsnavn som vises i varsler |
NTFY_URL |
Full URL til ntfy-instansen din inkludert topic |
ALERT_COOLDOWN |
Sekunder mellom gjentatte varsler (standard: 3600) |
Steg 4 - Kjør installasjonen
bash install.sh
Dette installerer ipmitool, oppretter mappestruktur, kopierer filer og setter opp cron.
Steg 5 - Test
bash /opt/ilo-monitor/ilo_monitor.sh test
Du skal motta et testvarsel i ntfy.
Kommandoer
bash ilo_monitor.sh # Full sjekk: SDR + SEL
bash ilo_monitor.sh test # Send testmelding til ntfy
bash ilo_monitor.sh sel # Vis rå SEL-logg
bash ilo_monitor.sh sdr # Vis rå SDR-sensordata
bash ilo_monitor.sh status # Vis state-filer, SEL-markører og logg
bash ilo_monitor.sh reset-alerts # Nullstill cooldown-states
bash ilo_monitor.sh reset-sel # Nullstill SEL-markører (re-varsler alt)
bash ilo_monitor.sh help # Vis alle kommandoer
Filer
| Fil | Beskrivelse |
|---|---|
ilo_monitor.sh |
Hovedscriptet - overvåker iLO og sender varsler |
config.env |
Konfigurasjonsfil med credentials og innstillinger |
install.sh |
Installasjonsscript som kjøres inne i LXC-en |
Logging
Alle hendelser logges til /var/log/ilo-monitor.log:
tail -f /var/log/ilo-monitor.log
Sikkerhet
config.envharchmod 600- kun root kan lese credentials- iLO-brukeren bør ha skrivebeskyttet tilgang (read-only) i iLO-panelet
- Credentials ligger kun lokalt på LXC-en