sistem de monitorizare nagios

Urmeaza un mini how-to despre instalarea si configurarea NAGIOS fara probleme.

In primul rand: exista prin distributii tot felul de variante modificate/adaugite/ciuntite de nagios. Dupa mai multe instalari pe Gentoo/Ubuntu/CentOS am ajuns la concluzia ca el mai usor de inteles este instalat din surse.

Cum functioneaza Nagios si ce rol are:

Nagios este un sistem complet si complex de monitorizare servicii/programe.
El se bazeaza pe interogari care le poate face la intervale de timp programat cu ajutorul unor mici programe denumite plugin-uri. Acele programe fac interogari pe serviciile publice si retunreaza un rezultat: 0 – OK, 1 – WARNING, 2 – CRITICAL. Daemonul principal verifica output-ul comenzii si trimite atentionari sau nu(dupa caz). Pentru interogari la distanta pe servicii non-publice este nevoie ca pe masina aflata la distanta sa fie instalat un daemon special. NRPE este unul care asteapta interogari, NCSA este unul care le trimite lui Nagios. Din practica NRPE pare mult mai util. Cum functioneaza: Pe masina tinta ruleaza acest daemon care asteapta interogari, binenetels de la o anumita masina. Daemonul principal Nagios cere o verificare catre NRPE, acesta o face si pe acel canal securizat returneaza output-ul plugin-ului executat.

Presupunem ca suntem root in sistem, creem un folder nagios:

mkdir nagios
cd nagios

Descarcam si dezarhivam daemonul principal Nagios, urmeaza compilarea:
wget http://belnet.dl.sourceforge.net/sourceforge/nagios/nagios-3.0rc1.tar.gz
tar xzvf nagios-3.0rc1.tar.gz
cd nagios-3.0rc1
./configure
make all
make install install-base install-cgis install-html install-config install-init install-commandmode

Urmeaza descarcarea plugin-urilor oficiale disponibile in pachetul nagios-plugins:

cd ~/nagios
wget http://surfnet.dl.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.11.tar.gz
tar xzvf nagios-plugins-1.4.11.tar.gz
cd nagios-plugins-1.4.11
./configure
make
make install

Daemonul NRPE(acesta contine si check_nrpe – plugin-ul cu care se fac interogarile la distanta)

wget http://switch.dl.sourceforge.net/sourceforge/nagios/nrpe-2.10.tar.gz
tar xzvf nrpe-2.10.tar.gz
cd nrpe-2.10
./configure
make
make install

Ce s-a instalat si unde, in /usr/local/nagios avem mai important:
etc – contine fisierele de configuratie
libexec – contine pluginurile

Urmeaza sa mutam continutulul lui etc in /etc  pe disc:
mv etc /etc/nagios
ln -ds /etc/nagios  /usr/local/nagios/etc

Verificam  sa functioneze plugin-urile:
cd libexec
./check_disk /
./check_icmp -H localhost

Ar trebuii sa avem rezultate care sa inceapa cu OK

Incepem configurarea efectiva:

cd /etc/nagios
editam nagios.cfg

o sa trebuiasca sa decomentam liniile care incep cu cfg_file si care tin de commands.cfg contacts.cfg timeperiods.cfg templates.cfg. Acestea sunt fisiere care se includ in configuratia lui Nagios. Ele contin asa

contacts.cfg – informatii despre administratori si despre notificarile pe care urmeaza sa le trimita sistemul
commads.cfg – definitiile comenzilor foloste. ca un Plugin sa poata fi folost el trebuie prima data definit in configuratia Nagiosului. Pentru o configuratie mai compacta in acest fisier sunt initial definite comenzile de baza.
timeperiods.cfg – intervalele de notificare, putem configura ca sistemul sa ne trimita notificarile si noaptea sau numai ziua(in zilele de lucru sau si in sarbatori/concedii) precum si intervalele la care se fac verificarile.

Urmeaza sa decomentam si linia care contine localhost.cfg. Acolo se definesc comenzile de verificare pentru masina in cauza.  La fel se pot defini fisiere noi cu fiecare masina monitorizata si incluse in nagios.cfg.

Verificam sa fie totul in regula in configuratii:

/usr/local/nagios/bin/nagios -v /etc/nagios/nagios.cfg

Se deruleaza o gramada de text unde ne scrie daca e totul in regula sau nu :)

Putem porni daemonun Nagios cu comanda:

/etc/init.d/nagios start

Urmeaza interfata web de administrare/vizualizare stare:

Verificam  ca in serverul web apache sa fie definite toate lucrurile coret in /etc/apache2/conf.d/nagios.conf (calea aceasta poate fi diferita in functie de distributie) dupa care repornim serverul web.

Definim parola administratorului:

htpasswd /etc/nagios/htpasswd.users nagiosadmin

Intram pe interfata web la adresa http://nume_calculator/nagios

HINT! Implicit nu este definita comanda check_nrpe. Aveti aici cum se defineste

define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
Pe site-ul NagiosExchane se pot gasi plugin-uri suplimentare precum si idei despre cum se pot configura.

Se pot monitoriza tot felul de lucruri interesante cum ar fi:
- numarul total al proceselor
- load-ul masinii
- toate seriviciile HTTP IMAP POP SMTP FTP PROXY SSH
- spatiu disponibil pe disc
- temperatura procesor/placa de baza, rotatiile coolerului
- daca exista update-uri de pachete disponibile
- startea SMART-ului la discuri
- bazele de date MySQL/PgSQL daca sunt pornite, daca accepta interogari
- numarul de utilizatori logati
- diverse programe/servicii pe statii windows daca sunt pornite sau nu
- starte routere/switch-uri prin SNMP
- starea imprimantelor de retea (interogari SNMP sau HTTP)
- interogari DNS aleatoare pentru a verifica daca serverele DNS sunt viabile
- autentificare pe diverse servicii
- verificari SBL/RBL

precum si multe altele.
Astept sugestii si intrebari fie ca si comentarii aici fie pe mail.

4 comentarii la “sistem de monitorizare nagios

  1. se presupune ca ai nevoie de un sistem de monitorizare
    monitorizezi totul cu o masina(calculator) care merge non stop
    poti sa tii un calculator cu windows nonstop functional?
    E nevoie de un sistem UNIX-like. Din aceasta categoorie face parte si LINUX si FreeBSD si OpenBSD si NetBSD si multe altele. Compilarea se face aproximativ la fel pe oricare :)

  2. Trebuie sa fac un proiect pentru monitorizarea unei retele wan.(eu trebuie sa prezint cum s-ar face si un mic exemplu).cum as putea face asta cu nagios si de ce as avea nevoie.sper sa imi raspundeti

  3. buna,

    de pe pagina http://library.nagios.com/library/products/nagiosxi/downloads/main am downloadat masina virtuala, am startat-o, am intrat pe adressa http://adresa ip (a masinii)/nagiosxi si totul pare sa functioneze cum trebuie.

    am instalat un server 2008 R2 intr-o alta masina virtuala, an instalat nrpe. in bin (de la nrpe) am modificat nrpe.cfg : allowed_hosts=adresa ip (a masinii pe care este nagios). pentru proba am dezactivat firewall pe 2008.

    problema este ca nagios (in web interface) imi arata ca 2008 este pornit, il poate accesa pe ping, dar date despre cpu, memorie, sunt la un nivel critic: eroare: conectare refuzata.

    unde ar putea fi problema, ca eu nu-mi dau seama!? este prima oara cand am contact cu nagios, chiar si in domeniul it sunt incepatoare :(

    multumesc!

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile necesare sunt marcate *

*

Poți folosi aceste etichete HTML și atribute: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="" highlight="">