Tomasz Sulik

Tomasz Sulik Technical
Specialist, Sabio
Ltd.

Temat: Monitorowanie serwerów

Krótko i zwiezle. Polecam Nagiosa. Monitorujemy 400 hostow, i prawie 4000 uslug w systemie rozproszonym. 21 roznych klientow, ktorzy schowani sa za swoimi firewallami ( nagios obsluguje polaczenia szyfrowane ). Opoznienia nie przekraczaja 1s, przy klientach oddalonych o ok 600km. Od momentu powstania eventu/incydentu do otrzymania maila przez support desk mija ok. 1,5 sec. W support centre uzywamy Nagvisa http://nagvis.org/, ktory wyswietla rotacyjnie mapki technologi (super gadget dla klientow). Ponadto masz mozliwosc generowania grafow (wraz z przchowywaniem historii) przy uzyciu pnp4nagios http://docs.pnp4nagios.org/pnp-0.6/start , masa roznych gotowych pluginow na stronie http://exchange.nagios.org/. Jako backend dla Nagvisa i pnp4nagios polecam mklivestatus http://mathias-kettner.de/checkmk_livestatus.html. Duza dowolnosc jezeli chodzi u uzycie spersonalizowanych skryptow/programow. Polecam pisane w perlu/C/C++ dla linuxa i c# dla windowsa. Pelne wsparcie dla SNMP. Notyfikacje wysylane przez lokalny/zdalny serwer smtp. Pierwsza konfiguracja wymaga troche pracy i czasu. W zamian otrzymujesz wielka otwartosc systemu. Moge smialo stwierdzic, ze jest to najbardziej "konfigurowalny" system monitorujacy.

konto usunięte

Temat: Monitorowanie serwerów

Kamil Grabowski:
Munin ma tylko jedną poważną rzecz - rozdzielczość wykresu. Dokładnie nie pamiętam, ale on zbiera statsy co 5 minut chyba, co jest stosunkowo za wolno. Dla przykładu zamiast zaobserwować duży skok ruchu na Twoim serwerze www, zobaczysz tylko uśrednioną wielkość.

Moim zdaniem dużo lepszym rozwiązaniem jest collectd. Zbiera statystyki co 10 sekund.

PS. Oczywiście można pogrzebać w muninie i zmienić ziarnistość w plikach RRD do 10 sekund, ale tu też trzeba się trochę pomęczyć :)
Tylko collectd jest napisany w C więc obciązenie maszyny jest praktycznie zerowe.
U mnie akutalnie zbiera jakieś 500 datapointów/sek żrąc jakieś 1% maszyny monitorującej oraz jakieś 150 kbajtów pasma dysku (pliki rrd po tworzeniu nie rosną). Jest też plugin pozwalający robic checki nagiosowe na wartości w collectd
Mirek Kiryk

Mirek Kiryk DBA ORACLE / Unix
Administrator /
Aplication
Administrator

Temat: Monitorowanie serwerów

witam
sporo fajnych narzędzi opisali koledzy, a ja tylko dodam komplet który działa u mnie w firmie.
NAGIOS -za pomocą niego prowadzimy monitoring wszystkiego co działa w firmie.
CENTREON - połączony z nagiosem i różne pluginy, dobry interfejs graficzny i monitorujący.

efekt - za darmo system który monitoruje wszystko i nie jest trudny w utrzymaniu ( ale trudny w instalacji :) )
Tomasz Zięba

Tomasz Zięba astozi | astozi lab

Temat: Monitorowanie serwerów

Z cyklu "nagios-core"

http://www.opsview.com/

Pozdrawiam
Michał Panasiewicz

Michał Panasiewicz Administrator
systemów, sieci i
aplikacji.

Temat: Monitorowanie serwerów

Ze swojej strony też polecam Nagios-a + dodatki do niego.

Osoby zainteresowane nim zapraszam do grupy:
http://www.goldenline.pl/grupa/nagios
Artur Bicki

Artur Bicki IT Manager, EMCA
S.A.

Temat: Monitorowanie serwerów

A pracuje ktoś z Was na komercyjnym Nagiosie, albo na jego lepszej wersji Op5Monitor ?
Op5 zrobiło z nagiosa produkt typu nice and easy, przy zachowaniu wszystkich cech tego otwartego produktu. Nadal robimy co chcemy, ale wygląda to super. Łącznie np ze zintegrowanymi wykresami które dalej możemy włączać do raportów.

Demo:
https://sandbox.op5.com/monitor/index.php/default/show_...

Ciekaw jestem Waszego zdania.Artur Bicki edytował(a) ten post dnia 16.12.10 o godzinie 16:14

Temat: Monitorowanie serwerów

Generalnie nakładki na nagiosa mają to do siebie że owszem ładniw wyglądają (domyśly interface nagiosa jest jakieś 2 epoki do tyłu) ale tak czy inaczej trzeba poznać specyfikę konfiguracji nagiosa żeby je skonfigurować, a pisać w pliku tekstowym jest po prostu szybciej niż klepać to samo w webowe formy

A sam op5 wygląda całkiem fajnie, ale szczerze mówiąc do statów preferuje soft zaprejektowany od początku do tego np. collectd, genialna (domyślnie zbiera dane co 10s, minimum 1s) rozdzieczość, dużo pluginów, minimalne obciążenie maszyny, zarówno logowanej jak logującej (~3.5k metryk, każda logowana średnio co 10 sek generuje jakieś 170KB/s zapisów i 50 ops/sek a można stuningowac do mniej, domyślnie zapis do plików RRD więc baza nie rośnie z czasem), chociaż niestety same frontendy do wykresów są średnio ciekawe
Artur Bicki

Artur Bicki IT Manager, EMCA
S.A.

Temat: Monitorowanie serwerów

Wiesz, op5 Monitor to nie jest soft dla osób które preferują wszystko zrobić po swojemu. To raczej alternatywa dla tych co znają dobre imię Nagios.org , ale nie stać ich na to czasowo. Tu płacimy za licencję, ale wszystko chodzi jak trzeba. No i nie jest to jakiś skaner SNMP, tylko kawał dobrej aplikacji ponieważ wewnątrz jest Nagios i inne dobre projekty opensource.
Artur Nowakowski

Artur Nowakowski Delivery Project
Executive

Temat: Monitorowanie serwerów

Zachęcam do zapoznania się z rozwiązaniem IT service assurance firmy Verax Systems (http://veraxsystems.com/pl/products/nms). Nie będę reklamował systemu, bo reprezentuję producenta. Na stronie internetowaj znajduje się pełna dokumentacja, white papers, prezentacje, liczne zrzuty ekranów, studia przypadków wdrożeń oraz wersja demonstracyjna.

Obrazek
Radosław Bąk

Radosław Bąk specjalista d/s
informatyki, IPOPEMA
Securities S.A.

Temat: Monitorowanie serwerów

Tomasz Sulik:
Krótko i zwiezle. Polecam Nagiosa. Monitorujemy 400 hostow, i prawie 4000 uslug w systemie rozproszonym. 21 roznych klientow, ktorzy schowani sa za swoimi firewallami ( nagios obsluguje polaczenia szyfrowane ). Opoznienia nie przekraczaja 1s, przy klientach oddalonych o ok 600km. Od momentu powstania eventu/incydentu do otrzymania maila przez support desk mija ok. 1,5 sec. W support centre uzywamy Nagvisa http://nagvis.org/, ktory wyswietla rotacyjnie mapki technologi (super gadget dla klientow). Ponadto masz mozliwosc generowania grafow (wraz z przchowywaniem historii) przy uzyciu pnp4nagios http://docs.pnp4nagios.org/pnp-0.6/start , masa roznych gotowych pluginow na stronie http://exchange.nagios.org/. Jako backend dla Nagvisa i pnp4nagios polecam mklivestatus http://mathias-kettner.de/checkmk_livestatus.html. Duza dowolnosc jezeli chodzi u uzycie spersonalizowanych skryptow/programow. Polecam pisane w perlu/C/C++ dla linuxa i c# dla windowsa. Pelne wsparcie dla SNMP. Notyfikacje wysylane przez lokalny/zdalny serwer smtp. Pierwsza konfiguracja wymaga troche pracy i czasu. W zamian otrzymujesz wielka otwartosc systemu. Moge smialo stwierdzic, ze jest to najbardziej "konfigurowalny" system monitorujacy.


Również polecam "Check_MK" http://mathias-kettner.de/check_mk (wszytko w jednym tzn. Nagios + grafy + nagvis itd). Bardzo łatwo można pisać swoje "checki" ;) lub korzystać z pluginów Nagiosa.
Michał Gruchała

Michał Gruchała Skalowalność,
wydajność,
niezawodność

Temat: Monitorowanie serwerów

U mnie akutalnie zbiera jakieś 500 datapointów/sek żrąc jakieś 1% maszyny monitorującej oraz jakieś 150 kbajtów pasma dysku (pliki rrd po tworzeniu nie rosną). Jest też plugin pozwalający robic checki nagiosowe na wartości w collectd

Polecam colectd. Jest super prosty i dzieki temu "samo sie robi".
Trzeba pamietac, ze jak ma sie duzo hostow do rysowania i sporo wykresow na nich, to za chwile bedzie problem z dyskiem na collect-server

Co do nagiosa i collectd - w duzej (mysle, ze najwiekszej w Polsce) skali:

http://www.slideshare.net/sn1p3r/barcamp-08062010

konto usunięte

Temat: Monitorowanie serwerów

Wątek bez końca :)
Z mojej strony wcześniej zawsze nagios +cacti, aktualnie całość przeniosłem na zabbix'a i planuje przejście w drugiej firmie tak samo.

Najgorsze jak zawsze jest zmienienie przyzwyczajeń ale zintegrowanie całości w jednym miejscu, prosta konfiguracja, możliwość zarządzania większą ilością serwerów - wszystko bezbolesne. Brakujące elementy łatwo można dodać do monitoringu przez proste skrypty i edycję konfiguracji poszczególnych agentów. Nie wiem jak się sprawdzi przy dużej ilości danych, przy kilkunastu serwerach nie widać obciążenia, zawsze >1%.

Dostajemy Cacti + Nagios w jednym miejscu, nic po za tym się nie zmienia. Możliwości z grubsza te same. Z różnic to jeszcze fakt że jest to rozwiązanie "mocno klikane" co na początku szczególnie użytkowników nagios'a może irytować ;)

Pozdrawiam
Karina Z.

Karina Z. Middleware
Specialist

Temat: Monitorowanie serwerów

U nas mamy Tivoli Enterprise Console.

Sporo czasu zabrala nam odpowiednia konfiguracja, dostosowana do naszych potrzeb.
Jest tez sporo minusow, ale w gruncie rzeczy jest to bardzo korzystne narzedzie.

POzdr,
Karin
Artur Bicki

Artur Bicki IT Manager, EMCA
S.A.

Temat: Monitorowanie serwerów

Widziałem wdrożenie Tivoli które udało się dopiero za drugim razem i w sumie po 2,5 roku . Dobre oprogramowanie, złego słowa nie powiem bo mi nie wypada. Jakoś jednak jak widzę farmę serwerów i wdrożenie na miesiące, a tak na prawdę chcę mieć informację o zajętości dysków to czuję się jak na polowaniu z armatą...
Wojciech C.

Wojciech C. Making things done
is my core
competencies

Temat: Monitorowanie serwerów

A ja sam skryptuję (/proc + snmp) tylko mam mały problem z RRDtool z niektorymi wykresami, np.:

1. Monitoring router'a: via SNMP z serwera usługowego odycztuję obciązenie interfejsów. Dziala, ale czas odswiezania jest słaby, srednio co 15-20s. SNMP router-a to odswieza, przez to wykresy nie są dokładne (wiem, bo równolegle uzywam LSTAT na tej maszynie)
2. Monitoring portów switchy; switche przekazują do mojego SNMP-servera obciazenie portów błędnie. Przykładowo na wykresie jest 8Mb/s a w rzeczywistosci jst to 80Mb/s. Podbilem tą wartość mnożąć razy 10 odczytaną wartość, ale wtedy na wykresie z jednoski "M" robi się "P" i wykresy są mocno poszarpane.

Jakieś sugestie?

Pozdrawiam,
Wojtek
--
Edit : 10.07.2011
Ad1. Trzeba zmienić standardową wartość 15s na inną(np. 1s) i to juz mam zrobione.Wojciech C. edytował(a) ten post dnia 10.07.11 o godzinie 11:34

konto usunięte

Temat: Monitorowanie serwerów

Wojciech C.:
2. Monitoring portów switchy; switche przekazują do mojego SNMP-servera obciazenie portów błędnie. Przykładowo na wykresie jest 8Mb/s a w rzeczywistosci jst to 80Mb/s.
Szczerze mówiąc to brzmi jak "przekręcanie się" (overflow) 32-bitowych liczników. Spróbuj użyć Counter64, przy czym musisz do tego użyć SNMP w wersji co najmniej 2.

HTH
Wojciech C.

Wojciech C. Making things done
is my core
competencies

Temat: Monitorowanie serwerów

OK spróbuję.

--
Edit:

To było to - DZIĘKI!

Pozdrawiam,
WojtekWojciech C. edytował(a) ten post dnia 10.07.11 o godzinie 12:49
Grzegorz Rumatowski

Grzegorz Rumatowski devops | sre |
sysadmin |
application engineer
| system a...

Temat: Monitorowanie serwerów

Uzywałem Nagiosa i Cacti. Nie wiem czemu ale cacti mi zaczął się pluć błędami po 3 dniach. Potrzebowałbym coś, co ma lepsze autodiscovery SNMP (Nagios się średnio nadaje)Grzegorz Rumatowski edytował(a) ten post dnia 14.07.11 o godzinie 13:15
Artur Bicki

Artur Bicki IT Manager, EMCA
S.A.

Temat: Monitorowanie serwerów

op5 Monitor ma dodanego wizzarda do skanowania jednego lub cełej grupy hostów po SNMP. Podajesz community, wybierasz grupę urządzeń, a aplikacja sama wykona połączenie snmp i zaproponuje Ci do akceptacji odkryte wartości.

Następna dyskusja:

Monitorowanie fork()-ów




Wyślij zaproszenie do