konto usunięte

Temat: Kilka serwerów ESX oraz współdzielony storage

Z tego co piszesz. to zdecydowanie kup nową macierz, tamtą to już chyba inni zajechali, albo sa problemy z światłowodami, kartami, portami na FC skoro takie komunikat dostajesz. No i ta pojemność wykorzystywana przez innych. Te EMC się męczy ciekawe czy administrator storage monitoruje jej obciążenie?
Jakub D.

Jakub D. Administrator

Temat: Kilka serwerów ESX oraz współdzielony storage

Karol S.:

Czyli mam rozumieć że macierz wymięka z wydajnością ?
Jeszcze kwestia, czy komunikaty o braku dostepu do datastore dostajesz ze wszystkich hostow czy tylko z jednego?

Bo jak z jednogo, to zaczal bym od sprawdzenia/wymiany swiatlowodow oraz karty HBA (trzeba tez zweryfikowac, czy firmware HBA jest w odopwiedniej wersji - przy czym, nie koniecznie musi to byc wersja najnowsza...).

Jesli ze wszystkich - to trzeba przyjzec sie maciezy ale tez switchom FC.

Moze ktorys z kontrolerow macierzy jest przeciazaony i moze da sie inaczej rozlozyc obciazenie?
Czy jest czas, ze macierz jest mniej obciazona? czy wtedy tez wystepuje problem?


Sprawdzałem zalecane jest Round Robin, kwestia że zalecają też PowerPath'a(jakiś sterownik lepszy do macierzy na ESX) ktróry z tego co doczytałem jest możliwy tylko dla płatnych wersji ESX.

Nie jestem pewien, czy tylko dla platnych wersji, ale o ile wiem PowerPath/VE jest sam w sobie platny.
Ale nawet bez niego, sciezki nie powinny byc gubione.
Dostawca macierzy uznał że do ESXi lepiej jest użyć "wielu małych LUN'ów niż jednego dużego" Zgadza się utrudnia to koszmarnie zarządzanie ponieważ mam bardzo dużo lunów, wolał bym mieć po jednym na datastore. Kierowałem się tym co powiedział dostawca, że wydajniej będzie pracować to na wielu lunach. Jeśli nie ma to znaczenia ile logicznych ścieżek jest do macierzy to wolał bym po jednej na filesystem(datastore).

Zdecydowanie wskazane jest, by sciezki byly przynajmniej dwie (redundancja).
Po tym, co napisales powyzej, zastanawiam sie, czy nie mieszasz odrobine pojec, bo LUN to nie to samo co sciezka (zwykle jeden LUN jest dostepny przez wiele sciezek) - a o ile dobrze rozumiem z powyzszych zdan, Ty traktujesz te pojecia zamiennie?

Wieksza ilosc LUNow ma sens (kazdy ma oddzielna kolejke), ale tez nie nalezy przesadzac moim zdaniem i jeden LUN na jeden dysk to troche duzo.
Gdy pracowalem z Symmetrix V-MAX, to zespol sotrage'owy wystawial nam dla vSphere standardowe LUNy wielkosci, o ile dobrze pamietem, 1,6 TB (o ile nie bylo jakis specjalnych zapotrzebowan na nietypowa wielkosc).
Używam ESXi5.0 oraz ESXi5.1 wersje darmowe.

A VMFS masz/planujesz miec w wersji 3 czy 5 ?

Pozdrawiam!

Temat: Kilka serwerów ESX oraz współdzielony storage

Kiedyś miałem podobną sytuację ale targetem był scst który kosztuje 0zł a nie macierz za dużą bańkę;) Z tego co pamiętam pomógł jakiś patch od vmware.
Ogólnie ja nie przepadam za EMC niższym niż symmetrix - maiłem bardzo złe doświadczenia z CLARiiONem i chyba nawet toporne (w zarządzaniu)Fujitsu jest od tego lepsze ;)
Daniel W.

Daniel W. Architekt ;)

Temat: Kilka serwerów ESX oraz współdzielony storage

Tomasz W.:
Kiedyś miałem podobną sytuację ale targetem był scst który kosztuje 0zł a nie macierz za dużą bańkę;) Z tego co pamiętam pomógł jakiś patch od vmware.
Ogólnie ja nie przepadam za EMC niższym niż symmetrix - maiłem bardzo złe doświadczenia z CLARiiONem i chyba nawet toporne (w zarządzaniu)Fujitsu jest od tego lepsze ;)
Fujitsu - EMC,Eternus,Netapp które masz na myśli dokładnie ?

Temat: Kilka serwerów ESX oraz współdzielony storage

Przeczytaj jeszcze raz i będziesz wiedział co mam na myśli. Zwłaszcza że słowo "netapp" nie występuje w mojej wypowiedzi aodnoszę się to głównego problemu o którym pisał autor wątku.Ten post został edytowany przez Autora dnia 11.08.13 o godzinie 22:26

Temat: Kilka serwerów ESX oraz współdzielony storage

Dodam kilka rzeczy:
- kontrolujcie kolejkowanie w dostępie do storage;
- w dyskusji czy iść w RAIDa10 czy 5/6 to wszystko zależy od wydajności/oczekiwań. Od jakiegoś czasu Vmware w best practices rekomenduje używanie Storage DRS. Polecam dorzucić tam troche RAIDa 10 trochę 5/6 rozbić to na dwie macierze i nie martwic się na zapas. Mam to i się sprawdza.
Wprawdzie mozna tworzyc datasotre z wielu LUNow (multiextent), ale nie wiecej niż z 32 (http://kb.vmware.com/selfservice/microsites/search.do?...
>tylko, o ile uzywany jest VMFS-5, zwykle nie niesie to wyraźnych korzyści, a jedynie komplikuje zarządzanie.

Ale można podnieść wydajność rozbudowując storage vmware-owe o Luny z różnych macierzy, ale do tego trzeba mieć sprawdzone, stabilne środowisko fizyczne do poziomu zasilania włącznie, bo po awariach ciężko poskładać wszystko do kupy.
Jakub D.

Jakub D. Administrator

Temat: Kilka serwerów ESX oraz współdzielony storage

Zgadzam sie z przedmowca - choc do SDRS trzeba vCenter, a o ile rozumiem, w tej sytuacji sa hosty 'standalone'.

Co do zwiekszenia wydajnosci poprzez rozlozenie obciazenia na kilka macierzy/kontrolerow, zgoda, ale a) trzeba miec te kilka macierzy i b) moim zdaniem warto to probowac gdy faktycznie srodowisko ma bardzo duze wymagania wydajnosciowe jestesmy pewni, ze pojedyncza macierz nie daje rady (co trudno mi sobie wyobrazic przy kilku hostach, chyba, ze macierz jest pare generacji starsza, ma tylko pare dyskow, slabszy procesor i mniej ramu, niz wspolczesny smartfon ;) ).

Pozdrawiam

konto usunięte

Temat: Kilka serwerów ESX oraz współdzielony storage

Przepraszam za opóźnienie ale urlopowałem. Dzięki za zainteresowanie i odpowiedzi.

- Informację o opóźnieniach otrzymuję z kilku serwerów, nie jest to w żaden sposób regularne. Opóźnienia nie występują cały czas.

- Dodam że nie mam 4 maszyn wirtualnych, tylko około 50, gdzie co najmniej kilka z nich posiada bazy danych i spore I/O. Te z widnowsem się frezują, ale jedna z Free bsd także się zamroziła.

- Do serwerów prowadzą po 2 fizyczne ścieżki FC 4GB . Jeśli chodzi o Luny to ja to traktuję jako logiczne ścieżki do macierzy, stąd pisałem że jeśli jest ich więcej i nie zapcha się fizycznych ścieżek FC to wydaje mi się że więcej jednoczesnych I/O można wykonać, ponieważ jest zaalokowane więcej dysków jednocześnie.

- Wszędzie posiadam VMFS 5

- Nie mam kasy na nową macierz:( i. Mało tego za rok wsparcie będzie droższe niż cała ta macierz.

- Posiadamy inne macierze , jednak nie ma mowy o rozłożeniu storage po różnych macierzach, dlatego że znacznie odstają wydajnośćiami.

- 2 razy w miesiącu, od 00 - 6:00 backupuje maszyny Ghetto VCB ale zapisują się na innej macierzy ( właśnie na CLARIONIE)

W zasadzie, jestem skazany na osoby zajmujące się switachmi FC, macierzą, o monitoring obciążenia wtedy wysnuć jakieś wnioski. Niestety na macierz nową nas na razie nie stać muszę sprawdzić wszystko co możliwe, ewentualnie wirtualki mocno obciążające odesłać na blachę. Pozdrowienia!Ten post został edytowany przez Autora dnia 02.09.13 o godzinie 12:03
Daniel W.

Daniel W. Architekt ;)

Temat: Kilka serwerów ESX oraz współdzielony storage

Tomasz W.:
Z tego co piszesz. to zdecydowanie kup nową macierz, tamtą to już chyba inni zajechali, albo sa problemy z światłowodami, kartami, portami na FC skoro takie komunikat dostajesz. No i ta pojemność wykorzystywana przez innych. Te EMC się męczy ciekawe czy administrator storage monitoruje jej obciążenie?

Kupić nowego DMX-a hymm ;)
Jakub D.

Jakub D. Administrator

Temat: Kilka serwerów ESX oraz współdzielony storage

Karol S.:
- Informację o opóźnieniach otrzymuję z kilku serwerów,

To zdecydowanie trzeba sprawdzic switche i macierz - gdyby z jednego, to moglyby byc winne kabelki do hosta lub HBA.

- Do serwerów prowadzą po 2 fizyczne ścieżki FC 4GB . Jeśli chodzi o Luny to ja to traktuję jako logiczne ścieżki do macierzy, stąd pisałem że jeśli jest ich więcej i nie zapcha się fizycznych ścieżek FC to wydaje mi się że więcej jednoczesnych I/O można wykonać, ponieważ jest zaalokowane więcej dysków jednocześnie.

LUN a sciezka to nie to samo - jeden LUN zwykle jest widoczny po wielu sciezkach.
Co do jednoczesnych IO to zalezy od konfiguracji/mozliwosci macierzy i ESXa - przy ustawieniu 'fixed path' do storage'u IO lepsze nie bedzie, przy 'Round Robin' moze byc.
- Posiadamy inne macierze , jednak nie ma mowy o rozłożeniu storage po różnych macierzach, dlatego że znacznie odstają wydajnośćiami.

To nie musi byc takie oczywiste - jesli masz dwie macieze (nazwijmy je A i B), o wydajnosci powiedzmy X (IOPS) i 10*X (dziesiec X) , macierz A zostanie obciazona 0,5*X (pol X) operacjami a macierz B 100*X (sto X) - to macierz B bedzie miala wieksze opoznienia, bo jej obciazenie przekracza mozliwosci (a macierz A wciaz ma zapas).

Zatem - jesli masz macierz teoretycznie slabsza, ale nie obciazona, to przeniesienie tam czegokolwiek z macierzy przeciazonej - poprawi prace calosci.
W zasadzie, jestem skazany na osoby zajmujące się switachmi FC, macierzą, o monitoring obciążenia wtedy wysnuć jakieś wnioski.

Tak, od tego trzeba by zaczac :)
Niestety na macierz nową nas na razie nie stać muszę sprawdzić wszystko co możliwe, ewentualnie wirtualki mocno obciążające odesłać na blachę.

Zdecydowanie, optymalizacja nie polega na zmianie sprzetu, gdy tylko cos przestaje dzialac ;)

Bardzo mozliwe, ze sytuacje poprawilo by wlaczenie Storage IO Control - ale to wymaga licencji i to Enterprise Plus, o ile pamietam :(
Jeszcze pytanie, czy problem dotyczy wszystkich, czy tylko niektorych datastore'ow? bo jesli niektorych, to moze wystarczy rozmiescic inaczej wirtualne dyski na datastoreach.
Trzeba troche posiedziec nad wykresami performance, ale powinno Ci sie udac znalezc najbardziej problematyczne VMki.

Pozdrawiam,

Temat: Kilka serwerów ESX oraz współdzielony storage

Jak zawodzą wykresy to w diagnostyce pomaga jeszcze
http://kb.vmware.com/selfservice/microsites/search.do?....
Jakub D.

Jakub D. Administrator

Temat: Kilka serwerów ESX oraz współdzielony storage

Lub takie dodatkowe narzedzie http://www.yellow-bricks.com/2013/07/08/cool-tool-visu...

ktore protrafi miedzy innymi rysowac wykresy z danych esxtop :)

konto usunięte

Temat: Kilka serwerów ESX oraz współdzielony storage

Witajcie,

Rozpocząłem batalię o zmniejszenie latencji która sięga czasami do 1 000 000 mikrosekund, to całą sekunda!

Jakubie, w odpowiedzi na Twoje pytanie: problem dotyczy poszczególnych datastorów, (w sensie raportuje mi konkretne luny, jednak nie są to zawsze te same). Podejrzewam że systemy goście mają tak zróźnicowane obciążenia że czasami całkiem przypadkiem nakłada się spora liczba operacji I/O.

Zainstalowałem sobie Veem One w wersji free, dość sporo oferuję za darmo:P i staram się śledzić wykresy,
Wskazane przez Was narzędzia, wyglądają ciekawie, na pewno je przetestuję.

Poprosiłem też o pomoc osoby z EMC które świadczą nam wsparcie. Podałem konkretne luny godziny w których występuję duża latencja, ewentualnie zerwanie ścieżki - zobaczymy co powiedzą.

Ps. Czy zerwanie ścieżki (lost access to volume) jest konsekwencją za dużej latencji? Pozdrowienia,

Karol
Jakub D.

Jakub D. Administrator

Temat: Kilka serwerów ESX oraz współdzielony storage

Karol S.:
Ps. Czy zerwanie ścieżki (lost access to volume) jest konsekwencją za dużej latencji?

Raczej tak, jak oczekiwanie na odpowiedz od macierzy przekroczy granice cierpliwosci hosta (timeout), to sciezka zostanie oznaczona jako padnieta/offline.
Karol Sok

Karol Sok Student, UAM

Temat: Kilka serwerów ESX oraz współdzielony storage

Witam,

Dla potomnych, oraz osób które interesował temat. Chciałbym podać potwierdzone rozwiązanie tematu. Okazało się że macierz nie daje rady - problemem jej wydajności były nie tylko dyski, ale także oprogramowanie macierzowe "optymizer" które działało za dnia i znacząco obciążało macierz. Problem został usunięty (optymizer działa teraz w nocy) - na nowe dyski narazie nie możemy sobie pozwolić. Zerwanych ścieżek już nie widuje. Latencja nadal się pojawia ale jest o wiele mniejsza. Pozdrowienia!

Karol

konto usunięte

Temat: Kilka serwerów ESX oraz współdzielony storage

Latencja nadal się pojawia ale jest o wiele mniejsza.
Nie nadal.
Latencja zawsze jest. Mniejsza czy wieksza, ale jest.

Następna dyskusja:

jak podpiac usb storage do ...




Wyślij zaproszenie do