Сървърните клъстери намаляват ИТ разходите

16 мар Сървърните клъстери намаляват ИТ разходите

Въпреки сравнително простата си структура, отказоустойчивите клъстери гарантират големи възможности за мащабиране и почти абсолютна надеждност. Обединяването на сървърите в такива структури често пести на компаниите пари за нови машини от по-висок клас, тъй като високата степен на готовност може да се осигури и с по-евтини възли. Затова този тип организация носи бизнес предимства не само за корпоративните потребители, но и за неголемите по размер фирми. Недостъпни бази данни, неработещи мрежови услуги, провалени заявки, ядосани и мърморещи клиенти – това е само малка част от възможните последствия при срив на критични за бизнеса системи и приложения.
А списъкът може да продължи още дълго и да генерира съвсем измерими финансови загуби с по няколко нули отзад. Именно затова корпоративните ИТ инсталации се изграждат така, че да бъдат максимално надеждни с цел времето за авариен престой да се намали до минимум. Отказоустойчивостта на ИТ инфраструктурата обикновено се определя с критерия “ниво на готовност” при всевъзможни изменения на корпоративния ИТ пейзаж. За приемлива стойност на въпросния параметър обикновено се смята 98%, но дори това положение означава, че има вероятност важните процеси да са недостъпни за около седмица всяка година. В някои бизнес сегменти това също е недопустимо, така че се налага прилагане на допълнителни средства, които да намалят отказите на критичните системи до минимум или дори до нула. Според специалистите, организирането на сървърите в т.нар. клъстери е една от класическите “хитрини”, прилагани за целта. От клъстер до клъстер има разлика Неотдавна в онлайн форума на Computerworld BG се проведе разгорещена дискусия на тема “що е то клъстер и доколко е уместен терминът за обозначаване на това или онова”. Е, при сървърите поне нещата са ясни: под понятието “клъстер” тук се разбира обединението на няколко сървърни машини в единна система. Категоризацията също е сравнително проста, тъй като обикновено става въпрос за два основни типа организации. Първият е т.нар. високопроизводителен клъстер, при който изчислителните задачи се разпределят между поне два (а обикновено доста повече на брой) сървъри или възли (nodes), така щото всичко да става максимално бързо. Другият вид са отказоустойчивите клъстери, при които акцентът е върху осигуряването на възможности за непрекъсната работа.
За най-простата възможна система от този тип са необходими всичко на всичко две машини, свързани така, че ако главната система излезе от строя, втората да служи като резервен вариант и да поеме автоматично изпълнението на задачите. Има и още по-елементарен вариант, при който в случай на отказ резервният сървър се пуска ръчно от администраторите, но той изисква постоянно присъствие на добре обучен персонал, а и времето за реакция е значително по-дълго. В съвременните отказоустойчиви клъстери отделните възли непрекъснато обменят помежду си съобщения за текущия статус (т.нар. тактови импулси). Ако по някаква причина основната система не отговори на някое съобщение, то резервната поема изпълнението на задачите – автоматично, и най-важното – незабавно. Именно по този начин организациите си спестяват скъпото време за престой на операциите и разходите за аварийно ангажиране на квалифициран персонал.

За разлика от случая с “ръчния” клъстер, при който възникналите в извънработно време или през нощта проблеми се забелязват чак на другия ден, модерната организация дава възможност за моментално възстановяване на системата и при нея престой практически няма. Освен това, ако има подходящи инструменти за мониторинг и управление съществува и полезната опция администраторът да бъде известен незабавно за случващото се в системата – чрез SMS или друг тип електронно съобщение. Сфери и начини на използване Възможностите на отказоустойчивите клъстери ги правят подходящи за обслужването на критичните за работата приложения като например електронната поща, комуникациите, логистичните системи, базите данни и средствата за електронен бизнес.
В тези случаи даже краткотрайните откази обикновено имат плачевни последствия. Ако да речем в сайт за онлайн търговия недостъпна се окаже системата за интерактивни поръчки, то евентуалните загуби от пропуснати заявки дори не могат да се изчислят. Предимствата на клъстерната организация в тази област изглежда очевидно. А освен че дава възможност за изграждане на ИТ решения с по-висока степен на готовност, понякога цената на клъстер от две машини може да се окаже и по-ниска, отколкото за един сървър от по-висок клас. Или пък може да спести покупката на нова машина, което не е без значение за компаниите с по-ограничени ИТ бюджети. По принцип базовата структура на отказоустойчивите клъстери е еднаква: сървърите общуват помежду си посредством връзка за тактовите импулси и информацията за статуса като използват обща система за съхранение (напр. дисков масив). При тази схема на работа всяка от машините винаги “знае” с какво се занимава другата и може да продължи процеса при евентуален срив.

Като цяло възможни са и две основни подконфигурации. Когато с изчисленията и обработката на данни се занимава предимно едната машина, а другата “чака” в резерв, организацията е от “активно-пасивен” тип. При другия вид – “активно-активните” клъстери – всички сървъри в обединението работят постоянно и могат да приемат и обработват заявките паралелно. В случай на авария в някоя от машините, натоварването автоматично се пренасочва към функциониращите. От гледна точка на отказоустойчивостта разликата между двата типа клъстери не е голяма, но принципно предимство на втората е по-доброто оползотворяване на наличните хардуерни ресурси.
Хубавото в цялата работа с клъстерите е, че те стават практически от всички съвременни сървъри. Достатъчно е към новопридобитата машина просто да се свърже по подходящ начин още един “възел”. Разбира се, клъстери могат да се правят и от повече от две сървърни системи, а възможностите за мащабиране с добавянето на нови машини са много широки. Всъщност основното при организирането на клъстер е да се внимава за отказоустойчивостта на системата като цяло и да не се допускат т.нар. “единични точки на възможен срив” (single point of failure). Добра идея за постигането на тази цел е предвиждането на резервираност не само за сървърите, но и по отношение на захранването, мрежата, устройствата за съхранение и т.н. Пространственото “разреждане” на сървърите (т.е. разполагането им в различни помещения или офиси) също се смята за една от добрите практики в областта, тъй като по този начин се гарантира по-добре достъпът до ИТ услугите дори в случай на пожар или друга крупна авария в някое от местоположенията.
Един от тънките моменти при организирането на клъстери е свързан с избора на софтуер. Въпреки че по принцип всички приложения за операционни системи като Windows, Linux и разновидностите на UNIX могат да работят на сървърни клъстери, не всяко от тях може да използва напълно предимствата на въпросната архитектура. В повечето случаи тези неоптимизирани за клъстери програми приемат възлите в организацията като обикновени сървъри. Оптимизираните за такава дейност приложения, от друга страна, имат възможности за превключване (т.нар. failover функционалност), с които гарантират нивото на отказоустойчивост. Необходимо условие за наличието на тези функции е поддръжката на мрежовия протокол ТСР/IP, чрез който се обменя информацията за статуса. Освен това важни са и възможностите на приложенията за определяне на място за съхраняване на данните. Такива обикновено имат базите данни, приложенията за файлови и принт сървъри и програмите за групова работа.
И накрая – управлението Естествено, няма как да се мине и без инструменти за администриране и управление на клъстерите. Те помагат при разпределението на задачите между различните възли и алокацията на ресурси за изпълнението им, а чрез тях обикновено могат да се прилагат също общи политики и конкретни правила за прехвърляне на натоварванията при отказ. Поради специфичните изисквания и нужди на всяка конкретна фирма, а и заради сложното взаимодействие на разгърнатите хардуерни и софтуерни системи, “готови” клъстери на практика няма.
Разработката на отказоустойчиво сървърно обединение обаче може да се улесни, ако за нея се използват компоненти, базирани на разпространени, отворени промишлени стандарти и интерфейси, единодушни са специалистите. Както е добре известно на опитните ИТ мениджъри и администратори, прилагането само на патентовани фирмени решения може да доведе до проблеми с взаимодействието и съвместимостта между различните хардуерни и софтуерни елементи на сървърите в клъстера. Допълнително предимство на стандартно-базираните архитектури е и това, че с тяхна помощ лесно може да се осъществи централизирано управление на цялата ИТ система.



.................................