서버이중화/재해복구 솔루션 – MIMIX & Double Take
서버이중화나 재해복구시스템은 왜 필요할까요?
일반적인 시스템장애/재해에 대한 통계를 보면 전체 서비스중단시간 중 약1%는 재해로 인해 발생하고 약9%는 각종 장애로 인해 발생하며 나머지 약90% 의 서비스 중단은 계획된 서비스중단시간으로 나타나고 있습니다. 계획된 서비스중단시간이라 함은 서비스중단을 예고하는 경우로 시스템백업이나 업그레이드, 패치작업, 시스템교체, OS 버전업그레이드, 솔루션의 설치 등 다양한 이유로 실제 시스템 서비스가 중단되는 경우를 말합니다.
그렇다면 서비스장애 발생율이 가장 많은 90%에 해당하는 계획된 장애를 대비한 이중화나 재해복구시스템을 구축하는 것이 과연 가장 효율적일까요? 서버이중화나 재해복구시스템은 효율성으로 검토할 수 있는 대상은 아니라고 봅니다. 단 1%확율의 재해로 인한 서비스중단은 확율이 매우 미미하지만 발생할 경우 회사의 존폐를 결정할 수 있는 절대적 영향을 미칠 수 있기 때문입니다. 또한 9%정도의 장애의 경우에도 최악의 경우 상당한 분량의 데이터 손실과 서비스 중단이 발생 할 수 있으므로 치명적인 영향을 미치기에 충분할 것입니다.
그러므로 기업의 성격과 업무특성을 고려하여 전사적 BCP(Business Contingency Plan) 을 수립하고 수립된 계획에 맞추어 기업에 가장치명적 영향을 미칠 수 있는 부분부터 우선적으로 보호장치를 마련해야 할 것입니다. 9.11테러사건때 무너진 쌍둥이빌딩에 입주해 있던 수많은 조직들중 실시간 재해복구시스템을 가동중이었던 조직들은 단 하루만에 정상적 전산서비스를 가동할 수 있었지만 그렇지 않았던 많은 조직들 중 많은 조직은 회생하지 못한것을 우리는 보았습니다.
결론적으로 일반적인 제안을 드린다면 발생확율의 역순으로 전산시스템의 복구계획을 수립하는 것을 권고드립니다. 제일먼저 재해복구시스템을 갖추고 그다음 서버이중화를 도입하는 것이 바람직 하다고 봅니다. 물론 동시에 구축하는 것이 가장 이상적입니다만 비용문제가 따르겠죠. 또한 예외적으로 생산시설의 운영시스템의 경우는 재해복구시스템 보다는 서버이중화가 우선순위가 될 것입니다. 재해로 공장시설이 가동불가능인데 시스템만 살아있는 것이 별 의미가 없을 테니까요…
솔루션개요
IBM의 Power서버(OS/400 및 AIX)및 Windows Server를 위한 서버이중화 및 재해복구솔루션으로서 디스크솔루션을 이용한 이중화/재해복구 방식과 달리 매우 유연한 S/W방식으로 구성되어있으며, IBM으로부터 공인된 유일한 서버이중화/재해복구솔루션입니다.
제조사소개 – 미국 캘리포니아 Irvine 에 본사를 둔 Vision Solutions 사의 제품으로 S/W방식의 HA/DR솔루션의 업계 선두주자이며, JSE 에 상장 기업인 IDION group의 계열 회사로 1990년에 설립되었습니다. 또한 전세계를 지역별로 기술 지원하는 조직과 24시간 Customer care center 를 통해 최상의 고객지원을 수행하여 매년 95% 이상 의 고객만족도를 획득하고 있습니다.
- 전세계적으로 5,000 이상 고객에 약 30,000대 이상의 시스템에 설치 운영중인 검증된 솔루션.
- IBM Power HA/DR 솔루션 회사 중 유일하게 SCP(Support Center Practices) 인증을 획득한 서비스 지원체계
- 서비스 파트너(비에이솔루션즈)의 검증된 (Vision Solutions 사의 Certified Engineer and Consultant 보유) 서비스
솔루션요약
주요기능 및 구조
아래의 주요기능은 IBM 의 iSeries Server(OS400)에 적용되는 MIMIX 솔루션에 대한 주요기능의 요약입니다. 기본적으로 저널데이터(Redo-log)를 이용하여 레코드단위의 데이터전송이 이루어 지게 됨으로 Block단위의 시스템복제 솔루션들에 비해 데이터 안정성이나 검증능력이 뛰어납니다.
기술의 주요특장점
일반적으로 레코드단위의 Transaction을 서버간에 복제하는 솔루션들은 발생데이터의 전송과 타겟서버에서의 Apply 속도문제가 발생합니다. 그러나 제안솔루션은 수십년간의 축적된기술로 고속의 저널데이터 패치기법과 타겟서버에서 복제데이타에 대한 고속 Apply 기술로 인해 시스템에 따라 시간당 최대 10억건이상의 데이터도 처리하고 있습니다. 일반적인 중형시스템의 경우 시간당 약1억건 내외의 데이터전송및 적용을 처리할 수 있습니다. 이정도의 처리속도는 일반적으로 보험사의 마감작업시 발생하는 데이터발생량 정도가 되겠습니다. 이정도 데이터를 발생시키는 고객사는 보험사 외에는 거의 본적이 없는 것 같네요…
그러므로 레코드단위의 정확한 데이터복제와 검증이 이루어지면서도 고속의 데이터복제가 가능한 유일한 솔루션이 되겠습니다. 아쉬운점은 본 솔루션의 경우 IBM의 iSeries 서버(OS/400)상에서만 동작한다는 점입니다. UNIX시스템에서는 이와 유사한 솔루션으로 Quest 사의 쉐어플렉스가 있지만 본 솔루션은 처리속도나 기타 기능적인 측면에서 비교할 수 없을 정도로 앞서있는 아키텍쳐를 가지고 있습니다. 예를 들면 쉐어플렉스는 DB데이터에 대해서만 처리하지만 MIMIX는 DB데이터만이 아니라 시스템내의 모든 오브젝트(사용자계정정보,프로그램,구성정보 등)의 변경부분에 대해서도 완전하게 처리가 되기 때문에 시스템 장애시 타겟시스템으로의 서비스전환이 매우 안정적으로 이루어 지게 됩니다. 만약, DB데이터만 복제한 시스템으로 서비스를 전환한다면 그 사이에 변경된 많은 시스템관련 정보들과 일치하지 않음으로 인해 어떤 문제가 발생할 지 알 수 없게 될 것입니다.
또 다른 큰 차이점은 모든 복제대상정보(DB 및 각종 오브젝트들)에 대해 실시간으로 정합성을 확인하고 만약 정합성이 일치되지 않는 오브젝트나 데이터가 존재할 경우 자동으로 정합성을 맞추는 매우 고도의 정합성 유지기술을 포함하고 있습니다.
다양한 재해복구솔루션들이 있지만 대부분은 디스크영역에서 변경 Block data를 단위로 복제를 하기 때문에 타겟볼륨에서 평상시 데이터를 확인할 방법이 없는 심각한 단점을 가지고 있습니다. 그래서 보완책으로 주기적인 스냅샷을 만들어서 데이터를 확인하거나 CDP기능을 이용해서 볼륨이 작동할 수 있는 시점을 찾아서 복구하는 등의 불완전한 방식을 추가적으로 체택하고 있는 실정입니다. 그러나 MIMIX의 경우 한 레코드단위까지 검증된 데이터가 동기식/비동기식(선택)으로 복제가 되며, 복제된 데이터에 대해서는 타겟시스템에서 항상 Read operation이 가능함으로써 데이터의 정합성을 언제든지 확인할 수 있으며 다양한 목적으로 활용도 가능하게 됩니다.
기대효과
HA/DR시스템 구축의 제안방향
단순히 운영시스템에 대한 이중화나 재해복구시스템의 솔루션구축만이 아니라 구축과정에서 분석된 정보와 업무적 이슈들을 통하여 IT업무프로세스 개선에 대한 방향도 제시하는 서비스를 제공합니다.
구축사례(국내입니다.)
현대모비스, 현대상선, 동부제철, ING생명보험, 라이나생명보험, 에이스생명보험, AIA생명보험, 한국교직원공제회, 전문건설공제조합, 교원, 아식스코리아, LG생활건강, 고려종합운수, 에스콰이아, 전세버스공제조합, 동국통운, 세방기업, 코원에너지,금호타이아 등
이중화나 재해복구시스템을 검토하실 경우 연락주시면 귀사의 업무요건과 상황을 고려한 최적의 안을 수립해 드리겠습니다. 언제든지 연락주시기 바랍니다. 감사합니다.
저희집에 같이 살고 있는 사랑이(골든리트리버 아가씨) 입니다. 퇴근하면 저를 제일 먼저 반기는… 사랑이 때매 아파트로 이사도 못가고 마당있는 집에서 이 추운 겨울에 개는 호강하고 우리는 너무 추워서 소위 개 고생하고 있습니다. 허 참나… 또 어디로 이사 가야하나…
강아지 문의: 김성진이사 010-6379-7943 sungjin@basolutions.co.kr