[Redundancy/HA] RPR, RPR+, SSO overview

ITSY MAN ㅣ 2016. 7. 19. 14:14

반응형

HA(HSA: High System Availability) mode는 기본적으로 하나의 Router에서 System의 가용성을 높이기 위해서 2개의 RP(Route Processor) 설치하게 됩니다. RP나 Supervisor가 한 개 또는 두 개를 설치 및 구현할 수 있는 Model은 Chassis 형태의 Device만 가능합니다. 

 

이런 chassis 기반의 장비들은 기본으로 ColdRestart라는 가장 기본적인 System Availability기능을 제공하게 됩니다. 다시 말하면, 하나의 RP/Supervisor에 문제가 발생하게 되면, 다른 RP/Supervisor가 reboot을 하게 되고, 실제로 Router/Switch System들은 H/W의 fault에도 불구하고 Service를 계속적으로 제공할 수 있습니다. 

이런 기본적인 Concept을 구현하는 상황에서 가장 중요한 것은 무엇일까요? 바로 시간입니다. 

 

어떤 종류의 card에 대한 구현이든, 실제 동작하는 Active와 대기 상태의 (Backup)이 하나의 Device 안에서 운영되는 것은 기본적인 개념이지만, 문제는 얼마나 빠른 시간에 Service에 영향을 주지 않고, Failover가 되는 지가 가장 중요한 관건!! 

 

 

 

 

Redundacy mode는 크게 3가지로 나눠 질 수 있습니다. 

 

 1) Route Processor Redundancy  mode : 약자로 RPR mode라고 부릅니다. 

 2) Route Processor Redundancy Plus mode : RPR+ mode로 RPR 보다 나은 기술..? 

 3) Stateful Switchover : 약자로 SSO mode라고 부릅니다. 

 

※ Stateful : (컴퓨터 보안 장치가) 네트워크 연결 상태를 추적할 수 있다. ( TCP 연결 등) 

※ Switchover : 장치가 동작 불능 상태로 된 경우에 자동으로 혹은 수동으로 장치 전환을 행하는 것 , Supervisior 에 의한다. 

 

 

 

 

RPR : RPR mode로 설정이 되어 있다면, Cisco의 IOS는 Standby RP 상에서 Software image를 booting time에 Loading 하게 되며 자신을 Stanedby Mode 상태로 설정합니다. RPR mode에서는 startup-configuration이 양 card 간에 sync가 되지만, 변경사항에 대해서는 sync 되지 않습니다. (여기서, Standby RP/Supervisor는 Cold Standby 상태가 됩니다) 

만약, Active RP상에서 문제가 발생하였을 경우, standby Processor로 system이 Switchover되지만, Standby Processor acive 상태로 재설정(Reinitialize)되기 때문에, 모든 Line card는 rebooting이 되고, system은 restart되는 형태로 HA를 수행하게 됩니다. 

따라서, Linecard가 rebooting된다면, 이 모든 card들이 모두 정상동작을 하기 위해서, 많은 시간들이 필요하게 됩니다.  

 

따라서, RPR mode는 HA 기능을 수용하여, Active RP/Supervisor에 대해서 Standby RP/Supervisor가 backup으로 수행하지만, 완벽하게 backup으로 동작하기 위해서는 system이 전체 reboting이 되어야 하고, 많은 시간이 걸리는 단점이 있습니다. 

 

 

RPR+ : RPR mode가 HA로 동작하기 위해서, 많은 시간이 필요하다는 단점을 Cover하기 위해서, RPR+ mode에서는 StandbyRP/Supervisor가 미리 initialization되어 있습니다. 즉, 쉽게 말하면, RPR mode와 RPR+ mode가 서로 100m 달리기를 하는데, 출발하는 지점은 RPR+ mode가 이미 50m 앞에서 출발하는 것이라고 생각하면 이해가 빠르다. 

 

RPR+ mode 상에서는 Startup configuration 및 running configuration에 대한 변경 사항들이 standby RP/Supervisor로 항상 동적으로 sync를 하게 되어 있습니다. (RPR과 달리 RPR+에서는 Standby 상태가 Warm Standby 상태가 됩니다) 이 말뜻은 standby RP/ Supervisor가 active role을 넘겨 받기 위해서 굳이 reload를 하거나 re-initialization을 할 필요가 없다는 뜻입니다. 따라서, 동작은 RPR mode보다 훨씬 빠르게 동작을 하게 됩니다. RPR과 비교 시, RPR+가 동작하기 위해서는 Software Version이 두 RP/Supervisor card에서 동일해야 합니다. 

 

 

SSO : RPR+ Mode 이후에 보다 intelligent하게 지원되는 HA mode입니다. RPR+와 달리 IOS software가 Standby RP/Supervisor와 fully하게 initializatiom되고, 부가적으로 SSO는 Line card, protocol 외에 기타 state 정보를 RP/Supervisor간에 sync를 맺게 됩니다. 따라서, Active RP에 문제가 발생하였을 경우, 빠르게 Standby RP로 traffic에 영향을 주지 않는 상태에서 절체가 이루어지게 됩니다. 이런, SSO function을 사용하기 위해서는 반드시 두 RP/Supervisor 상에서 동일한 Software를 사용해야 합니다. 

 

 

 

Technology 

Second RP/Supervisor Status 

Description 

Switchover time 

RPR 

Standby COLD 

  • Startup configuration만 Synchronization 

  • IOS software가 서로 달라도 상관 없음 

90초 이상 

RPR+ 

Standby WARM 

  • Startup configuration과 Running configuration이 두 RP/Supervisor 간에 sync됨 

  • IOS software version이 반드시 동일해야 함 

30초 이상 

SSO 

Standby HOT 

  • 두 개의 supervisor 간에 Event & data structure가 서로 Synchronization 

  • IOS software가 반드시 동일한 version이어야 함 

0~3 초 




◆ cold boot ( = hard boot )  
 파워-다운 상태, 전원이 꺼진 상태에서 컴퓨터를 시작하는 것. 
 

 
◆ warm boot ( = soft boot ) 
 이미 켜진 컴퓨터를 운영체제에 의하여 재 시작하는 것을 말합니다. 
프로그램에 에러가 발생시 복구할 수 없을 때, warm boot가 때때로 필요하게 됩니다. 
PC에서 ctrl + alt + del 키를 동시에 눌러서 실행할 수 있습니다. 
매킨토시 에서는 restart 버튼을 눌러서 실행할 수 있습니다. 


 

◆ hot boot 

리부팅이나 재시동을 말하는 것으로 

컴퓨터 전원을 끄지 않고 시스템상으로 다시 부팅 하는것을 말합니다. 

 



반응형