페일오버(Failover)란 무엇인가
페일오버는 장애 대비 기능을 말합니다. 실패(fail)를 끝내는(over)거죠. 시스템에 장애가 오면 미리 준비했던 다른 시스템으로 대체해서 운영하는 것입니다. 현실에서 부르는 이름은 시스템 대체 작동, 장애 조치 등 다양합니다. 이번엔 현실에서 서비스를 운영하면 반드시 필요한 Failover를 알아보겠습니다.
Failover 정의
장애 극복 기능(failover, 페일오버)은 컴퓨터 서버, 시스템, 네트워크 등에서 이상이 생겼을 때 예비 시스템으로 자동 전환되는 기능을 의미합니다.
Failover 활용
평상시에는 A 장비를 사용하다가, A 장비에 장애가 발생하면 준비했던 B 장비를 사용합니다. 운영되고 있는 시스템은 액티브(Active), 같은 세팅으로 구성된 대기하는 시스템은 패시브(Passive)라고 하는데요. 운영 중에 액티브 시스템이 멈추거나, 장애가 발생하면, 패시브 시스템이 액티브 상태로 변경되면서, 서비스를 이어서 운영하게 됩니다.
높은 가용성을 요구할 때 구성합니다. 가용성이란 서비스를 정상적으로 사용 가능한 정도를 의미하는데요. 당연히 100%라는 시스템은 없기에, 장애가 없을 때 장애를 대비해야 합니다. 서비스가 멈추면 손해가 발생하기 때문에 대부분의 규모 있는 서비스에는 대부분 이러한 페일오버를 준비합니다.
위 기능을 운영하려면 여분의 서버, 네트워크 장비 등의 추가 자원이 필요합니다. 그렇기에 사실 상 모든 시스템을 대비하긴 쉽지 않습니다. 현실에서는 장애 발생 시의 손해와 운영 중인 데이터의 경중을 따져서 중요한 것부터 우선적으로 준비합니다.
웹서버를 포함한, 네트워크 장비, 데이터베이스 등 다양한 영역에 대비합니다. 하드웨어적인 장애 뿐만 아니라, 소프트웨어를 포함한 서비스가 운영되지 않는 모든 장애를 포함합니다. 운영되고 있는 시스템은 액티브(Active), 프라이머리(Primary), 마스터(Master) 등으로 불리고, 대기하고 있는 시스템은 패시브(Passive), 스탠바이(Standby), 세컨더리(Secondary), 슬레이브(Slave), 페일오버(Failover) 등 시스템이나 상황에 따라 다양하게 불립니다. 이런 단어를 들으시면 그냥 '뭔가 여러 개 있는 구조인가 보다.'라고 생각하면 됩니다. 참고로 장비가 여러 대 필요한 개념 대부분은 장애 대비나, 부하를 여러 대로 분산해서 처리하기 위함 정도입니다.
정리
이렇게 같은 시스템을 2개 준비해놓는 걸 이중화라고 부르는데요. 현실에서 모든 시스템을 이중화할 수는 없습니다. 비용이 들기 때문인데요. 서비스에 있어서 중요한 데이터를 가지고 있는 시스템은 이중화에 대해서 알아보시기 바랍니다. 최근 클라우드 서비스는 이런 이중화 구성도 몇 번의 클릭만으로 구성할 수 있도록 지원하는데요. 바로 사용하지 않더라도 한 번씩 둘러보고, 각 서비스에 맞는 페일오버를 준비하시길 추천합니다. 참고로 사람이 임의로 사용 중인 시스템을 대기 중인 시스템으로 변경할 수도 있습니다. 사람이 직접 해주는건 스위치오버라고 부릅니다.
출처: https://oriyong.tistory.com/80
관련 개념 이해
Storage Controller Actions
Takeover | The controller takes over all services while the other controller transitions into standby mode. HA status changes to Takeover. |
Giveback | The controller gives back services to the other inactive controller. HA status changes to Active-Active. |
Force Takeover | A recovered controller is forced to take over if it does not regain control automatically. This button becomes available only if a takeover or giveback attempt is unsuccessful. |
'자료수집' 카테고리의 다른 글
전산_개념_하이퍼바이저(Hypervisor)의 종류 (1) | 2022.09.01 |
---|---|
운영체제_AIX_HACMP 의 기본 개념 소개 (1) | 2022.09.01 |
개발자 역량 측정 메트릭 (0) | 2022.08.22 |
VRRP [ 게이트웨이 이중화 ] (0) | 2022.08.12 |
용어 (0) | 2022.08.10 |