328
클라우드 네이티브를 위한 데이터 센터 네트워크 구축
12.2.2
단순한 장애와 복잡한 장애
단순한 박스는 단순한 장애를 경험하는 경향이 있다. 고정 폼 팩터 스위치는 단일 스위칭 칩과
단일
CPU
등을 사용한다. 하드웨어 장애가 발생하면 상당히 빠르게 그 장애를 격리할 수 있다
는 의미다. 액세스
-
애그 시대의 거대한 애그리게이션 박스는 다중 스위칭 칩, 다중
CPU
, 중앙
제어 카드와 라인카드를 연결하는 이중 백플레인 등과 같은 많은 구동부가 존재해서 그 장애의
양상이 복잡하다.
액세스
-
애그 시대에서 하드웨어 일부에 장애가 발생하면 재고 관리와 박스 비용 때문에 네트워
크 운영자는 박스가 계속 네트워크에서 동작하도록 하면서 문제를 해결하도록 종용받는다. 이
러한 방식은 네트워크 운영자에게 아주 큰 부담으로 작용하는데 문제를 파악하기 위해 서두르는
동안에도 네트워크 다운타임이 늘어나기 때문이다. 예를 들어 장애를 해결한다는 것은 라인카드
가 단지 제대로 연결되지 않았다는 것을 확인하거나 일부 특정 슬롯이 제대로 동작하지 않다는
것을 확인하는 것이다. 만약 라인카드 전체가 장애라고 해도 운영자는 그 문제가 해당 카드에 국
한된 것임을 확인해야 한다. 그런 경우가 아니라 제어 프로세서나 백플레인에 문제가 발생하면
곧 다른 라인카드도 영향을 받게 될 것이다.
단순하고 표준화된 그리고 저렴한 박스를 사용하면 같은 유형의 박스로 쉽게 교체하기만 하면
된다. 문제 있는 박스는 네트워크에서 제거되고 대체된 박스가 네트워크를 정상 상태로 가동하 ...