반응형

음성 통화 및 SMS 서비스 중단 발생

  • Rogers Communications은 캐나다 최대 무선 통신 업체로 전국에 약 천만 명의 고객을 보유하고 있음(셀 방식의 휴대전화 서비스 제공)
  • 201310 9일 수요일 6:30p.m. 경부터 Rogers의 무선 음성 통화와 문자 메시지 서비스가 캐나다 전역에서 약 5시간 동안 중단됨. 모바일 앱과 웹 브라우징 같은 데이터 서비스는 영향을 받지 않음
  • Rogers는 같은 날 10:30p.m.에 복구를 위한 소프트웨어 픽스(software fix)를 적용하고, 11:45p.m.에 음성 통화 및 SMS 서비스가 완전 복구되었음을 트위터에 알림
  • 이 장애는 Rogers28년 역사상 가장 큰 사고로 다음날인 목요일 CEO가 사과문을 발표하고 모든 가입자에게 1일 서비스 크레딧을 제공하기로 함


소프트웨어 문제가 서비스 중단 원인

  • 대부분의 통신사업자처럼 Rogers도 시그널링 네트워크(signalling network)와 트래픽을 나르는 네트워크(traffic-carrying network)를 나란히 운영하며, 음성 트래픽을 처리하기 위한 세 개의 모바일 스위칭 센터(MSCs)가 벤쿠버, 토론토, 몬트리올에 각각 위치해 있음
  • 장애 원인은 시그널링 트래픽에 전례 없는 폭증(signalling surge)이 발생하여 모바일 스위치에 일시적인 과부하를 주었고, 스위치가 이를 제대로 처리하지 못한 채 셧다운하고 재시작하는 일이 반복됨. , 순환적 재시작(cyclical restarts)이 일어남
  • 세 개 MSC 중 한 곳에서 먼저 문제가 생겨서 이 MSC의 트래픽이 다른 2개의 MSCs로 보내졌지만, 다른 2개의 MSC도 갑작스런 시그널링 서지(스파이크)를 제대로 다루지 못함
  • Rogers는 네트워크 파트너인 Ericsson에게 소프트웨어 픽스를 개발하도록 함. 이 소프트웨어 픽스는 스위치가 시그널링 서지를 관리하는 방식을 변경하여 순환적 재시작에 빠지지 않도록 함


[2013년 10월 10일자 CBC 뉴스 영상]

반응형

+ Recent posts