반응형
음성 통화 및 SMS 서비스 중단 발생
- Rogers Communications은 캐나다 최대 무선 통신 업체로 전국에 약 천만 명의 고객을 보유하고 있음(셀 방식의 휴대전화 서비스 제공)
- 2013년 10월 9일 수요일 6:30p.m. 경부터 Rogers의 무선 음성 통화와 문자 메시지 서비스가 캐나다 전역에서 약 5시간 동안 중단됨. 모바일 앱과 웹 브라우징 같은 데이터 서비스는 영향을 받지 않음
- Rogers는 같은 날 10:30p.m.에 복구를 위한 소프트웨어 픽스(software fix)를 적용하고, 11:45p.m.에 음성 통화 및 SMS 서비스가 완전 복구되었음을 트위터에 알림
- 이 장애는 Rogers의 28년 역사상 가장 큰 사고로 다음날인 목요일 CEO가 사과문을 발표하고 모든 가입자에게 1일 서비스 크레딧을 제공하기로 함
소프트웨어 문제가 서비스 중단 원인
- 대부분의 통신사업자처럼 Rogers도 시그널링 네트워크(signalling network)와 트래픽을 나르는 네트워크(traffic-carrying network)를 나란히 운영하며, 음성 트래픽을 처리하기 위한 세 개의 모바일 스위칭 센터(MSCs)가 벤쿠버, 토론토, 몬트리올에 각각 위치해 있음
- 장애 원인은 시그널링 트래픽에 전례 없는 폭증(signalling surge)이 발생하여 모바일 스위치에 일시적인 과부하를 주었고, 스위치가 이를 제대로 처리하지 못한 채 셧다운하고 재시작하는 일이 반복됨. 즉, 순환적 재시작(cyclical restarts)이 일어남
- 세 개 MSC 중 한 곳에서 먼저 문제가 생겨서 이 MSC의 트래픽이 다른 2개의 MSCs로 보내졌지만, 다른 2개의 MSC도 갑작스런 시그널링 서지(스파이크)를 제대로 다루지 못함
- Rogers는 네트워크 파트너인 Ericsson에게 소프트웨어 픽스를 개발하도록 함. 이 소프트웨어 픽스는 스위치가 시그널링 서지를 관리하는 방식을 변경하여 순환적 재시작에 빠지지 않도록 함
[2013년 10월 10일자 CBC 뉴스 영상]
반응형
'실결함사례 > 유무선통신' 카테고리의 다른 글
2015년 8월 미국 AT&T 유무선 통신 서비스 장애 (0) | 2019.06.20 |
---|---|
2014년 4월 미국 911 콜 시스템 장애 (0) | 2019.06.13 |
2012년 7월 6일 프랑스 오렌지 휴대폰 망장애 (0) | 2019.05.29 |
2011년 미국 Verizon Wireless의 4G LTE 데이터 서비스 중단 사고 (0) | 2019.05.09 |
2011년 10월 블랙베리 스마트폰 서비스 중단 사고 (0) | 2019.05.02 |