반응형
장애 발생
- 2008년 8월 26일 화요일 오후, 미연방항공국(the US Federal Aviation Administration: FAA)의 비행계획 시스템(the flight plan system)이 정상 작동하지 않아 여러 공항에서 지연이 발생(특히 북동부 지역이 큰 타격을 받음)
- FAA 대변인은 Hampton, Ga. 시설에서 비행 계획을 처리하는 중앙시스템에 소프트웨어 문제가 생겨 시스템이 다운되었고 다른 시설의 백업시스템이 대신 처리 중이라고 밝힘
- 이 문제는 5p.m. 경부터 진정되기 시작하여 약 9:30p.m. 경에는 대부분의 공항이 정상에 가깝게 돌아옴
- FAA 측은 컴퓨터 장애 동안 레이더 기능이 정상이었고 비행기와 연락이 끊기는 일은 없어서 안전성 이슈는 아님을 강조함
장애 원인
- FAA는 미국 내 상용/일반 항공기가 비행 계획을 제출해야만 이륙을 허락하며, 전국의 비행 계획 정보를 수집, 처리, 배포 하는데 두 개의 메인 컴퓨터 시설에 의존함. 애틀랜타 남쪽의 Hampton, Ga., 시설은 동해안 상공 항공기들의 비행 계획을 처리하고, 유타의 Salt Lake City 시설은 서부 지역을 담당함
- 8월 26일 화요일 약 1p.m. EDT에 Hampton, Ga. 시설의 비행 계획 시스템이 다운됨. 데이터베이스 불일치로 인해 실패한 IPX9000 패킷 스위치가 서버 다운의 원인. 누군가 잘못된 구성 데이터(wrong configuration data)로 스위치를 로드시킨 휴먼 에러라고 함
- 이후 Salt Lake City에 있는 시스템이 대신 작업을 떠맡지만 인계(handover) 과정에서 백로그(backlog)가 생겨 비행 지연을 초래함. 문제 발생 당시 시스템에 약 5,000건의 비행 계획이 있었지만 이들 항공기 대부분이 공중에 떠 있던 상태라 영향을 받지 않았고, 이미 게이트를 출발하여 이륙을 기다리던 항공기들이 백로그를 생성
- 비행 지연의 또 다른 원인은 Salt Lake City의 백업 시스템 과부하에 있음. Hampton, Ga. 시설의 오퍼레이션까지 떠맡아 전국의 비행 계획을 처리하게 된 Salt Lake City 시설이 부하를 견디지 못하고 버벅거림. 특히, 비행 계획을 입력하던 항공사들이 첫 번째 시스템이 보낸 에러 메시지를 받자 반복해서 ‘재입력’ 버튼을 누르면서 상황이 악화되자 FAA는 항공사들에 전화를 해서 시스템의 메모리가 부족하니 re-enter 치는 것을 멈추라고 요청해야만 했음
- 화요일 6p.m. EST 경에는 Salt Lake City 시설의 시스템이 정상 속도에 가깝게 리퀘스트를 처리하기 시작함. Hampton, Ga.의 컴퓨터 시스템은 수요일 1:30a.m. EST가 되어서야 정상 복구됨
같은 문제의 반복
- 위 컴퓨터 장애와 매우 흡사한 일이 이미 1년 전에 발생 했었음. 2007년 6월 8일 금요일 아침 일찍 애틀랜타 시설의 비행 계획 처리 시스템이 실패하였고, FAA는 시스템의 기능을 Salt Lake City에 있는 다른 컴퓨터로 돌렸지만 증가된 데이터 볼륨으로 과부하가 되면서 문제가 더 확대됨
- 이 컴퓨터 문제가 금요일 11a.m. 경에 수정되었지만 그 영향이 오후 늦게까지 이어지면서 미국 동부의 여러 공항에서 비행이 지연되거나 취소됨
[2008년 8월 27일자 AssociatedPress 뉴스]
반응형
'실결함사례 > 우주항공' 카테고리의 다른 글
2013년 12월 영국 항공교통관제소의 음성통신시스템 고장 (0) | 2019.02.15 |
---|---|
2009년 11월 미연방항공청(FAA)의 비행계획 파일링 시스템 장애 (0) | 2019.02.07 |
2005년 보잉 777의 소프트웨어 결함 (0) | 2019.01.14 |
2004년 9월 미국 LA 지역 항공 교통 통제 시스템 고장 (0) | 2019.01.09 |
1999년 12월 NASA의 화성 극지방 착륙선 실종 (0) | 2019.01.02 |