반응형

장애 발생

  • 2008 8 26일 화요일 오후, 미연방항공국(the US Federal Aviation Administration: FAA)의 비행계획 시스템(the flight plan system)이 정상 작동하지 않아 여러 공항에서 지연이 발생(특히 북동부 지역이 큰 타격을 받음)
  • FAA 대변인은 Hampton, Ga. 시설에서 비행 계획을 처리하는 중앙시스템에 소프트웨어 문제가 생겨 시스템이 다운되었고 다른 시설의 백업시스템이 대신 처리 중이라고 밝힘
  • 이 문제는 5p.m. 경부터 진정되기 시작하여 약 9:30p.m. 경에는 대부분의 공항이 정상에 가깝게 돌아옴
  • FAA 측은 컴퓨터 장애 동안 레이더 기능이 정상이었고 비행기와 연락이 끊기는 일은 없어서 안전성 이슈는 아님을 강조함


장애 원인

  • FAA는 미국 내 상용/일반 항공기가 비행 계획을 제출해야만 이륙을 허락하며, 전국의 비행 계획 정보를 수집, 처리, 배포 하는데 두 개의 메인 컴퓨터 시설에 의존함. 애틀랜타 남쪽의 Hampton, Ga., 시설은 동해안 상공 항공기들의 비행 계획을 처리하고, 유타의 Salt Lake City 시설은 서부 지역을 담당함
  • 8 26일 화요일 약 1p.m. EDTHampton, Ga. 시설의 비행 계획 시스템이 다운됨. 데이터베이스 불일치로 인해 실패한 IPX9000 패킷 스위치가 서버 다운의 원인. 누군가 잘못된 구성 데이터(wrong configuration data)로 스위치를 로드시킨 휴먼 에러라고 함
  • 이후 Salt Lake City에 있는 시스템이 대신 작업을 떠맡지만 인계(handover) 과정에서 백로그(backlog)가 생겨 비행 지연을 초래함. 문제 발생 당시 시스템에 약 5,000건의 비행 계획이 있었지만 이들 항공기 대부분이 공중에 떠 있던 상태라 영향을 받지 않았고, 이미 게이트를 출발하여 이륙을 기다리던 항공기들이 백로그를 생성
  • 비행 지연의 또 다른 원인은 Salt Lake City의 백업 시스템 과부하에 있음. Hampton, Ga. 시설의 오퍼레이션까지 떠맡아 전국의 비행 계획을 처리하게 된 Salt Lake City 시설이 부하를 견디지 못하고 버벅거림. 특히, 비행 계획을 입력하던 항공사들이 첫 번째 시스템이 보낸 에러 메시지를 받자 반복해서 재입력버튼을 누르면서 상황이 악화되자 FAA는 항공사들에 전화를 해서 시스템의 메모리가 부족하니 re-enter 치는 것을 멈추라고 요청해야만 했음
  • 화요일 6p.m. EST 경에는 Salt Lake City 시설의 시스템이 정상 속도에 가깝게 리퀘스트를 처리하기 시작함. Hampton, Ga.의 컴퓨터 시스템은 수요일 1:30a.m. EST가 되어서야 정상 복구됨


같은 문제의 반복

  • 위 컴퓨터 장애와 매우 흡사한 일이 이미 1년 전에 발생 했었음. 2007 6 8일 금요일 아침 일찍 애틀랜타 시설의 비행 계획 처리 시스템이 실패하였고, FAA는 시스템의 기능을 Salt Lake City에 있는 다른 컴퓨터로 돌렸지만 증가된 데이터 볼륨으로 과부하가 되면서 문제가 더 확대됨
  • 이 컴퓨터 문제가 금요일 11a.m. 경에 수정되었지만 그 영향이 오후 늦게까지 이어지면서 미국 동부의 여러 공항에서 비행이 지연되거나 취소됨


[2008년 8월 27일자 AssociatedPress 뉴스]

반응형

+ Recent posts