반응형

FAA 항공 교통 관제 시스템 장애

  • 미연방항공국(the Federal Aviation Administration’s FAA) 24개 항공 관제 센터 중 버지니아주 Leesburg에 있는 워싱턴 항공 교통 관제 센터는 워싱턴 근처 160,000 평방 마일 영공의 고고도(20,000 피트 이상) 항공 교통 관제를 담당
  • 2015 8 15일 토요일, 이 관제 센터의 컴퓨터 시스템이 오전부터 장애를 겪으면서 미국 동해안을 따라 여러 공항에서 400대 이상의 비행이 취소되고 다른 수백 대가 지연되는 결과를 낳음
  • 같은 날 오후 4시 경 서비스가 복구되었지만 비행 스케쥴 지연의 영향이 주말까지 이어지며 여행객들의 불편을 초래함


장애 원인: 소프트웨어 업그레이드

  • FAA가 전국의 항공 교통 관제 센터에서 기존에 사용하던 40년 된 En Route Host 컴퓨터 시스템을 현대화된 위성 기반 시스템으로 전환하는 NextGen 프로젝트를 진행해 왔으며, 이 프로젝트의 핵심이 Lockheed Martin에 의해 개발된 ERAM(En Route Automation Modernization)이라 불리는 시스템
  • ERAM20개의 FAA 고고도 항공 교통 관제 센터에서 1년 정도 사용되어 옴(2015 4월 마지막 관제 센터에까지 설치를 마치고 신규 ERAM 시스템으로 전환이 완료됨)
  • FAA에 따르면 버지니아 Leesburg 센터의 ERAM에 최근 소프트웨어 업그레이드가 이루어 졌는데 이것이 ERAM 시스템을 셧다운하게 만드는 메모리 과부하를 야기했다고 함
    - ERAM 소프트웨어 최신 업그레이드가 개별 관제사가 자신이 자주 참조하는 데이터의 커스토마이징된 윈도우를 셋업할 수 있도록 하는 신규 기능을 제공하도록 되어 있었음
    - 이 정보는 관제사가 그걸 삭제하는 경우 시스템으로부터 완전히 제거되어야 함. 하지만 관제사들이 나름의 고유한 세팅을 조정함에 따라 이 변경 정보들이 저장장치 한계가 다 찰 때 까지 메모리에 남아 있었고, 이게 전체 시스템의 성공적인 오퍼레이션을 하는데 필요한 프로세싱 파워를 소비해 버림
    - FAA는 해당 기능 사용을 일시적으로 중단함으로써 이 이슈가 다시 발생할 가능성을 제거하였고, 주사업자인 Lockheed Martin과 함께 영구 솔루션을 찾는 중이며 또한 왜 해당 이슈가 테스팅 동안 식별되지 않았는지 정밀 조사 중이라고 성명을 발표함


[2015년 8월 17일자 CBS This Morning 뉴스 보도]


반응형

+ Recent posts