반응형

제목: 데이터 웨어하우스 테스팅(Data Warehouse Testing)

저자: M. Mathen, Infosys

문서유형: 화이트 페이퍼( 8페이지), 2010년 



데이터 웨어하우스란

  • 조직의 전체 데이터를 캡쳐하는 공동의 종합적인 데이터 모델
  • 다수의 이질적 소스로부터 데이터를 모아 하나의 목적지로 보낸다. , Staging Area에서 데이터가 추출(Extracted), 변환(Transformed), 로드(Loaded) 되는 프로세스를 거쳐 데이터 웨어하우스로 보내진다.
  • 대개 읽기 전용(read-only)이거나 기본적인 쿼리 및 분석 목적만을 가지므로 데이터가 정규화될 필요는 없다.
  • 데이터 웨어하우스는 기본적으로 OLAP 시스템이며 OLTP 데이터를 처리하지는 않는다.
  • 데이터 웨어하우싱(data warehousing)은 데이터마트(datamarts)와 다운스트림 클라이언트 애플리케이션을 포함한 데이터 웨어하우스를 구축하고 유지보수 하는 프로세스를 의미한다.

[데이터 웨어하우스 전체 그림]


데이터 웨어하우스 테스팅

구현 단계가 마무리될 무렵에야 테스트 실행이 시작되는 전통적인 테스팅과 달리 DW 테스팅에서는 테스트 실행 자체가 여러 단계를 거쳐 DW 구현 주기 전반에 거쳐 일어난다. 아래 그림은 DW 구현 생명 주기 동안 발생하는 데이터 웨어하우스 테스팅의 주요 단계들과 각 단계에서 요구되는 테스팅 타입들을 나타내고 있다.


  • ETL 단계: 데이터 품질 테스팅(data quality testing)이 가장 중요(여기서 발견되지 않은 결함은 차후에 수정하는데 많은 비용이 소요됨)하며, 변환 로직(transformation logic)을 검증하기 위한 기능 테스팅(functional testing)도 필요하다.
  • 데이터 로드 단계: 데이터 로드 기능의 셋업 동안 로드 모듈에 대한 테스팅이 수행된다(데이터 로드의 패러미터와 세팅을 테스트).
  • 초기 데이터 로드 단계: 이 단계는 기초 데이터베이스(the underlying database)가 처음으로 로드된 시점이며 성능 테스팅이 중요하다. 또한 ETL 단계에서 테스트되고 완료되었던 데이터 품질이 여기서 재테스트 된다.
  • 엔드 투 엔드 비즈니스 테스팅 단계: 일단 기초 데이터 로드가 완료되면 데이터 웨어하우스는 엔드 투 엔드 기능 검증을 할 수 있는 상태가 된다. 이 단계에서는 UI 테스팅과 인터페이스 테스팅이 수행된다.
  • 유지보수/데이터 피드 단계: 운영 데이터베이스의 데이터는 DW의 주기적인 입력 데이터가 된다. 이런 주기적 업데이트 동안에 회귀 테스팅을 실행하여 새로운 데이터 업데이트가 기존 기능을 해치지 않음을 확인한다.


데이터베이스 테스팅과 데이터 웨어하우스 테스팅의 차이점

데이터베이스 테스팅(Database testing)

데이터 웨어하우스 테스팅(Data Warehouse testing)

Ÿ  규모 면에서 작음

Ÿ  대개 소스에서 데이터를 테스트

Ÿ  대개 동질 데이터(homogeneous data)

Ÿ  정규화된 데이터(normalized data)

Ÿ  CRUD(생성/읽기/업데이트/삭제) 오퍼레이션

Ÿ  일관성 있는 데이터

Ÿ  대규모 대량 데이터

Ÿ  ETL 메커니즘을 주축으로 여러 측면 포함

Ÿ  이질 데이터(heterogeneous data) 포함

Ÿ  비정규화 데이터(De normalized data)

Ÿ  읽기 전용 오퍼레이션(read-only operations)

Ÿ  시간적인 데이터 비일관성 존재


반응형

+ Recent posts