2장 맵리듀스
Part 6 맵리듀스 프로그래밍
맵리듀스 애플리케이션을 개발하는 방법을 살펴본다.
- 단위 테스트를 작성
- 잡을 실행하는 드라이버 프로그램 작성
- 정상 동작 검증을 위해 IDE에서 작은 데이터로 실행
- 실패 시 IDE 디버거를 통해 문제 원인 파악
잘 됐다면
- 위 프로그램이 더 빠르게 수행 되도록 표준검사 실행
- 태스크 프로파일링(성능 분석)을 수행
- 분산 프로그램 프로파일링 지원으로 하둡 훅(hook)을 활용
6.1 환경 설정 API
하둡 컴포넌트는 하둡 자체의 환경 설정 API를 이용해 설정할 수 있다. Configuration은 리소스라 불리는 이름-값 쌍의 단순한 구조로 정의된 XML 파일로부터 속성 정보를 읽는다.
파일 configuration-1.xml
1 |
|
Java 코드
1 |
|