3장 하둡 운영
Part 10 하둡 클러스터 설정
다수의 머신으로 구성된 클러스터 환경에서 하둡을 구동하기 위한 설정 방법 및 구축 방법을 설명한다.
하둡은 데이터 I/O를 위한 프리미티브(Primitive) 내장된 기본 기능을 제공한다. 멀티테라바이트의 데이터셋을 처리할 때는 특정 내장된 기능을 잘 활용할 만한 가치가 있다. ex) 직렬화 프레임워크 디스크 기반 데이터 구조 API
맵과 리듀스 함수의 입력과 출력은 키-값 쌍으로 되어 있다. 특히 단순한 텍스트부터 구조화된 바이너리 객체까지 다양한 포맷의 데이터를 맵리듀스 모델에서 어떻게 처리하는지 살펴보겠다.