Hadoop | The Definitive Guide 09

2장 맵리듀스

Part 9 맵리듀스 기능

카운터, 정렬, 데이터셋 조인 등 맵리듀스의 고급기능을 살펴본다.

9.1 카운터

9.1.1 내장 카운터

태스크 카운터
잡 카운터

9.1.2 사용자 정의 자바 카운터

동적 카운터
카운터 반환

9.1.3 사용자 정의 스트리밍 카운터

9.2 정렬

9.2.1 준비

9.2.2 부분 정렬

9.2.3 전체 정렬

9.2.4 2차 정렬

자바 코드
스트리밍

9.3 조인

9.3.1 맵-사이드 조인

9.3.2 리듀스-사이드 조인

  • 다중 입력
  • 2차 정렬

9.4 사이드 데이터 분배

9.4.1 잡 환경 설정 사용

9.4.2 분산 캐시

사용법
작동 방식
분산 캐시 API

9.5 맵리듀스 라이브러리 클래스