Hadoop | The Definitive Guide 16

4장 관련 프로젝트

Part 16 피그

다중값이나 중첩된 형태의 데이터 구조를 처리할 수 있고 데이터 변환도 쉽게 할 수 있다.

16.1 피그의 설치 및 실행

16.1.1 실행 유형

로컬 모드
맵리듀스 모드

16.1.2 피그 프로그램 실행

16.1.3 그런트

16.1.4 피그 라틴 편집기

16.2 예제

16.2.1 예제 생성하기

16.3 데이터베이스와 비교

16.4 피그 라틴

16.4.1 구조

16.4.2 문장

16.4.3 표현식

16.4.4 자료형

16.4.5 스키마

HCatalog로 하이브 테이블 사용하기
검증 및 null 값
스키마 병합

16.4.6 함수

  • 평가 함수
  • 필터 함수
  • 로드 함수
  • 저장 함수
기타 라이브러리

16.4.7 매크로

16.5 사용자 정의 함수

16.5.1 필터 UDF

자료형 활용하기

16.5.2 평가 UDF

동적 호출자

16.5.3 로드 UDF

스키마 사용

16.6 데이터 처리 연산자

16.6.1 데이터 로드와 저장

16.6.2 데이터 필터링

FOREACH…GENERATE
STREAM

16.6.3 데이터 그룹과 조인

JOIN
COGROUP
CROSS
GROUP

16.6.4 데이터 정렬

16.6.5 데이터 결합과 분할

16.7 피그 실무

16.7.1 병렬성

16.7.2 익명 관계자

16.7.3 매개변수 대체

동적 매개변수
매개변수 대체 처리

16.8 참고 도서

###