Hadoop | The Definitive Guide 13

4장 관련 프로젝트

Part 13 파케이

아파치 파케이(Apache Parquet)는 중첩된 데이터를 효율적으로 저장할 수 있는 컬럼 기준 저장 포맷으로 파일 크기와 쿼리 성능 측면 모두 효율성이 높은 장점이 있다.

13.1 데이터 모델

13.1.1 중첩 인코딩

13.2 파케이 파일 포맷

13.3 파케이 설정

13.4 파케이 파일 쓰기와 읽기

13.4.1 에이브로, 프로토콜 버퍼, 쓰리프트

프로젝션과 스키마 읽기

13.5 파케이 맵리듀스