Hadoop | The Definitive Guide 13 Posted on 2021-03-30 | In PRODUCT 4장 관련 프로젝트 Part 13 파케이 아파치 파케이(Apache Parquet)는 중첩된 데이터를 효율적으로 저장할 수 있는 컬럼 기준 저장 포맷으로 파일 크기와 쿼리 성능 측면 모두 효율성이 높은 장점이 있다. 13.1 데이터 모델 13.1.1 중첩 인코딩 13.2 파케이 파일 포맷 13.3 파케이 설정 13.4 파케이 파일 쓰기와 읽기 13.4.1 에이브로, 프로토콜 버퍼, 쓰리프트 프로젝션과 스키마 읽기 13.5 파케이 맵리듀스