Hadoop | The Definitive Guide 10

Posted on 2021-03-26 | In PRODUCT

3장 하둡 운영

다수의 머신으로 구성된 클러스터 환경에서 하둡을 구동하기 위한 설정 방법 및 구축 방법을 설명한다.

Posted on 2021-03-26 | In PRODUCT

카운터, 정렬, 데이터셋 조인 등 맵리듀스의 고급기능을 살펴본다.

Posted on 2021-03-25 | In PRODUCT

하둡은 데이터 I/O를 위한 프리미티브(Primitive) 내장된 기본 기능을 제공한다. 멀티테라바이트의 데이터셋을 처리할 때는 특정 내장된 기능을 잘 활용할 만한 가치가 있다. ex) 직렬화 프레임워크 디스크 기반 데이터 구조 API

Posted on 2021-03-25 | In PRODUCT

맵과 리듀스 함수의 입력과 출력은 키-값 쌍으로 되어 있다. 특히 단순한 텍스트부터 구조화된 바이너리 객체까지 다양한 포맷의 데이터를 맵리듀스 모델에서 어떻게 처리하는지 살펴보겠다.

Posted on 2021-03-25 | In PRODUCT

맵리듀스의 작동 방법을 자세히 살펴본다.