Hadoop | The Definitive Guide 23

5장 사례 연구

Part 23 생물학의 데이터 과학: 소프트웨어로 생명 구하기

대규모 생물학 데이터셋을 분석하기 위해 오픈 소스 커뮤니티와 여러 협력사가 함께 개발하여 사용하고 있는 시스템에 초점을 둔다.

23.1 DNA 구조

23.2 유전 암호: DNA 글자의 단백질 전환

23.3 DNA를 소스 코드처럼 생각하기

23.4 인간 게놈 프로젝트와 표준 게놈

23.5 DNA 시퀀싱과 얼라이닝

23.6 대규모 게놈 분석 플랫폼 ADAM

23.6.1 에이브로 인터페이스 정의 언어로 작성한 문학적 프로그래밍

23.6.2 파케이를 이용한 컬럼 기반 접근

23.6.3 예제: 스파크와 ADAM을 이용한 k-mer 빈도 세기

23.7 개인맞춤광고에서 개인맞춤의학까지

23.8 참여하기