빅데이터분석기사-day3

빅데이터분석기사

분석 흐름알기

  • 빅데이터 정재
  • 빅데이터 탐색하기

개괄 세부

빅데이터 정재

분석용 데이터 세트 정재

  • 데이터 정제 절차
  • 데이터 정제 기술
  • 데이터 세분화

데이터 오류 파악 및 수정

  • 데이터 결측값 처리
  • 데이터 이상값 처리
빅데이터 탐색하기

데이터에 내재된 변수의 이해와 정의

  • 통계학의 분류
  • 자료의 분류
  • 데이터 확인
  • 이상치 판정기법

변수별 기초통계량 분석 절차 수립

  • 대푯값
  • 신뢰구간추정
  • 모평균에 대한 추론에서 점추정에 대한 검정

탐색적 데이터 분석기법 사용절차 수립

  • 데이터 탐색
  • 데이터 분석기법 정하기

표본 추출기법 수립

  • 표본조사설계
  • 확률표본 추출
  • 비확률표본 추출

데이터 이력 검토 및 분석 적합성 파악

  • 이력데이터
  • 데이터 처리 프로세스

변수간의 상관성 분석

  • 상관분석
  • 상관분석을 위한 준비
  • 피어슨 상관계수
  • 상관계수 공식
  • 상관계수의 성질
  • 상관계수의 유의성 검정절차

변수간의 차이 분석 방법

  • 모평균 차이 검정
  • 모비율 차이 검정
  • 거리 개념의 차이 분석

중심위치의 척도

  • 중심위치척도
  • 산술평균
  • 기하평균
  • 조화평균
  • 산술평균,기하평균,조화평균의 대소관계
  • 중위수
  • 최빈값
  • 평균, 중앙값, 최빈값의 대소 비교

퍼진 정도의 척도

  • 퍼진 정도 척도
  • 범위
  • 분산
  • 표준편차
  • 변동계수
  • 사분위범위

분포의 모양을 나타내는 척도

  • 왜도
  • 첨도

시각 데이터를 통한 탐색적 자료 분석

  • 인사이트
  • 시각화

데이터 탐색

  • 사용가능한 데이터 추출
  • 연결고리 확인
  • 데이터 관계 확인

다중공선성 문제 해결 절차 수립

  • 회귀분석의 개념
  • 다중공선성의 정의
  • 다중공선성 문제 해결 절차