데이터 분석
1. 통계 프로그램
(1) 통계 프로그램 개요
- 통계적 방법과 기술 비교
- 학습 용이성 비교
- 지원측면 비교
- 시각화 비교
- 비용측면 비교
(2) SPSS 기초
- SPSS 시작
- SPSS 사용법
(3) R 기초
- R 다운로드와 설치
- R 살펴보기
- R 사용하기
- 계산기로서의 R
- 변수의 사용
- R의 기본 자료형
- 자료형을 위한 R 내장 함수
- 함수 (Function, Method)
- 도움말 관련 함수 help()
- R의 자료구조
- R의 사용 예
2. 통계 분석 기법
(1) 통계학 개요
- 자료의 유형
- 측정(Measurement) 척도 구분
- 측정척도와 통계 분석 방법
(2) 통계 분석 기법 종류
- 교차 분석 (Crosstabs Analysis)
- 빈도 분석 (Frequency Analysis)
- 판별 분석 (Discriminant Analysis)
- 요인 분석 (Factor Analysis)
- 평균비교 (T-Test)
- 군집 분석 (Cluster Analysis)
- 회귀 분석 (Regression Analysis)
- 분산 분석 (Analysis Variance)
- 상관 분석 (Correlation Analysis)
(3) 시계열 분석
- 시계열 분석 기법
- 비산형 시계열 분석 기법
(4) 시뮬레이션 (Simulation)
(5) 최적화 기법(Optimization)
(6) 다차원 척도법 (MDS : Multi-Dimensional Scaling Method)
(7) 주성분 분석 (PCA : Principal Component Analysis)
3. 데이터 마트
(1) 데이터 마트 개요
- 데이터 마트 목적
- 분석 마트 구축 시 유의점
- 데이터 마트 종류
(2) 데이터 변경 및 요약
- reshape 패키지로 데이터마트 개발
- reshape (패키지)
- sqldf 패키지를 이용한 데이터 분석
- plyr 패키지를 이용한 데이터 분석
- 데이터 테이블(data.table) 패키지
(3) 데이터 가공
- 데이터 탐색 및 파악 (Data Exploration)
- 변수 중요도
- 변수의 구간화
(4) 데이터 기초 분석 및 관리
- 데이터 EDA (탐색적 자료분석)
- 데이터 결측값 처리
- 결측값 처리 방법
- R에서 결측값 처리
- 이상값(Outlier) 찾기와 처리
(5) 병렬처리 방안
4. 정형 데이터 마이닝
(1) 데이터 마이닝 개요
- 데이터 선택
- 데이터 정제
- 데이터 변환
- 데이터 마이닝
- 패턴 평가
- 지식 표현
(2) 데이터 마이닝 기법
- 클러스터링(군집) 기법
- 연관 규칙 기법
- 의사결정나무 (Decision Tree)
- 신경망 (Neural network)
- 분류 분석
- 요약 기법
(3) 데이터 마이닝 분석 기술
- 데이터 웨어하우스와 데이터 마이닝
- OLAP와 데이터 마이닝
- 인공지능과 데이터 마이닝
- 통계학적 데이터 마이닝
5. 비정형 데이터 마이닝(ADP)
(1) 텍스트 마이닝 (Text Mining)
- 에피소드와 에피소드 규칙
- 개념 계층
- 자연어 처리시스템
- 연관 규칙과 순차패턴 접근
- 신경망 접근
(2) 소셜 네트워크 분석
- 주요 사용기술
- 소셜 네트워크 분석 활용
- 소셜 네트워크 구조 분석
- 네트워크 진화 분석
- 네트워크 정보 흐름 분석
댓글
댓글 쓰기