기본 콘텐츠로 건너뛰기

데이터 분석 개요 (ADsP)

데이터 분석

1. 통계 프로그램

(1) 통계 프로그램 개요

  1. 통계적 방법과 기술 비교
  2. 학습 용이성 비교
  3. 지원측면 비교
  4. 시각화 비교
  5. 비용측면 비교

(2) SPSS 기초

  1. SPSS 시작
  2. SPSS 사용법

(3) R 기초

  1. R 다운로드와 설치
  2. R 살펴보기
  3. R 사용하기
  4. 계산기로서의 R
  5. 변수의 사용
  6. R의 기본 자료형
  7. 자료형을 위한 R 내장 함수
  8. 함수 (Function, Method)
  9. 도움말 관련 함수 help()
  10. R의 자료구조
  11. R의 사용 예

2. 통계 분석 기법

(1) 통계학 개요

  1. 자료의 유형
  2. 측정(Measurement) 척도 구분
  3. 측정척도와 통계 분석 방법

(2) 통계 분석 기법 종류

  1. 교차 분석 (Crosstabs Analysis)
  2. 빈도 분석 (Frequency Analysis)
  3. 판별 분석 (Discriminant Analysis)
  4. 요인 분석 (Factor Analysis)
  5. 평균비교 (T-Test)
  6. 군집 분석 (Cluster Analysis)
  7. 회귀 분석 (Regression Analysis)
  8. 분산 분석 (Analysis Variance)
  9. 상관 분석 (Correlation Analysis)

(3) 시계열 분석

  1. 시계열 분석 기법
  2. 비산형 시계열 분석 기법

(4) 시뮬레이션 (Simulation)

(5) 최적화 기법(Optimization)

(6) 다차원 척도법 (MDS : Multi-Dimensional Scaling Method)

(7) 주성분 분석 (PCA : Principal Component Analysis)


3. 데이터 마트

(1) 데이터 마트 개요

  1. 데이터 마트 목적
  2. 분석 마트 구축 시 유의점
  3. 데이터 마트 종류

(2) 데이터 변경 및 요약

  1. reshape 패키지로 데이터마트 개발
  2. reshape (패키지)
  3. sqldf 패키지를 이용한 데이터 분석
  4. plyr 패키지를 이용한 데이터 분석
  5. 데이터 테이블(data.table) 패키지

(3) 데이터 가공

  1. 데이터 탐색 및 파악 (Data Exploration)
  2. 변수 중요도
  3. 변수의 구간화

(4) 데이터 기초 분석 및 관리

  1. 데이터 EDA (탐색적 자료분석)
  2. 데이터 결측값 처리
  3. 결측값 처리 방법
  4. R에서 결측값 처리
  5. 이상값(Outlier) 찾기와 처리

(5) 병렬처리 방안


4. 정형 데이터 마이닝

(1) 데이터 마이닝 개요

  1. 데이터 선택
  2. 데이터 정제
  3. 데이터 변환
  4. 데이터 마이닝
  5. 패턴 평가
  6. 지식 표현

(2) 데이터 마이닝 기법

  1. 클러스터링(군집) 기법
  2. 연관 규칙 기법
  3. 의사결정나무 (Decision Tree)
  4. 신경망 (Neural network)
  5. 분류 분석
  6. 요약 기법

(3) 데이터 마이닝 분석 기술

  1. 데이터 웨어하우스와 데이터 마이닝
  2. OLAP와 데이터 마이닝
  3. 인공지능과 데이터 마이닝
  4. 통계학적 데이터 마이닝

5. 비정형 데이터 마이닝(ADP)

(1) 텍스트 마이닝 (Text Mining)

  1. 에피소드와 에피소드 규칙
  2. 개념 계층
  3. 자연어 처리시스템
  4. 연관 규칙과 순차패턴 접근
  5. 신경망 접근

(2) 소셜 네트워크 분석

  1. 주요 사용기술
  2. 소셜 네트워크 분석 활용
  3. 소셜 네트워크 구조 분석
  4. 네트워크 진화 분석
  5. 네트워크 정보 흐름 분석

댓글

이 블로그의 인기 게시물

Message Queue 란 무엇인가

Message Queue 란 무엇인가?? 메시지 지향 미들웨어(Meesage Oriented Middleware: MOM)은 비동기 메시지를 사용하는 다른 응용 프로그램 사이에서 데이터 송수신을 의미 MOM을 구현한 시스템을 메시지 큐(MessageQueue: MQ)라 함 Producer(sender) 가 메시지를 큐에 전송하면 Consumer(receiver) 가 처리하는 방식으로, producer 와 consumer 에 message 프로세스가 추가되는 것이 특징 메시지 큐의 장점 비동기(Asynchronous): Queue에 넣기 때문에 나중에 처리할 수 있습니다. 비동조(Decoupling): 애츨리케이션과 분리할 수 있습니다. 탄력성(Resilience): 일부가 실패 시 전체에 영향을 받지 않습니다. 과잉(Redundancy): 실패할 경우 재실행 가능합니다. 보증(Guarantees): 작업이 처리된걸 확인할 수 있습니다. 확장성(Scalable): 다수의 프로세스들이 큐에 메시지를 보낼 수 있습니다. 메시지 큐 종류 Apache ActiveMQ, Apache Kafka, Apache Qpid, Apache RocketMQ, Beanstalkd, Enduro/X, HTTPSQS, JBoss Messaging, JORAM, RabbitMQ, Sun Open Message Queue, and Tarantool 등 Apache ActiveMQ Java Message Service (JMS)를 사용하는 오픈소스 MQ Java, C, C ++, C #, Ruby, Perl, Python, PHP 등 다양한 크로스 언어 클라이언트 및 프로토콜 지원 Spring 지원으로 Spring xml config 메커니즘 이용 가능 JDBC 지원으로 DB 높은 퍼포먼스 가능 높은 퍼포먼스를 위해 클러스터링 구성 가능 Restful API 제공 단 모니터링 도구제공하지 않음 ...