데이터 처리 기술 이해
1. 데이터 처리 프로세스
(1) 데이터 추출·변환·전송 (ETL : Extraction, Transformation and Load)
- 추출 (Extraction)
- 변환 (Transformation)
- 전송 (Load)
(2) 운영 데이터 저장소 (ODS : Operational Data Store)
(3) 메타 데이터 (Meta Data)
(4) 변경 데이터 이력관리 (CDC : Change Data Capture)
- Time Stamp on Rows
- Version Numbers on Rows
- Use in Optimistic Locking
- Status indicators on rows
- Time/Version/Status on rows
- Triggers on tables
- Event Programming
- Log scanners on Databases
(5) 기업 애플리케이션 통합 (EAI : Enterprise Application Integration)
- EAI 기본요소
- EAI 기능
- EAI 구현 (Herb & Spoke 형 데이터 연대)
- EAI 기대효과
(6) 데이터 연게 및 통합기법
(7) 데이터 분류
- 수집 데이터의 형태에 따른 분류
- 수집 데이터의 위치에 따른 분류
2. 데이터 처리 기술
(1) 분산 데이터 저장 기술
- 분산 파일 시스템
- 구글 파일 시스템 (GFS : Google File System)
- 하둡 분산 파일 시스템
(3) 분산 컴퓨팅 기술
- 하둡(Hadoop)의 탄생
- 맵리듀스(MapReduce)
- 하둡 에코시스템
(4) 클라우드 컴퓨팅 기술
- 클라우드 컴퓨팅의 형태
- 클라우드 컴퓨팅 주요 기술
댓글
댓글 쓰기