기본 콘텐츠로 건너뛰기

데이터 처리 기술 이해 개요 (ADP)

데이터 처리 기술 이해

1. 데이터 처리 프로세스

(1) 데이터 추출·변환·전송 (ETL : Extraction, Transformation and Load)

  1. 추출 (Extraction)
  2. 변환 (Transformation)
  3. 전송 (Load)

(2) 운영 데이터 저장소 (ODS : Operational Data Store)

    (3) 메타 데이터 (Meta Data)

    (4) 변경 데이터 이력관리 (CDC : Change Data Capture)

    1. Time Stamp on Rows
    2. Version Numbers on Rows
    3. Use in Optimistic Locking
    4. Status indicators on rows
    5. Time/Version/Status on rows
    6. Triggers on tables
    7. Event Programming
    8. Log scanners on Databases

    (5) 기업 애플리케이션 통합 (EAI : Enterprise Application Integration)

    1. EAI 기본요소
    2. EAI 기능
    3. EAI 구현 (Herb & Spoke 형 데이터 연대)
    4. EAI 기대효과

    (6) 데이터 연게 및 통합기법

    (7) 데이터 분류

    1. 수집 데이터의 형태에 따른 분류
    2. 수집 데이터의 위치에 따른 분류

    2. 데이터 처리 기술

    (1) 분산 데이터 저장 기술

    1. 분산 파일 시스템
    2. 구글 파일 시스템 (GFS : Google File System)
    3. 하둡 분산 파일 시스템

    (2) 데이터베이스 클러스터

    1. 분산 데이터베이스
    2. NoSQL

    (3) 분산 컴퓨팅 기술

    1. 하둡(Hadoop)의 탄생
    2. 맵리듀스(MapReduce)
    3. 하둡 에코시스템

    (4) 클라우드 컴퓨팅 기술

    1. 클라우드 컴퓨팅의 형태
    2. 클라우드 컴퓨팅 주요 기술


    댓글

    이 블로그의 인기 게시물

    Message Queue 란 무엇인가

    Message Queue 란 무엇인가?? 메시지 지향 미들웨어(Meesage Oriented Middleware: MOM)은 비동기 메시지를 사용하는 다른 응용 프로그램 사이에서 데이터 송수신을 의미 MOM을 구현한 시스템을 메시지 큐(MessageQueue: MQ)라 함 Producer(sender) 가 메시지를 큐에 전송하면 Consumer(receiver) 가 처리하는 방식으로, producer 와 consumer 에 message 프로세스가 추가되는 것이 특징 메시지 큐의 장점 비동기(Asynchronous): Queue에 넣기 때문에 나중에 처리할 수 있습니다. 비동조(Decoupling): 애츨리케이션과 분리할 수 있습니다. 탄력성(Resilience): 일부가 실패 시 전체에 영향을 받지 않습니다. 과잉(Redundancy): 실패할 경우 재실행 가능합니다. 보증(Guarantees): 작업이 처리된걸 확인할 수 있습니다. 확장성(Scalable): 다수의 프로세스들이 큐에 메시지를 보낼 수 있습니다. 메시지 큐 종류 Apache ActiveMQ, Apache Kafka, Apache Qpid, Apache RocketMQ, Beanstalkd, Enduro/X, HTTPSQS, JBoss Messaging, JORAM, RabbitMQ, Sun Open Message Queue, and Tarantool 등 Apache ActiveMQ Java Message Service (JMS)를 사용하는 오픈소스 MQ Java, C, C ++, C #, Ruby, Perl, Python, PHP 등 다양한 크로스 언어 클라이언트 및 프로토콜 지원 Spring 지원으로 Spring xml config 메커니즘 이용 가능 JDBC 지원으로 DB 높은 퍼포먼스 가능 높은 퍼포먼스를 위해 클러스터링 구성 가능 Restful API 제공 단 모니터링 도구제공하지 않음 ...