기본 콘텐츠로 건너뛰기

머신러닝 소개 및 통계 과학 with [개발자를 위한 머신러닝]

예제 코드 다운 로드 

https://github.com/PacktPublishing/Machine-Learning-for-Developers

사용할 도구

Anaconda3 - jupyter notebook , Mac OS X

사용 언어

Python3

라이브러리

pandas (데이터처리 ) , NumPy(행렬과 같은 데이터), matplotlib (플로팅 라이브러리, 그래프)

기본적인 수학개념

기술통계학 : 주요 연산 ( 샘플코드는 넘어감 )

  1. 평균 : 모든 원소의 합을 그 원소의 개수로 나눈 값
  2. 분산 : 평균으로 부터 모든 원소간 거리를 평균 한 값
  3. 표준 편차 : √분산

확률 및 확률 변수 ( 샘플코드는 넘어감 )

확률에 대해 더 상세한 설명은 확률의 이해
  1. 사건(event) : 한 실험에서 나타날 수 있는 모든 결과의 일부 세트
  2. 확률 : 사건의 발생 가능성, 0 ~ 1 사이의 실수
  3. 베르누이 분포 : 발생할 수가 0 과 1로 이루어 지는 단일 사건일때 사용
  4. 균일 분포(Uniform Distribution) : 확률변수가 구간 [a,b] 내의 모든 영역에서 일정한 확률을 가질때 사용
  5. 정규 분포 : 가우스 함수라고 불리며 연속적인 랜덤 함수
  6. 로지스틱 분포 : 정규 분포와 비슷하지만 정규 분포 보다 더 긴 꼬리를 가지고있음, 누적 분포함수(CDF)가 중요, CDF를 계산하면 시그모이드 곡선을 볼수있음.

확률 함수에 대한 통계적 측정 기준

  1. 비대칭도(Skewness)
  2. 첨도(Kurtosis)

이외 필요한 수학적 지식

  1. 미분
  2. 적분
  3. 연쇄 법칙
  4. 편미분

참고











댓글

이 블로그의 인기 게시물

Message Queue 란 무엇인가

Message Queue 란 무엇인가?? 메시지 지향 미들웨어(Meesage Oriented Middleware: MOM)은 비동기 메시지를 사용하는 다른 응용 프로그램 사이에서 데이터 송수신을 의미 MOM을 구현한 시스템을 메시지 큐(MessageQueue: MQ)라 함 Producer(sender) 가 메시지를 큐에 전송하면 Consumer(receiver) 가 처리하는 방식으로, producer 와 consumer 에 message 프로세스가 추가되는 것이 특징 메시지 큐의 장점 비동기(Asynchronous): Queue에 넣기 때문에 나중에 처리할 수 있습니다. 비동조(Decoupling): 애츨리케이션과 분리할 수 있습니다. 탄력성(Resilience): 일부가 실패 시 전체에 영향을 받지 않습니다. 과잉(Redundancy): 실패할 경우 재실행 가능합니다. 보증(Guarantees): 작업이 처리된걸 확인할 수 있습니다. 확장성(Scalable): 다수의 프로세스들이 큐에 메시지를 보낼 수 있습니다. 메시지 큐 종류 Apache ActiveMQ, Apache Kafka, Apache Qpid, Apache RocketMQ, Beanstalkd, Enduro/X, HTTPSQS, JBoss Messaging, JORAM, RabbitMQ, Sun Open Message Queue, and Tarantool 등 Apache ActiveMQ Java Message Service (JMS)를 사용하는 오픈소스 MQ Java, C, C ++, C #, Ruby, Perl, Python, PHP 등 다양한 크로스 언어 클라이언트 및 프로토콜 지원 Spring 지원으로 Spring xml config 메커니즘 이용 가능 JDBC 지원으로 DB 높은 퍼포먼스 가능 높은 퍼포먼스를 위해 클러스터링 구성 가능 Restful API 제공 단 모니터링 도구제공하지 않음 ...