기본 콘텐츠로 건너뛰기

머신러닝 소개 및 통계 과학 with [개발자를 위한 머신러닝]

예제 코드 다운 로드 

https://github.com/PacktPublishing/Machine-Learning-for-Developers

사용할 도구

Anaconda3 - jupyter notebook , Mac OS X

사용 언어

Python3

라이브러리

pandas (데이터처리 ) , NumPy(행렬과 같은 데이터), matplotlib (플로팅 라이브러리, 그래프)

기본적인 수학개념

기술통계학 : 주요 연산 ( 샘플코드는 넘어감 )

  1. 평균 : 모든 원소의 합을 그 원소의 개수로 나눈 값
  2. 분산 : 평균으로 부터 모든 원소간 거리를 평균 한 값
  3. 표준 편차 : √분산

확률 및 확률 변수 ( 샘플코드는 넘어감 )

확률에 대해 더 상세한 설명은 확률의 이해
  1. 사건(event) : 한 실험에서 나타날 수 있는 모든 결과의 일부 세트
  2. 확률 : 사건의 발생 가능성, 0 ~ 1 사이의 실수
  3. 베르누이 분포 : 발생할 수가 0 과 1로 이루어 지는 단일 사건일때 사용
  4. 균일 분포(Uniform Distribution) : 확률변수가 구간 [a,b] 내의 모든 영역에서 일정한 확률을 가질때 사용
  5. 정규 분포 : 가우스 함수라고 불리며 연속적인 랜덤 함수
  6. 로지스틱 분포 : 정규 분포와 비슷하지만 정규 분포 보다 더 긴 꼬리를 가지고있음, 누적 분포함수(CDF)가 중요, CDF를 계산하면 시그모이드 곡선을 볼수있음.

확률 함수에 대한 통계적 측정 기준

  1. 비대칭도(Skewness)
  2. 첨도(Kurtosis)

이외 필요한 수학적 지식

  1. 미분
  2. 적분
  3. 연쇄 법칙
  4. 편미분

참고











댓글

이 블로그의 인기 게시물

블록체인 거래소 모니터링시스템 구축이야기(2/?) - 서버 아키텍처

  코인 거래소 모니터링시스템 구축이야기(2/?) 코인 거래소 모니터링 시스템 구축 (가칭 : 김프멈춰) 서버 구성 사용자가 확인할 서비스 페이지, 데이터 저장소에 대한 서버는 NAS 서버로 운영 일일 Data 크롤링 서버는 Cloud 서버 이용하여 운영 - 서비스페이지 및 데이터 저장소 (Nas 서버) : Docker container ubuntu 20.04 - 일일 크롤링 서버 (Cloud at Cost Cloud 서버) : CentOS 7 서버 아키텍처 서버 아키텍처 레퍼런스 빗썸 : https://apidocs.bithumb.com/ 업비트 : https://docs.upbit.com/ 홍콩 Bitfinex : https://docs.bitfinex.com/docs 몽고 DB 설치 : https://coterie.tistory.com/20 1. 개요 :  https://limdh3325.blogspot.com/2021/04/1.html 2. 서버 아키텍처 :  https://limdh3325.blogspot.com/2021/04/2.html 3. MongoDB 설치 :  https://limdh3325.blogspot.com/2021/04/3.html 4. 데이터 모델링 :  https://limdh3325.blogspot.com/2021/05/4.html 5. MongoDB 저장 :  https://limdh3325.blogspot.com/2021/06/5.html