예제 코드 다운 로드
https://github.com/PacktPublishing/Machine-Learning-for-Developers
사용할 도구
Anaconda3 - jupyter notebook , Mac OS X
사용 언어
Python3
라이브러리
pandas (데이터처리 ) , NumPy(행렬과 같은 데이터), matplotlib (플로팅 라이브러리, 그래프)
기본적인 수학개념
기술통계학 : 주요 연산 ( 샘플코드는 넘어감 )
- 평균 : 모든 원소의 합을 그 원소의 개수로 나눈 값
- 분산 : 평균으로 부터 모든 원소간 거리를 평균 한 값
- 표준 편차 : √분산
확률 및 확률 변수 ( 샘플코드는 넘어감 )
확률에 대해 더 상세한 설명은 확률의 이해
- 사건(event) : 한 실험에서 나타날 수 있는 모든 결과의 일부 세트
- 확률 : 사건의 발생 가능성, 0 ~ 1 사이의 실수
- 베르누이 분포 : 발생할 수가 0 과 1로 이루어 지는 단일 사건일때 사용
- 균일 분포(Uniform Distribution) : 확률변수가 구간 [a,b] 내의 모든 영역에서 일정한 확률을 가질때 사용
- 정규 분포 : 가우스 함수라고 불리며 연속적인 랜덤 함수
- 로지스틱 분포 : 정규 분포와 비슷하지만 정규 분포 보다 더 긴 꼬리를 가지고있음, 누적 분포함수(CDF)가 중요, CDF를 계산하면 시그모이드 곡선을 볼수있음.
확률 함수에 대한 통계적 측정 기준
- 비대칭도(Skewness)
- 첨도(Kurtosis)
이외 필요한 수학적 지식
- 미분
- 적분
- 연쇄 법칙
- 편미분
댓글
댓글 쓰기