데이터사이언스를 위한 통계학입문Ⅰ https://pabi.smartlearn.io/courses/course-v1:POSTECH+DSB111+P2203/about 데이터사이언스를 위한 통계학입문Ⅰ pabi.smartlearn.io IV. 빅데이터 분석에서 확률과 분포 4.1 확률의 기초개념 통계 : 데이터를 수집, 처리, 분석, 활용하는 지식 -> 실제 얻어진 데이터를 바탕으로 정보를 도출 확률 : 어떤 특정한 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 -> 관측하기 전에 있어서 가능성을 논하는 것 통계에서 필요한 확률 - 확률, 사건, 표본공간 확률 : 어떤 특정한 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 사건 : 표본공간에서 관심의 대상인 부분집합 표본공간 : 확률 실험의 ..
데이터사이언스를 위한 통계학입문Ⅰ https://pabi.smartlearn.io/courses/course-v1:POSTECH+DSB111+P2203/about 데이터사이언스를 위한 통계학입문Ⅰ pabi.smartlearn.io III. 데이터 시각화와 통계적 해석 3.1 데이터 시각화 데이터 시각화 : 데이터 분석 결과를 쉽게 이해할 수 있도록 보여주는 것 데이터 분석 단계 수집 (Data Gathering) 정제 (Data Processing) 시각화 (Data Visualization) 예측모형/분석 (Data Analysis) 효과적인 데이터 시각화의 조건 어떤 메세지를 전달할 것인지 결정 (what) 핵심 내용을 제외한 나머지는 생략 최선의 표현 방법을 선택 (How) 단순, 명료하게 디자인 ..
데이터사이언스를 위한 통계학입문Ⅰ https://pabi.smartlearn.io/courses/course-v1:POSTECH+DSB111+P2203/about 데이터사이언스를 위한 통계학입문Ⅰ pabi.smartlearn.io II. 빅데이터 탐색의 첫걸음 2.1 데이터의 평균 (중심위치) 평균 - 데이터를 하나의 값으로 표현한 요약된 정보 (추정치) - 평균 = 데이터 값의 총 합 / 데이터 개수 평균을 다룰 때 주의할 점 - 평균은 혼자 존재하는 개념이 아니다. - 어떻게 표본선정을 하느냐에 때라 평균값에 영향을 미친다. 따라서 조사된 평균값이 모집단을 대표하는 통계치라고 할 수 있는지에 대한 고려가 필요 평균과 표본 산정 1. 편의 (Bias)가 적은가? - 표본을 추출할 때 표본으로부터 얻어지..
https://pabi.smartlearn.io/courses/course-v1:POSTECH+DSB111+P2203/about 데이터사이언스를 위한 통계학입문Ⅰ pabi.smartlearn.io 데이터사이언스를 위한 통계학입문Ⅰ 통계 기초가 부족한 것 같아서 청년 AI·Big Data 아카데미 온라인 기초과정 (MOOC) 에서 제공하는 '데이터사이언스를 위한 통계학입문Ⅰ' 강의를 들으며 통계학에 대한 기초를 다지기로 했다. I. 데이터 과학과 통계 1.1 데이터 과학이란 무엇인가 데이터 분석 (Data analytics) 데이터 분석에는 다음과 같은 것들이 포함되어 있다. 1. 데이터 큐레이션 (data curation) : 데이터 추출, 변환, sql, r python 2. 데이터 시각화 (data ..