못정함

[BDA x 영진닷컴] ADsP 스터디: 1주차 본문

ADsP 데이터분석준전문가 자격증 공부

[BDA x 영진닷컴] ADsP 스터디: 1주차

hadara 2024. 4. 1. 22:36

24년 3월 27일 ADsP 1주차 스터디를 진행했다.

스터디 범위:  PART 3 데이터 분석 - R기초와 데이터 마트(p117~p146) *PART 3 데이터 분석 - 통계 분석(p147~p200)

오프라인으로 진행했고, 스터디원들과 운영방식에 대해 논의하고 공부한 범위 내에서 이해가 잘 가지 않았던 부분을 질문하는 시간을 가졌다. 

나는 개념이 잘 이해되지 않았던 부분들에 대해 질문했다. 아래는 그에 대한 짧은 메모.

* 확률 변수: 확률 현상에 기인해 결과값이 확률적으로 정해지는 변수 

ex) 주사위를 던졌을 때 3이상이 나올 확률 = 확률 현상

* 자유도: 통계적 추정을 할 때 표본 자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수. 

표본 공간의 크기와 관련있음. 표본크기가 n일 때, 자유도는 n-1 / 이에 따라 분포의 모양이 변한다.

* 다중 대치법: 단순 대치법을 여러번 수행...

 



1~2주차 스터디 범위는 통계와 관련된 부분이 많다. 개인적으로 통계 공부를 많이 해보지 않아서 조금 어렵게 느껴졌다. 스터디원분들께 많이 질문하며 배워가야겠다. 

 

 

 


각 파트별로 공부가 더 필요할 것 같은 개념 간단히 메모

PART 03 데이터 분석_CHAPTER 02 통계분석

section 1. 통계학 개론

전체적으로 다시 봐야함... /척도 

 

section 2 . 확률 및 확률 분포

확률 변수, 확률 함수, 기댓값, 

이산확률분포 - 베르누이 / 이항 / 기하/ 포아송 언제 사용하는지

연속형 확률 분포 - 정규분포 / t 분포 / 카이제곱 분포 / F 분포 언제 사용하는지 

가설 검정 절차 / 제1종 오류, 제2종 오류

 

section 3 . 기초 통계 분석

회귀 분석 - 선형 회귀 모델 평가 방법 , 다중 공선성, 

상관 분석 - 피어슨(연속형) , 스피어만(이산형도가능) , 공분산

주성분 분석(PCA)

 

다음 주부터는 개념 정리도 조금 해야지...