종합 대시보드
Data Science Level 2 인증 시험 대비 학습 포털
필기 모의고사 최고점
실기 실습 완료
오늘의 학습 상태
Level 2 검정 안내
객관식/단답형 20문항 (60분)
통계학 입문, 기초 확률분포, 검정(t-test, ANOVA, Chi-square), 회귀분석, 머신러닝 기초 모델 및 모델 평가에 대한 개념과 계산 문제를 출제합니다.
- 통계적 가설 검정과 해석 능력
- 선형 회귀 분석 계수 해석 및 R-square 계산
- 분류 모델 평가지표(Precision, Recall, F1) 계산
Python 실습형 3문항 (90분)
Jupyter Notebook 환경에서 Python 라이브러리(Pandas, Numpy, Scikit-learn, Statsmodels)를 활용하여 데이터 분석 및 가설 검정, 모델 학습을 진행합니다.
- Pandas 데이터 가공 및 결측치/이상치 처리
- Scikit-learn 머신러닝 파이프라인 설계 및 검증
- t-test, ANOVA 분석 실행 및 p-value 해석
필기 시험 연습
통계학 및 머신러닝 객관식/단답형 문제 풀이
연습 모드 선택
실전 모의고사 (20문항)
100개 고정 세트 중 최근 응시 세트를 제외하고 다음 세트를 배정합니다. 시험 시간 60분 내에 20문제를 풀고 상세 오답 해설을 확인합니다.
단원별 집중 학습
기초 통계, 가설 검정, 회귀분석, 머신러닝 개념 등 취약한 단원만 선택하여 순서대로 풀어볼 수 있습니다.
문제 목록
85점 (17 / 20 맞춤)
축하합니다! 합격 기준인 70점을 통과하셨습니다.
단원별 정답률 분석
오답 노트 & 문제별 해설
실기 실습실
Python 환경에서 실제 데이터 정제, 가설 검정 및 ML 모델 빌드 실습
실기 모의 실습 목록
각 문제 세트는 실제 Data Science 실기 시험 양식과 매우 유사하게 데이터 가공 및 가설 검정/모델 적합을 종합적으로 요구합니다.
빈칸 채워넣기 실습 퀴즈
핵심 함수와 코드 문법을 직접 입력하며 실기 감각을 빠르게 점검합니다.
라이브러리
목적
퀴즈를 시작하세요
필터를 선택한 뒤 퀴즈를 시작하면 코드 빈칸 문제가 표시됩니다.
실습 문제 1: 임직원 이탈 예측
데이터 컬럼 정의서
| 컬럼명 | 설명 | 타입 |
|---|
함수 치트시트
pandas, NumPy, SciPy, scikit-learn 함수를 언제 어떻게 쓰는지 빠르게 확인
라이브러리
목적
핵심 요약 & 통계 계산기
DS Level 2 핵심 수식 정리 및 시뮬레이션을 통한 개념 시각화
기초 통계 & 가설 검정
일표본 z-검정 (One-Sample Z-Test)
통계학모분산($\sigma^2$)을 아는 상태에서 표본 평균이 모평균과 유의하게 다른지 검정합니다.
from scipy.stats import norm
# 검정통계량 z에 대한 p-value 계산 (양측검정)
p_val = (1 - norm.cdf(abs(z_stat))) * 2
일표본 t-검정 (One-Sample T-Test)
통계학모분산을 모를 때, 표본 평균이 대립가설의 특정 모평균 값과 다른지 검정합니다.
from scipy import stats
# 1표본 t-검정
stat, p_val = stats.ttest_1samp(data, popmean=mu0)
일원 분산분석 (One-way ANOVA)
통계학세 개 이상의 독립적인 집단 간 평균 차이가 유의한지 검정합니다. 집단 내 변동 대비 집단 간 변동의 크기를 F-통계량으로 계산합니다.
from scipy import stats
# 세 그룹 g1, g2, g3 의 ANOVA 검정
f_stat, p_val = stats.f_oneway(g1, g2, g3)
카이제곱 검정 (Chi-Square Test)
통계학범주형 변수들 간의 독립성을 검정하거나(독립성 검정), 관측 빈도가 예상 비율과 부합하는지(적합도 검정) 확인합니다.
from scipy import stats
# 분할표 contingency_table 기반 독립성 검정
chi2, p, dof, expected = stats.chi2_contingency(table)
회귀 분석 (Regression Analysis)
선형 회귀 모델 & 결정계수 ($R^2$)
회귀분석독립변수 $X$와 종속변수 $Y$의 선형 관계를 계수($\beta$)로 모형화하며, 회귀식의 설명력을 결정계수($R^2$)로 나타냅니다.
import statsmodels.api as sm
# 상수항(intercept) 추가 후 OLS 회귀 분석 적합
X = sm.add_constant(x_data)
model = sm.OLS(y_data, X).fit()
print(model.summary()) # R2, P-value 확인 가능
다중공선성 & 분산팽창인자 (VIF)
회귀분석독립변수들 간의 강한 상관관계가 존재할 때 발생하며, VIF가 10 이상인 경우 심각한 다중공선성이 의심되어 변수 제거를 고려합니다.
from statsmodels.stats.outliers_influence import variance_inflation_factor
# 각 변수별 VIF 계산
vif_data = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]
머신러닝 & 평가 지표 (Machine Learning Metrics)
분류 모델 평가지표
머신러닝모델의 예측과 실제 클래스를 기반으로 분류 성능을 종합적으로 평가합니다.
from sklearn.metrics import precision_score, recall_score, f1_score
# 예측치(y_pred)와 실젯값(y_true) 평가지표 구하기
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)
t-검정 시뮬레이터 설정
두 집단(A/B)의 평균과 분산, 표본 크기를 직접 수정해 가며 t-값과 p-value의 변화 및 귀무가설의 기각 여부를 실시간으로 확인할 수 있습니다.
집단 A (Group A)
집단 B (Group B)
분석 결과 및 유의성 검정
유의확률 $p\text{-value}$가 유의수준 0.05 보다 작으므로, 귀무가설($H_0$)을 기각합니다. 즉, 집단 A와 집단 B의 모평균 간에는 통계적으로 유의미한 차이가 존재합니다.
혼동 행렬 (Confusion Matrix) 데이터 입력
True Positive, False Positive, False Negative, True Negative 값을 조절하여 정확도, 정밀도, 재현율, F1 스코어가 변하는 과정을 관찰하세요.
Type I Error (FP): 실제로는 음성이나 양성으로 잘못 예측한 경우 (예: 암이 없는데 암이라고 진단)
Type II Error (FN): 실제로는 양성이나 음성으로 잘못 예측한 경우 (예: 암이 있는데 정상이라고 진단 - 위험함)
평가지표 계산 결과
개념 암기방
플래시 카드와 연상 암기 비법(두문자 공식)을 통한 핵심 이론 초고속 암기
제1종 오류 vs 제2종 오류
- 제2종 오류 ($\beta$): 귀무가설이 거짓인데 기각하지 못하는 오류.
참기거채! (참인데 기각하면 1종, 거짓인데 채택하면 2종)
연상 기억법(두문자 암기) 활성화
시험에 반드시 출제되는 핵심 이론 및 가설 수식들을 쉽게 암기할 수 있도록 엮은 암기 공식집입니다. 파란색 단어 입력창을 빈칸으로 토글하여 스스로 자가 테스트를 해보세요!