종합 대시보드

Data Science Level 2 인증 시험 대비 학습 포털

2026-06-09

필기 모의고사 최고점

-

미응시 (합격 커트라인 70점)

실기 실습 완료

0 / 5

진행률 0%

오늘의 학습 상태

Active

꾸준한 연습이 합격의 지름길입니다.

Level 2 검정 안내

필기 검정

객관식/단답형 20문항 (60분)

통계학 입문, 기초 확률분포, 검정(t-test, ANOVA, Chi-square), 회귀분석, 머신러닝 기초 모델 및 모델 평가에 대한 개념과 계산 문제를 출제합니다.

  • 통계적 가설 검정과 해석 능력
  • 선형 회귀 분석 계수 해석 및 R-square 계산
  • 분류 모델 평가지표(Precision, Recall, F1) 계산
실기 검정

Python 실습형 3문항 (90분)

Jupyter Notebook 환경에서 Python 라이브러리(Pandas, Numpy, Scikit-learn, Statsmodels)를 활용하여 데이터 분석 및 가설 검정, 모델 학습을 진행합니다.

  • Pandas 데이터 가공 및 결측치/이상치 처리
  • Scikit-learn 머신러닝 파이프라인 설계 및 검증
  • t-test, ANOVA 분석 실행 및 p-value 해석

필기 시험 연습

통계학 및 머신러닝 객관식/단답형 문제 풀이

연습 모드 선택

실전 모의고사 (20문항)

100개 고정 세트 중 최근 응시 세트를 제외하고 다음 세트를 배정합니다. 시험 시간 60분 내에 20문제를 풀고 상세 오답 해설을 확인합니다.

세트 정보 로딩 중

단원별 집중 학습

기초 통계, 가설 검정, 회귀분석, 머신러닝 개념 등 취약한 단원만 선택하여 순서대로 풀어볼 수 있습니다.

Q. 1 / 20
60:00
모의고사 세트
가설검정
모집단의 분산을 알지 못할 때, 단일 표본의 평균이 특정 값과 같은지 검정하는 방법으로 가장 적절한 분석법은 무엇인가?
A
일표본 z-검정 (One-sample z-test)
B
일표본 t-검정 (One-sample t-test)
C
독립표본 t-검정 (Independent two-sample t-test)
D
카이제곱 독립성 검정 (Chi-square test of independence)

문제 목록

푼 문항 현재 문항 남은 문항
합격

85점 (17 / 20 맞춤)

축하합니다! 합격 기준인 70점을 통과하셨습니다.

단원별 정답률 분석

오답 노트 & 문제별 해설

실기 실습실

Python 환경에서 실제 데이터 정제, 가설 검정 및 ML 모델 빌드 실습

실기 모의 실습 목록

각 문제 세트는 실제 Data Science 실기 시험 양식과 매우 유사하게 데이터 가공 및 가설 검정/모델 적합을 종합적으로 요구합니다.

빈칸 채워넣기 실습 퀴즈

핵심 함수와 코드 문법을 직접 입력하며 실기 감각을 빠르게 점검합니다.

풀이 0회 정답률 0% 오답 0개

라이브러리

목적

퀴즈를 시작하세요

필터를 선택한 뒤 퀴즈를 시작하면 코드 빈칸 문제가 표시됩니다.

문제 설명 데이터 설명

실습 문제 1: 임직원 이탈 예측

난이도: 보통
임직원의 정보가 담긴 데이터를 이용하여 이탈 여부(`attrition`)를 예측하고 가설 검정을 실행하시오.

데이터 컬럼 정의서

컬럼명 설명 타입
solution.py
1
실행 콘솔 (Console Output)
Python 실행 환경(Pyodide) 초기화를 대기하는 중입니다...

함수 치트시트

pandas, NumPy, SciPy, scikit-learn 함수를 언제 어떻게 쓰는지 빠르게 확인

라이브러리

목적

핵심 요약 & 통계 계산기

DS Level 2 핵심 수식 정리 및 시뮬레이션을 통한 개념 시각화

기초 통계 & 가설 검정

일표본 z-검정 (One-Sample Z-Test)

통계학

모분산($\sigma^2$)을 아는 상태에서 표본 평균이 모평균과 유의하게 다른지 검정합니다.

$$Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}$$
Python scipy 활용
from scipy.stats import norm
# 검정통계량 z에 대한 p-value 계산 (양측검정)
p_val = (1 - norm.cdf(abs(z_stat))) * 2

일표본 t-검정 (One-Sample T-Test)

통계학

모분산을 모를 때, 표본 평균이 대립가설의 특정 모평균 값과 다른지 검정합니다.

$$t = \frac{\bar{X} - \mu_0}{s / \sqrt{n}} \quad (df = n - 1)$$
Python scipy 활용
from scipy import stats
# 1표본 t-검정
stat, p_val = stats.ttest_1samp(data, popmean=mu0)

일원 분산분석 (One-way ANOVA)

통계학

세 개 이상의 독립적인 집단 간 평균 차이가 유의한지 검정합니다. 집단 내 변동 대비 집단 간 변동의 크기를 F-통계량으로 계산합니다.

$$F = \frac{MS_{between}}{MS_{within}} = \frac{SSB/(k-1)}{SSW/(n-k)}$$
Python scipy 활용
from scipy import stats
# 세 그룹 g1, g2, g3 의 ANOVA 검정
f_stat, p_val = stats.f_oneway(g1, g2, g3)

카이제곱 검정 (Chi-Square Test)

통계학

범주형 변수들 간의 독립성을 검정하거나(독립성 검정), 관측 빈도가 예상 비율과 부합하는지(적합도 검정) 확인합니다.

$$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \quad (df = (r-1)(c-1))$$
Python scipy 활용
from scipy import stats
# 분할표 contingency_table 기반 독립성 검정
chi2, p, dof, expected = stats.chi2_contingency(table)

회귀 분석 (Regression Analysis)

선형 회귀 모델 & 결정계수 ($R^2$)

회귀분석

독립변수 $X$와 종속변수 $Y$의 선형 관계를 계수($\beta$)로 모형화하며, 회귀식의 설명력을 결정계수($R^2$)로 나타냅니다.

$$R^2 = 1 - \frac{SSE}{SST} = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2}$$
Python statsmodels 활용
import statsmodels.api as sm
# 상수항(intercept) 추가 후 OLS 회귀 분석 적합
X = sm.add_constant(x_data)
model = sm.OLS(y_data, X).fit()
print(model.summary()) # R2, P-value 확인 가능

다중공선성 & 분산팽창인자 (VIF)

회귀분석

독립변수들 간의 강한 상관관계가 존재할 때 발생하며, VIF가 10 이상인 경우 심각한 다중공선성이 의심되어 변수 제거를 고려합니다.

$$VIF_i = \frac{1}{1 - R_i^2}$$
Python statsmodels 활용
from statsmodels.stats.outliers_influence import variance_inflation_factor
# 각 변수별 VIF 계산
vif_data = [variance_inflation_factor(X.values, i) for i in range(X.shape[1])]

머신러닝 & 평가 지표 (Machine Learning Metrics)

분류 모델 평가지표

머신러닝

모델의 예측과 실제 클래스를 기반으로 분류 성능을 종합적으로 평가합니다.

$$\text{Precision} = \frac{TP}{TP + FP} \quad \text{Recall} = \frac{TP}{TP + FN}$$ $$F1\text{-score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$$
Python Scikit-learn 활용
from sklearn.metrics import precision_score, recall_score, f1_score
# 예측치(y_pred)와 실젯값(y_true) 평가지표 구하기
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)
Data Science 시험 이론 원문을 불러오는 중입니다.

t-검정 시뮬레이터 설정

두 집단(A/B)의 평균과 분산, 표본 크기를 직접 수정해 가며 t-값과 p-value의 변화 및 귀무가설의 기각 여부를 실시간으로 확인할 수 있습니다.

집단 A (Group A)

집단 B (Group B)

분석 결과 및 유의성 검정

자유도 ($df$): 58.00
공통 표준편차 ($s_p$ 또는 Welch): 2.26
t-검정통계량 ($t$): -2.56
유의확률 ($p\text{-value}$, 양측): 0.0131
결론 (Conclusion)

유의확률 $p\text{-value}$가 유의수준 0.05 보다 작으므로, 귀무가설($H_0$)을 기각합니다. 즉, 집단 A와 집단 B의 모평균 간에는 통계적으로 유의미한 차이가 존재합니다.

혼동 행렬 (Confusion Matrix) 데이터 입력

True Positive, False Positive, False Negative, True Negative 값을 조절하여 정확도, 정밀도, 재현율, F1 스코어가 변하는 과정을 관찰하세요.

예측: Positive (1)
예측: Negative (0)
실제: Positive (1)
TP
FN (Type II Error)
실제: Negative (0)
FP (Type I Error)
TN

Type I Error (FP): 실제로는 음성이나 양성으로 잘못 예측한 경우 (예: 암이 없는데 암이라고 진단)

Type II Error (FN): 실제로는 양성이나 음성으로 잘못 예측한 경우 (예: 암이 있는데 정상이라고 진단 - 위험함)

평가지표 계산 결과

총 표본 개수 ($N$): 300
정확도 (Accuracy): 90.00%
정밀도 (Precision): 88.89%
재현율 (Recall / Sensitivity): 80.00%
F1-Score: 84.21%
특이도 (Specificity): 95.00%

개념 암기방

플래시 카드와 연상 암기 비법(두문자 공식)을 통한 핵심 이론 초고속 암기

학습 진행률: 0 / 0 카드
기초 통계
Q. 제1종 오류와 제2종 오류는 어떤 의미인가요?
카드를 클릭하면 정답이 공개됩니다
기초 통계

제1종 오류 vs 제2종 오류

- 제1종 오류 ($\alpha$): 귀무가설이 참인데 잘못 기각하는 오류.
- 제2종 오류 ($\beta$): 귀무가설이 거짓인데 기각하지 못하는 오류.
암기 비법 (Mnemonic)

참기거채! (참인데 기각하면 1종, 거짓인데 채택하면 2종)

클릭 시 질문으로 돌아갑니다
1 / 15

연상 기억법(두문자 암기) 활성화

시험에 반드시 출제되는 핵심 이론 및 가설 수식들을 쉽게 암기할 수 있도록 엮은 암기 공식집입니다. 파란색 단어 입력창을 빈칸으로 토글하여 스스로 자가 테스트를 해보세요!