-
ADP 실기 27회 복기 + 후기 (221126)리뷰 2022. 12. 6. 13:04
[기계학습]
creditcard fraud 데이터, 신용카드 이상 데이터
Time 최초 거래 ~ 트랜잭션 거래 사이 기간
V1~V17 개인정보 보호로 설명 없음
Amount 거래 결제 금액
Class 0 정상거래 1 사기거래
1-1. EDA
1-2. 종속변수 Class 포함해 상관분석, 전처리 필요여부 제시2-1. 차원축소 필요성 검토, 필요 시 2개 이상 후보 알고리즘 비교해 적정 알고리즘 추천
2-2. 2-1에서 추천한 알고리즘 구현하고, 구현의 정당성 주장3-1. 오버샘플링, 언더샘플링 장단점 비교하고, (2-2에 나온) 데이터에 적절한 샘플링 방법 제시하고 구현
3-2. 3-1 샘플링 결과 활용하여 사기 분류 모델 2개 구현하고, 성능 비교 분석4-1. 이상 탐지 모델 2개 이상 후보 알고리즘 제시 및 비교해 적정 알고리즘 추천
4-2. 4-1에서 구현한 알고리즘에 대한 결과 제시
4-3. 3-2와 4-2의 결과를 비교하여, 분석가로서의 종합적 결론 제시
[통계분석]
5. 1년 전 연간 생산량 10만, 공정 개선해 1년 후 15만으로 개선, 스마트팩토리 구축해 1년 후 25만으로 개선.연평균 몇 배 증가했는지 가장 적정한 대푯값 제시 (반올림 2자리)
6. 8개 광고시간 측정해 평균시간 18.8초, 표본분산이 3.2. 90% 신뢰구간. (표본은 정규분포 가정)
7. 16개 강의 상류와 하류의 어류 다양성 평균이 같은지, 다른지 검정 (상류와 하류는 독립적이지 않고 종속적임)
7-1. 가설 설정
7-2. 검정통계량, 유의확률, 가설 채택 여부8. Traffic 교통량, Temperature 온도, Precipitation 강수량, Wind 풍량 데이터
8-1. 분위수 회귀 적용해서 회귀계수 구하기
8-2. 온도 15.5, 강수량 16.5, 풍량 1.6 일 때 교통량은?9. Line 호선(1~2), Month 월(1~2), Total 탑승 인원수 데이터상호교호작용 효과 있는지 검정 (제곱합 Type3 활용)
9-1. 가설설정
9-2. 검정통계량, 유의확률, 가설 채택 여부'리뷰' 카테고리의 다른 글
ADP 실기 28회 복기 + 후기 (230312) (2) 2023.03.14 ADP 실기 26회 복기 + 후기 (220925) (2) 2022.09.26