ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ADP 실기 27회 복기 + 후기 (221126)
    리뷰 2022. 12. 6. 13:04

    [기계학습]
    creditcard fraud 데이터, 신용카드 이상 데이터
    Time 최초 거래 ~ 트랜잭션 거래 사이 기간
    V1~V17 개인정보 보호로 설명 없음
    Amount 거래 결제 금액
    Class 0 정상거래 1 사기거래

    1-1. EDA
    1-2. 종속변수 Class 포함해 상관분석, 전처리 필요여부 제시

     

    2-1. 차원축소 필요성 검토, 필요 시 2개 이상 후보 알고리즘 비교해 적정 알고리즘 추천
    2-2. 2-1에서 추천한 알고리즘 구현하고, 구현의 정당성 주장

     

    3-1. 오버샘플링, 언더샘플링 장단점 비교하고, (2-2에 나온) 데이터에 적절한 샘플링 방법 제시하고 구현
    3-2. 3-1 샘플링 결과 활용하여 사기 분류 모델 2개 구현하고, 성능 비교 분석

     

    4-1. 이상 탐지 모델 2개 이상 후보 알고리즘 제시 및 비교해 적정 알고리즘 추천
    4-2. 4-1에서 구현한 알고리즘에 대한 결과 제시
    4-3. 3-2와 4-2의 결과를 비교하여, 분석가로서의 종합적 결론 제시

     


    [통계분석]
    5. 1년 전 연간 생산량 10만, 공정 개선해 1년 후 15만으로 개선, 스마트팩토리 구축해 1년 후 25만으로 개선.

    연평균 몇 배 증가했는지 가장 적정한 대푯값 제시 (반올림 2자리)

     

    6. 8개 광고시간 측정해 평균시간 18.8초, 표본분산이 3.2. 90% 신뢰구간. (표본은 정규분포 가정)

     

    7. 16개 강의 상류와 하류의 어류 다양성 평균이 같은지, 다른지 검정 (상류와 하류는 독립적이지 않고 종속적임)
    7-1. 가설 설정
    7-2. 검정통계량, 유의확률, 가설 채택 여부

     

    8. Traffic 교통량, Temperature  온도, Precipitation 강수량, Wind 풍량 데이터
    8-1. 분위수 회귀 적용해서 회귀계수 구하기
    8-2. 온도 15.5, 강수량 16.5, 풍량 1.6 일 때 교통량은?

     

    9. Line 호선(1~2), Month 월(1~2), Total 탑승 인원수 데이터 상호교호작용 효과 있는지 검정 (제곱합 Type3 활용)
    9-1. 가설설정
    9-2. 검정통계량, 유의확률, 가설 채택 여부

    '리뷰' 카테고리의 다른 글

    ADP 실기 28회 복기 + 후기 (230312)  (2) 2023.03.14
    ADP 실기 26회 복기 + 후기 (220925)  (2) 2022.09.26

    댓글

Designed by Tistory.