ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • ADP 실기 28회 복기 + 후기 (230312)
    리뷰 2023. 3. 14. 21:43

    [머신러닝] (50점)

    1. 데이터 준비 (20)

    1-1) 데이터 품질 확인하고, 차원 축소필요한지 EDA (5)
    1-2) 1-1에서 발견한 문제점이 모델에 어떤 영향 미치는지 작성, 해결하고 데이터 재구축 (5)
    1-3) 오버피팅됐다는 가정하에 해결방법 2가지와 장단점 그리고 수행 결과 (10)

     

    * 변수가 NUMERIC이라고 되어있는데 실제로는 문자가 쓰인 ROW가 몇 개 발견되어서 자료 오류 아니냐고 질문했는데 이상없으니 그대로 진행하라고 함.. ㄱ-

    2. 알고리즘 적용 (20)
    2-1) RandomForest, Neural Network, LGBM 분류분석 수행, F1 score로 성능평가 및 비교 (5)
    2-2) soft, hard voting 수행, F1 score로 성능평가 및 비교 (10)
    2-3) 총 5가지 중 모델 최종 선정, 객관적 근거로 설명 (5)

    3. 후작업 (10)
    3-1) 1, 2 문제 하면서 기계학습 모델 만들 때 추가 필요한 절차가 있으면 작성 (5)
    3-2) 최종 선정된 기계학습 모델을 정보시스템 안에 구축할 때 필요한 거나 절차 있으면 작성 (5)

     

    후기) 모델링 자체에 대한 어려움은 없었으나(5가지 구현), 후작업 특히 3-2 무슨 말을 써야할지 말문도 막히고 시간도 없어서 패스해버린게 마음에 걸린다... 몰라 ... 몰러

     

    [통계분석] (50점)

    4. 생존분석 (15)

    4-1) Kaplan Meier 공급사별 25, 35, 45개월 이후 사망?중단?할 확률

    4-2) 생존곡선 가설 세우고, Log Rank Test로 가설 검정

     

    5. 시식전후 구매의사 차이 여부 가설검정

    임의의 숫자

    5-1) 검정통계량, 유의확률

    5-2) 유의수준 0.05하 가설검정

     

    6. highschool.csv (region, score)

    A, B지역 고3 모의고사 성적 분포 동일한지 검정 (단, 두 분포는 서로 독립)

    n(A) = 12, n(B) = 24

     

    7. cholesterol.csv 상관분석 (age, weight, cholesterol)

    7-1) 나이, 콜레스테롤 간 상관계수, 유의확률

    7-2) 유의수준 0.05하 가설검정

    '리뷰' 카테고리의 다른 글

    ADP 실기 27회 복기 + 후기 (221126)  (0) 2022.12.06
    ADP 실기 26회 복기 + 후기 (220925)  (2) 2022.09.26

    댓글

Designed by Tistory.