리뷰
-
ADP 실기 28회 복기 + 후기 (230312)리뷰 2023. 3. 14. 21:43
[머신러닝] (50점) 1. 데이터 준비 (20) 1-1) 데이터 품질 확인하고, 차원 축소필요한지 EDA (5) 1-2) 1-1에서 발견한 문제점이 모델에 어떤 영향 미치는지 작성, 해결하고 데이터 재구축 (5) 1-3) 오버피팅됐다는 가정하에 해결방법 2가지와 장단점 그리고 수행 결과 (10) * 변수가 NUMERIC이라고 되어있는데 실제로는 문자가 쓰인 ROW가 몇 개 발견되어서 자료 오류 아니냐고 질문했는데 이상없으니 그대로 진행하라고 함.. ㄱ- 2. 알고리즘 적용 (20) 2-1) RandomForest, Neural Network, LGBM 분류분석 수행, F1 score로 성능평가 및 비교 (5) 2-2) soft, hard voting 수행, F1 score로 성능평가 및 비교 (10) ..
-
ADP 실기 27회 복기 + 후기 (221126)리뷰 2022. 12. 6. 13:04
[기계학습] creditcard fraud 데이터, 신용카드 이상 데이터 Time 최초 거래 ~ 트랜잭션 거래 사이 기간 V1~V17 개인정보 보호로 설명 없음 Amount 거래 결제 금액 Class 0 정상거래 1 사기거래 1-1. EDA 1-2. 종속변수 Class 포함해 상관분석, 전처리 필요여부 제시 2-1. 차원축소 필요성 검토, 필요 시 2개 이상 후보 알고리즘 비교해 적정 알고리즘 추천 2-2. 2-1에서 추천한 알고리즘 구현하고, 구현의 정당성 주장 3-1. 오버샘플링, 언더샘플링 장단점 비교하고, (2-2에 나온) 데이터에 적절한 샘플링 방법 제시하고 구현 3-2. 3-1 샘플링 결과 활용하여 사기 분류 모델 2개 구현하고, 성능 비교 분석 4-1. 이상 탐지 모델 2개 이상 후보 알고리..
-
ADP 실기 26회 복기 + 후기 (220925)리뷰 2022. 9. 26. 15:54
3번째 실기를 응시하며 ... 앞의 1,2번은 공부를 거의 안하고 봐서 불합격이라는 단어에 무던했는데, 이번에는 꼴에 공부 조금 했다고 아쉬운 것들이 한바가지 ... 1. onlineRetail.csv 데이터 1-1. 결측치 식별 후 처리하기 1-2. 이상치 제거하기 1-3. kmeans 혹은 DBSCAN 방법을 이용해서 군집화하기, 모델 선정 이유 서술하기 2. 1번 문제의 연장선 2-1. 군집 성능 지표 2-2. 군집별 추천 상품 2-3. KNN 통해서 특정 고객? '12413' 추천 결과 1번은 상당히 군집분석의 정석다운 문제이다. 1-1 1-2는 전처리하라는 거니까 패스하고, 1-3에서 나는 kmeans 이용해서 풀고자 했으나 시험장 환경이 좋지 않아서(ㅋㅋ ㄹㅇ임 7만원이나 받아먹으면서 환경 왜..