본문 바로가기

Work_Praciatal Competence9

[ADsP 정리] 3과목 5장 5절 군집 분석 & 연관분석 보호되어 있는 글 입니다. 2021. 2. 8.
[ADsP 정리] 3과목 5장 3절 앙상블 & 인공 신경망 분석 앙상블 가. 정의 주어진 자료로부터 여러 개의 예측모형들을 만든 후 예측모형들을 조합하여 하나의 최종 예측 모형을 만드는 방법으로 다중 모델 조합, 분류기 조합이 있다. 나. 학습방법의 불안정성 학습자료의 작은 변화에 의해 예측모형이 크게 변하는 경우, 그 학습방법은 불안정하다. 가장 안정적인 방법으로는 1-nearest neighbor이 존재한다. 가장 불안정한 방법으로는 의사결정나무가 있다. 다. 앙상블 기법의 종류 베깅(Bagging) 과 랜덤포레스트, 부스팅의 정의 및 설명 [머신러닝]앙상블/배깅/랜덤포레스트/부스팅 차이 배깅 Breiman에 의해 제안된 배깅은 주어진 자료에서 여러 개의 붓스트랩 자료를 생성하고 각 붓스트랩 자료에 예측 모형을 만든 후 결합하여 최종 예측모형을 만드는 방법이다. .. 2021. 2. 8.
[ADsP 정리] 3과목 3장 데이터 마트 최소 2문제 이상 출제 됩니다. 목표 데이터 마트를 구성하는 요약변수와 파생변수 구분 reshape 패키지를 활용한 데이터마트 생성 sqldf 패키지와 plyr 패키지를 활용해 데이터를 핸들링 data, table 이해 3-3-1. 데이터 변경 및 요약 데이터마트 데이터 웨어하우스와 사용자 사이의 중간층에 위치 한 것으로, 하나의 주제 또는 부서 중심의 데이터 웨어하우스라고 할 수 있다. CRM관련 업무 중 핵심은 고객 데이터 마트 구축하는 것이다! 데이터 마트의 구축 여부에 따라 분석효과 차이가 크다 (최신 분석기법들을 사용하기에 분석가들 간 편차가 덜하기 때문이다.) 데이터 자료 변수 변환 (요약변수와 파생변수) 요약변수 수집 된 정보를 분석에 맞게 종합한 변수이다. ex) 총 구매 금액, 금액, 횟.. 2021. 2. 8.
[ADsP 정리] 2과목 데이터 분석기획 2-1. 데이터 분석 기획의 이해 분석기획의 방향성 도출 분석 기획의 특징 분석기획이란 실제 과제수행에 앞서 수행 과제 정의하고 결과를 도출 할 수 있도록 이를 철저하게 관리 할 수 있는 방안을 사전에 계획하는 일련의 작업. 데이터 사이언티스트의 역량 수리/통계적 지식 it정보기술 해당 비즈니스에 대한 이해 분석 대상과 방법 분석의 대상과 분석의 방법에 따라서 4가지 방법으로 나누어진다. 특정 분석 주제를 대상으로 진행 할 경우에도, 분석 주제 및 기법 특성상 4가지 유형을 넘나들면서 분석을 수행한다. optimization(최적화) , insight(통찰), solution(해결), discovery(탐색 혹은 발견) 한국말로도 알아놓자! 목표 시점 별 분석 기획 방안 "과제 중심 접근방식"과 "장기 .. 2021. 2. 8.
반응형