자격증/데이터분석가[ADsP] 6

[ADsP] 3일 합격수기 - 2021 비전공자인 당신도, 합격!

비전공자 ADsP 3일 만에 합격하기 요즘 모든 회사에서 가산점을 주는 빅데이터 관련 자격증, ADsP를 취득하였다. 총 15시간 정도 공부하여 합격한 자격증 치고는 생긴 게 멋있다. 비전공자가 어떻게 15시간 만에 땄을까? 그 이유는 2가지만 기억하면 된다. 1. '기출문제'만 풀기 2. 이 블로그의 ADsP 중요 개념글 정독 1. 기출문제만 풀기 ADsP의 경우, 원 개념은 매우 어렵다. 인공지능 신경망부터 SOP(자기 조직화 지도)까지 파고들면 끝이 없다. 나야 뭐 알파고 논문을 분석해봤으니 조금은 알지만.. 그러나 비전공자들에게는 이 모든 것을 이해하는 것은 사치다. 따라서 기출문제를 먼저 2세트 풀고, 시험에 나오는 개념을 대충 이해한 후, 그 주요 개념들만 이해하고 기출 3세트 정도를 더 풀면..

[ADsP] 3과목 필수! 오분류에 관한 추정치

1. ADsP 3과목에 무조건 출제되는 오분류표는 다음과 같다 [Confusion Matirx] TP: 실제(Conditon)값=예측(Prediction)치=TRUE 빈도 TN: 실제값=예측치=FALSE 빈도 FP: 실제는 False인데 True로 예측한 빈도 FN: 실제는 True인데 False로 예측한 빈도 이게 굉장히 헷갈린다. 그러나 T = 실제와 예측이 동일, F = 실제와 예측이 불일치 P = 예측이 Positive, N = 예측이 Negative 이렇게 기억하면 쉽다. 2. 실제 출제되는 문제 ADsP 실제 출제는 위의 오분류 표를 주고, 아래 평가 지표를 계산하기만 하면 된다. 평가 지표 계산식 의미 정밀도 (Precision) TP / (TP + FP) 예측 정품 중 실제 정품인 비율 정..

[ADsP] 3과목 필독! 연관분석의 지지도, 신뢰도, 향상도

연관분석이란? ADsP 시험에서 개념은 2문제, 계산도 약 1~2문제 출제 되는 연관분석의 지지도, 신뢰도, 향상도! 연관규칙이란 항목들 간의 조건-결과로 이루어지는 '패턴'을 발견하는 것이며, 상품의 구매·서비스와 같은 거래·사건들 간의 규칙을 의미한다. 기업이 소비자의 장바구니에 무엇이 같이 들어 있는지 확인할 때 사용하기에 장바구니 분석이라고도 한다. (서열 분석, 물건 배열, 카탈로그, 교차 판매) 등에 활용되는 데이터 마이닝 기법이다. A=초콜릿, B=우유로 생각하고 어떻게 묶음 판매해야 잘 팔릴지 생각하면서 아래 표를 보자. 연관규칙의 척도 식 지지도(Support) 전체 매장 판매 中 초콜릿과 우유를 동시 포함하는 판매의 확률 (초콜릿∩우유)/ (전체) 신뢰도(Confidence) 초콜릿을 ..

[ADsP] 3과목 기출 + 주관식 정리

ADsP 3과목 기출 ADsP 주관식 기출 문제 (3과목) 답 1 SQL을 활용하거나 SAS에서 porc sql로 작업하던 사용자들에게 R프로그램에서 지원해주는 패키지는? sqldf() 2 출력 결과는? x 50) x는 1부터 100까지의 수 x가 50 이상일 때만 true, 즉 1이므로 1+1+...+1 = 50. 답 = 50 3 여러 대상 간의 객관적 또는 주관적 관계에 관한 수치적 자료를 이용해 유사성에 대한 측정치를 상대적 거리로 시각화하는 방법으로 설문지 응답자의 개개인의 유사성과 선호도 차이를 시각화하여 보고 설명하는 통계적 방법론 다차원 척도법 4 평균으로부터 t standard deviation 이상 떨어져 있는 값들을 이상값(outlier)으로 판단하고 t는 3으로 설정하는 이상값 검색 ..

[ADsP] 2과목 기출 + 주관식 정리

ADsP 2과목 기출 ADsP 주관식 기출 문제 (2과목) 답 1 분석 방법론의 “시스템 구현” 단계에서 시스템으로 구현된 모델은 검증을 위하여 단위 테스트, 통합 테스트, 시스템 테스트 등을 실시한다. 이중 (ㄱ) 테스트는 품질관리 차원에서 진행함으로써 적용된 시스템의 객관성과 안정성을 확보한다. 시스템 2 데이터 거버넌스 체계에서 데이터 저장소 관리란 메타데이터 및 표준 데이터를 관리하기 위한 전사 차원의 저장소로 구성된다. 저장소는 데이터 관리 체계 지원을 위한 (ㄱ) 및 관리용 응용소프트웨어를 지원하고 관리 대상 시스템과의 인터페이스를 통한 통제가 이루어져야 한다. 또한 데이터 구조 변경에 따른 (ㄴ)도 수행되어야 효율적인 활용이 가능하다. (ㄱ) 워크플로우 (ㄴ) 사전영향 평가 3 문제 탐색을 ..

[ADsP] 1과목 기출 + 주관식 정리

ADsP 1과목 기출 ADsP 주관식 기출 문제 (1과목) 답 1 데이터 사이언티스트가 갖춰야 할 역량은 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련에 관련된 능력인 (ㄱ) skill과 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들어 내기 위한 능력인 (ㄴ) skill로 나누어진다. (ㄱ) Hard (ㄴ) Soft 2 (ㄱ)는 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 것이며, 지식을 도출하기 위한 재료이다. 정보 3 기업의 의사결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합을 (ㄱ)라고 한다. 데이터 웨어하우스 4 지난 몇 년간 여러 사일로 대신 하나의 데이터 소스를 추구하는 경향이 생겼다. 전..