본문 바로가기

TIP/자격증

[ADsP기출 위주 핵심 정리] 2과목. 데이터 분석 기획

반응형

 

 

 

* 기출문제 위주의 요약정리로 실제 시험 내용에서 빠져있는 부분이 많을 수 있습니다.

주관식 기출 / 객관식 기출 / 주관식, 객관식 기출

 

 

2과목. 데이터 분석 기획

 

제1장. 데이터 분석 기획의 이해

 

■ 제1절. 분석 기획 방향성 도출

 

1. 분석 기획의 특징

 

1-1. 분석 주제 영역 ★

 

분석 대상 (What)

Known

Un-Known

분석 방법 (How)

Known

Optimization (최적화)

Insight (통찰)

Un-Known

Solution (솔루션)

Discovery (발견)

 

1-2. 목표 시점별 분석 기획 방안

 

당면한 분석 주제의 해결

(과제 단위)

지속적 분석 문화 내재화

(마스터플랜 단위)

1차 목표

Speed&Test

Accuracy&Deploy

과제 유형

Quick&Win

Long Term View

접근 방식

ProblemSolving

Problem Definition

 

 

2. 분석 기획 시 고려 사항

- 가용 데이터 (Availiable Data) : 관련 데이터의 파악

- 적절한 유스케이스 탐색 (Proper Business Use Case) : 비즈니스 케이스 확보

- 분석 과제 수행을 위한 장애 요소 (Low Barrier of Execution) : 이행 저해 요소 관리

[오답 : 원점에서 솔루션 탐색]

[오답 : 정형데이터의 확보 여부 판단] 

 

 

 

 

제2절. 분석 방법론

 

1. 분석 방법론 개요

 

1-1. 기업의 합리적인 의사 결정을 가로막는 장애 요소

- 고정관념

- 편향된 생각

- 플레이밍 효과 ★ : 동일한 사건이나 상황임에도 불구하고 개인의 판단이나 선택이 달라질 수 있는 현상

 

 

1-2. 분석 방법론 구성 요소

- 상세한 절차 (Procedure)

- 방법 (Method)

- 도구/기법 (Tool&Techniques)

- 템플릿/산출물 (Template&Output)

[오답 : 목적]

 

 

1-3. 적용 업무 특성에 따른 다양한 모델

- 폭포수 모델

 단계를 순차적으로 진행 (하향식)

 

- 프로토타입 모델

  고객 요구를 완전히 이해하지 못할 때 일부분을 우선 개발해 사용자에게 제공한 이후 사용자의 요구를 분석, 요구 정당성 점검, 성능 평가의 결과를 통한 개선 작업 진행

 

- 나선형 모델

  반복을 통해 점증적으로 개발하는 방법 (처음 시도하는 프로젝트 및 대규모 시스템 SW 개발에 적합)

 

 

 

2. KDD (Knowledge Discovery in Database) 분석 방법론

 

2-1. KDD 분석 절차

- 데이터셋 선택 (Selection) : 분석 대상의 비즈니스 도메인 이해와 프로젝트 목표 설정 필수 (목표 데이터 구성)

- 데이터 전처리 (Preprocessing) : 잡음, 이상 값, 결측치를 식별하고 필요시 제거 및 정제

- 데이터 변환 (Transformation) : 분석 목적에 맞는 변수를 선택하거나 데이터의 차원 축소

- 데이터 마이닝 (Data Mining) : 분석 목적에 맞는 데이터 마이닝 기법을 선택하여 특정 패턴 파악, 혹은 데이터 분류 및 예측

- 데이터 마이닝 결과 평가 (Interpretation/Evalution) : 결과에 대한 해석과 평가, 분석 목적과의 일치성 확인

 

 

 

3. CRISP-DM (Cross Industry Standard for Data Mining) 방법론

 

3-1. CRISP-DM 구성 (4 Level)

- 최상위 레벨 (Phase)

- 일반화 태스크 (General Task)

- 세분화 태스크 (Specialized Task)

- 프로세스 실행 (Process Instance)

 

 

3-2. CRISP-DM 프로세스 (6 Level) - 단방향 X. 단계단 피드백 통해 단계별 완성도를 높인다.

- 업무 이해

  1) 업무 목적 파악

  2) 상황 파악

  3) 데이터 마이닝 목표 설정

  4) 프로젝트 계획 수립

 

- 데이터 이해

  1) 초기 데이터 수집

  2) 데이터 기술 분석

  3) 데이터 탐색

  4) 데이터 품질 확인

 

- 데이터 준비

  1) 분석용 데이터 셋 선택 (KDD 분석 방법론의 데이터 전처리 단계와 유사)

  2) 데이터 정제

  3) 데이터 통합

  4) 데이터 포맷팅

 

- 모델링

  1) 모델링 기법 선택

  2) 테스트 계획 설계

  3) 모델 작성

  4) 모델 평가

  [오답 : 모델 적용성 평가]

 

- 평가

  1) 분석 결과 평가

  2) 모델링 과정 평

  3) 모델 적용성 평가

 

- 전개

  1. 전개 계획 수립

  2. 모니터링/유지보수 계획 수립

  3. 프로젝트 종료 보고서 작성

  4. 프로젝트 리뷰

 

 

 

4. 빅데이터 분석 방법론

 

4-1. 분석 기획 단계

- 프로젝트 범위 설정

- 데이터 분석 프로젝트 정의

- 프로젝트 수행 계획 수립

- 데이터 분석 위험 식별  -- 위험 대응 방안 : 회피, 전이, 완화, 수용 [오답 : 관리]

[오답 : 필요데이터의 정의]

 

* 데이터 준비 -> 데이터 분석 : 빅데이터 분석 방법론에서 단계 간 피드백이 반복적으로 많이 발생할 수 있는 단계

* 모델링 : 데이터 분석 단계 중 분석용 데이터를 이용한 가설 설정을 통하여 통계 모델을 만들거나 기계 학습을 이용한 데이터의 분류, 예측, 군집 등의 기능을 수행하는 모델을 만드는 과정

 

 

 

 

제3절. 분석 과제 발굴

 

1. 분석 과제 발굴 개요

 

1-1. 분석 과제 도출 방식 ★

- 하향식 접근 방식 (지도 학습) Why

  문제 구조가 분명하며, 해답을 찾기 위해 각 과정을 단계적으로 수행

  전통적인 방식

 

- 상향식 접근 방식 (비지도 학습) What

  데이터 기반으로 문제를 재정의하고 해결방안을 탐색

  생각치 못한 인사이트 도출

  최근 (빅데이터) 접근 방식

  [오답 ★ : 분석 대상이 명확하면 상향식 접근 방식이 적절하다]

 

 

1-2. 디자인 사고 프로세스 (IDEO)

d.school이 전통적인 분석적 사고를 극복하기 위해 사용한 접근법

공감 > 정의 > 아이디어화 > 시제품 만들기 > 거증

 

 

 

2. 하향식 접근 방식

 

- 각 과정이 체계적으로 단계화되어 수행하는 분석 과제 발굴 방식

- 문제 탐색 > 문제 정의 > 해결 방안 탐색 > 타당성 검토

 

 

2-1. 문제 탐색 단계

- 전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출하고 식별

 

- 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요

[오답 : 문제 탐색은 유스 케이스 활용보다는 새로운 이슈 탐색이 우선이다.]

 

- 비즈니스 모델 기반 문제 탐색 : 업무, 제품, 고객, 규제와 감사, 지원 인프라

 

- 분석 기획 발굴의 범위 확장

  1) 거시적 관점 (STEEP)

     사회 (Social), 기술 (Technological), 경제 (Economic), 환경 (Environmental), 정치 (Political)

  2) 경쟁자 확대 관점

     대체재, 경쟁자, 신규 진입자 [오답 ★ : 경쟁 채널]

  3) 시장 니즈 탐색 관점

     고객, 채널, 영향자들 [오답 : 대체제]

 

- 분석 유즈 케이스

  풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분식 문제로의 전환 및 적합성 평가에 활용하도록 하는 것

 

 

2-2. 문제 정의 단계

필요한 데이터/기법을 정의하기 위해 데이터 분석의 문제로의 변환을 수행

 

2-3. 해결 방안 탐색 단계

 

2-4. 타당성 검토 단계

- 경제적 타당성 : 비용 대비 편익 분석 관점의 접근

- 데이터/기술적 타당성 : 데이터 존재 여부, 분석 시스템 환경, 분석 역량 필요. 기술적 타당성 분석 시 역량 확보 방안 사전 수립 필요

[오답 : 데이터 타당성 확보를 위하여 문제 발생 포인트에 대한 데이터 확보가 중요하다]

[오답 : 절차적 타당성]

 

3. 상향식 접근법

- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 모든 문제를 도출하는 방식

 

3-1. 시행착오를 통한 문제 해결

- 프로토타이핑 접근법

  가설 생성 > 디자인에 대한 실험 > 실제 환경에서 테스트 > 테스트 결과에서의 통찰 도출 및 가설 확인

  신속하게 해결책이나 모형을 제시함으로써 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여

  구체화할 수 있게 하는 유용한 상향식 접근 방식

  [오답 : 순환적 문제 탐색]

 

 

 

 

 

제4절. 분석 프로젝트 관리 방안

 

* 분석 과제 관리를 위한 5가지 주요 영역

- Data SIze

- Data Complexity

- Speed

- Analytic Complexity

- Accuracy(활용적 측면) & Precision(안정성 측면)

[오답 : Analytic&Accessibility]

 

 

1. 분석 프로젝트 특성

- 목표 : 분석 정확도를 높이는 것

- 특성 : 분석 프로젝트의 반복적 개선 특징 (도출된 결과 재해석, 지속적 반복, 정교화)

 

 

2. 분석 프로젝트 관리방안

- 분석 프로젝트 영역별 주요 관리 항목 : 범위, 시간, 원가, 품질, 통합, 조달, 자원, 리스트, 의사소통, 이해관계자

[오답 : 프로세스 관리, 가격]

 

 

 

 

 

제2장. 분석 마스터플랜

 

제1절. 마스터플랜 수립 프레임 워크

 

- 분석 마스터 플랜 

  전사차원에서 식별된 다양한 분석 주제 또는 과제를 대상으로 적용의 우선순위를 선정하고, 이를 실행하기 위한 구체적인 일정계획, 단계적 구현 로드맵, 소요 인력, 예산 등의 실행계획을 수립하는 과정이다.

 

1. 분석 마스터 플랜 수립 프레임 워크

1-1. 마스터 플랜 수립 개요

- 우선순위 고려 : 전략적 중요도(시급성), 비즈니스 성과/ROI, 실행 용이성(난이도)

[오답 ★: 데이터 필요 우선순위]

[오답 : 가치는 투자 비용 요소이다.]

[오답 : 속도는 비즈니스 효과이다.]

[오답 : 시급성은 전략적 중요도, 데이터 수집 비용등을 평가하고 난이도는 분석 수준과 복잡도가 평가 요소이다.]

 

1-2. ISP (Information Strategy Planning) : 정보전략계획

기업 및 공공기관에서 시스템의 중장기 로드맵을 정의하기 위해 ISP를 수행

 

 

 

2. 수행과제 도출 및 우선순위 평가

 

2-1. 빅데이터 특징을 고려한 분석 ROI(투자수익) 요소

- 투자 비용 요소 : 데이터 양 (Volume), 다양성 (Variety), 속도 (Velocity) [오답 : Visuality]

- 비즈니스 효과 : 가치 (Value)

 

 

2-2. 분석 과제 우선순위 평가 기준

- 시급성 : 전략적 중요도가 핵심 (가치와 연관)

- 난이도 : 비용, 범위 측면에서 적용 가능한 용이성에 대한 판단 기준 (데이터양, 다양성, 속도와 연관)

 

 

2-3. 분석 과제 우선순위 선정 매트릭스

 

시급성

현재

미래

난이도

Difficult

1

2

Easy

3

4

 

시급성 기준 : 3 > 4 > 2

난이도 기준 : 3 > 1 > 2

 

 

 

 

 

제2절. 분석 거버넌스 체계 수립

 

- 데이터 거버넌스

  전사 차원의 모든 데이터에 대하여 정책/지침, 표준화, 운영조직/책임 등의 표준화된 관리체계를 수립, 운영을 위한 프레임워크 및 저장소를 구축하는 것

 

1. 거버넌스 체계 개요

 

1-1. 거버넌스 체계의 구성 요소

- 조직 (Organization)

- 프로세스 (Process)

- 시스템 (System)

- 데이터 (Data)

- 인력 자원 (Human resource)

[오답 : Data resource]

[오답 :  과제 예산 및 비용 집행]

 

 

1-2. 데이터 분석 수준 진단

- 분석 준비도

1) 분석 업무

   발생한 사실 분석 업무, 예측 분석 업무, 시뮬레이션 분석 업무, 최적화 분석 업무 [오답 : 업무별 적합한 분석 기법] 

 

2) 분석 인력 및 조직

   분석 전문가 직무 존재, 분석전문가 교육훈련 프로그램, 관리자 기본 분석능력, 전사총괄조직, 경영진 분석업무 이해

 

3) 분석 기법

   업무별 적합한 분석기법 사용, 분석 업무 도입 방법론, 분석기법 라이브러리, 분석기법 효과성 평가, 분석기법 정기적 개선

 

4) 분석 데이터

   분석 업무를 위한 데이터 충분성/신뢰성/적시성, 비구조적 데이터 관리, 외부 데이터 활용 체계, 기준 데이터 관리(MDM) [오답 : 내부 데이터 집중 활용 체계]

 

5) 분석 문화

   사실에 근거한 의사결정, 관리자의 데이터 중시, 회의 등에서 데이터 활용, 경영진 직관보다 데이터 활용, 데이터 공유 및 협업 문화

 

6) IT 인프라

   운영 시스템 데이터 통합, EAI, ETL 등 데이터 유통체계, 분석 전용 서버 및 스토리지, 빅데이터 분석 처리 환경, 통계 분석 환경, 비주얼 분석 환경

 

 

- 분석 성숙도 모델 CMMI (Capability Maturity Model Integration)

모델을 기반으로 조직의 성숙도 평가

도입단계 > 활용단계 > 확산단계 > 최적화 단계

소프트웨어와 시스템공학의 역량 성숙도를 측정하기 위한 모델로 소프트웨어 품질 보증과 시스템 엔지니어링 분야의 품질보증 기술을 통합하여 개발된 평가모델로 1~5단계로 구성된 성숙도 모델

 

 

- 분석 수준 진단 결과 ★

 

준비도

낮음

높음

성숙도

높음

정착형

확산형

낮음

준비형

도입형

 

준비형 : 분석을 위한 데이터, 조직 및 인력, 분석업무, 분석기법이 적용되지 않음으로 사전 준비가 필요

정착형 : 우선적으로 분석의 정착이 필요한 기업

도입형 : 분석업무 및 분석기법 부족, 조직 및 인력 등 준비도가 높음

확산형 : 6가지 분석 구성요소 모두 갖춤으로 지속적 확산이 가능한 기업

 

 

1-3. 데이터 거버넌스 체계 수립

- 데이터 거버넌스 구성 요소 : 원칙, 조직, 프로세스

 

- 데이터 거버넌스 체계 요소

1) 데이터 표준화 ★

   데이터 표준 용어 설정, 명명 규칙 수립, 메타데이터 구축, 데이터 사전 구축 업무

 

2) 데이터 관리체계

   표준(메타) 데이터와 데이터 사전 관리 원칙 수립

 

3) 데이터 저장소 관리★

  메타데이터 및 표준데이터 관리를 위한 전사 차원의 저장소 구성

   워크플로우, 관리용 응용 소프트웨어 지원, 관리 대상 시스템과의 I/F 통한 통제 필요

   데이터 구조 변경에 따른 사전 영향 평가 수행

 

4) 표준화 활동

   데이터 거버넌스 체계를 구축한 후 표준 준수 여부를 주기적으로 점검하고 모니터링

 

* 메타데이터 : 데이터에 관한 구조화된 데이터로 다른 데이터를 설명해주는 데이터

 

 

1-4. 데이터 조직 및 인력 방안 수립

- 데이터 분석 조직구조

 

1) 집중 구조

   별도의 독립적인 분석 전담 조직 구성

 

2) 기능 구조

   별도 분석 조직이 없고 해당 업무 부서에서 분석 수행

 

3) 분산 구조

   분석 조직 인력을 현업부서로 직접 배치해 분석 업무 수행

 

[오답 : 복합 구조]

 

 

1-5. 분석 과제 관리 프로세스 수립

- 과제 발굴 : 분석 아이디어 발굴 > 분석 과제 후보 제안 > 분석 과제 확정

- 과제 수행 모니터링 : 팀 구성 > 분석 과제 실행 > 지속적인 모니터링, 과제 결과 공유 및 개선

 

 

 

반응형