편안한집

ADsP (2-1) - 데이터분석 기획의 이해 본문

ADsP/ADsP - 2

ADsP (2-1) - 데이터분석 기획의 이해

yng and rich 2020. 11. 5. 11:43

ADsP - 데이터분석 기획의 이해

 



데이터 분석 기획

실제 분석에 앞서 수행할 과제의 정의 및 의도했던 결과를 분석으로 이끌어낼 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 작업이다.

 

 

데이터 분석 기획 역량

분석 역량으로는 문제영역에 대한 전문석 역량 및 수학/통계학적 지식을 활용하고 균형 잡힌 시각으로 분석의 도구인 데이터 및 프로그래밍 기술 역량을 통해 방향성 및 계획을 수립하고 분석을 기획 한다.

 

 

분석 주제 유형

 

분석의 대상

분석의

방법

 

Known

Un-Known

Known

최적화

통찰

Un-Known

솔루션

발견

 

 

당면한 분석 주제의 해결과 지속적인 분석 문화 내재화

당면한 분석 주제의 해결 (과제 단위) : 속도와 검사, 즉각적인 실행을 통한 성과 도출, 문제 해결 - 목표시점별로 당면한 과제를 빠르게 해결하는 것

 

지속적인 분석 문화 내재화 (마스터 플랜 단위) : 정확도와 전개, 장기적인 관점, 문제의 정의 - 지속적인 분석을 내재화 하는 것

 

 

분석 기획 시 고려사항

가용한 데이터

분석의 기본이 되는 데이터에 대한 고려가 필요하며 데이터 확보가 필수적이다. 적용 가능한 솔루션 및 분석 방법이 다르기 때문에 데이터 유형에 따라 유형에 대한 분석이 선행적으로 이루어져야한다.

 

1. 정형데이터 : 형태가 있으며 연산이 가능하다. 주로 관계형 데이터베이스에 저장이 되며 데이터 수집 난이도가 낮다. 내부 시스템인 경우가 대부분이고 파일 형태의 스트레드시트라도 내부에 형식을 가지고 있어 처리가 쉽다. 예로는 관계형 데이터베이스. 스프레드시트. csv 등 있다.

 

2. 반정형데이터 : 형태(스카마, 메타데이터)가 있으나 연산이 불가능하다. 주로 파일에 저장이되며 데이터 수집 난이도는 중간이다. 보통 API 형태로 제공되기 때문에 테이터 처리 기술이 요구된다. 예로는 XML,HTML, 로그형태, machine data 등이 있다.

 

3. 비정형데이터 : 형태가 없으며 연산이 불가능 하다. 주로 NOSQL에 저장이되며 데이터 수집 난이도가 높다. 덱스트 마이닝 혹은 파일일 경우 파일을 데이터 형태로 파싱해야 하기 때문에 수집 데이터 처리가 어렵다. 예로는 소셜데이터(트위터, 페이스북), e-mail, 보고서 등이 있다.



적절한 유스케이스

분석을 통해서 가치가 창출될 수 있는 적절한 활용 방안과 활용 가능한  유스케이스의 탐색이 필요하다. 또한 기존에 잘 구형 되어서 활용되고 있는 유사 분석 시나리오 및 솔루션이 있다면 최대한 활용하는 것이 중요하다.

 


분석과제 수행을 위한 장애요소

분석을 수행함에 있어서 장애요소들에 대한 사전 계획 수립이 피요하며 사용자가 쉽게 이해하고 활용할 수 있도록 방안을 수립해야 한다. 분석 수행 시 일어나는 문제에 대한 고려가 필요하다.


'ADsP > ADsP - 2' 카테고리의 다른 글

ADsP (2-3) - 분석 과제 발굴  (0) 2020.11.08
ADsP (2-2) - 분석방법론  (0) 2020.11.07
Comments