목록ADsP (10)
편안한집
ADsP - 분석 과제 발굴 분석 과제 발굴하양식 접근 방식문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화 되어 수행하는 방식이다. 1. 문제 탐색 단계 : 분석과제 발굴 시 비즈니스 모델 캔버스를 활용하는 주요 영역이다. 업무, 제품, 고객, 규제와 감사, 지원 인프라가 이에 해당한다. STEEP : 사화(Social), 기술(Technological), 경제(Economic), 환경(Environmental), 정치(Political) 영역이다. 거시적 관점에서 메타 트렌드에서 현재의 조직 및 해당 산업에 폭넓게 영향을 미치는 사회,경제적 요인을 요약한 것이다.시장의 니즈 탐색 관점 : 고객 영역, 채널 영역, 영향자들 영역 2. 문제 정의 : 식별된 비즈니스 문제를 데이터..
ADsP - 분석방법론 분석 방법론의 모델폭포수 모델 : 단계를 순차적으로 진행하는 방법이다. 이전 단계가 완료되어야 다음 단계로 진행될 수 있다. 문제나 개선사항이 발견되면 전 단계로 돌아가는 피드백 과정이 수행되기도 한다. +애자일 방법론 : 폭포수 모델과 반대되는 개념. 끊임없이 개발하고 수정하는 일을 반복하면서 고객이 가장 만족할 수 있는 방향으로 소프트웨어를 개발하는 방법론이다. 주기적으로 제작 프로토타입을 시험해보는 철저한 관리를 통한 개발 방법론이다. 프로토타입 모델 : 폭포수 모델의 단점을 보완하기 위한 모델로서 정보시스템의 미완성 버전 또는 중요한 기능들이 포함되어 있는 시스템의 초기 모델이다. 나선형 모델 : 여러 번의 개발과정을 거쳐 점진적으로 프로젝트를 완성시켜가는 모델이다. 처음 ..
ADsP - 데이터분석 기획의 이해 데이터 분석 기획실제 분석에 앞서 수행할 과제의 정의 및 의도했던 결과를 분석으로 이끌어낼 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 작업이다. 데이터 분석 기획 역량분석 역량으로는 문제영역에 대한 전문석 역량 및 수학/통계학적 지식을 활용하고 균형 잡힌 시각으로 분석의 도구인 데이터 및 프로그래밍 기술 역량을 통해 방향성 및 계획을 수립하고 분석을 기획 한다. 분석 주제 유형 분석의 대상분석의 방법 KnownUn-KnownKnown최적화통찰Un-Known솔루션발견 당면한 분석 주제의 해결과 지속적인 분석 문화 내재화당면한 분석 주제의 해결 (과제 단위) : 속도와 검사, 즉각적인 실행을 통한 성과 도출, 문제 해결 - 목표시점별로 당면한 과제를 ..
ADsP - 전략 인사이트 도출을 위한 필요 역량 데이터 사이언스 의미와 역할 데이터 사이언스 의미데이터로부터 의미있는 정보를 추출해 내는 학문, 분석 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적인 개념이다. 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식,등 해당분야의 전문 지식을 종합한 학문이다. 중요한 역량중 하나로 소통이 있다. 데이터 사이언스 대상통계학 :정형화된 실험 데이터 데이터 사이언스 : 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영상정보, 여러곳에서 생성되는 숫자와 문자 등 다양한 유형의 데이터 총체적 접근법통계학이 정형화된 실험데이터를 분석 대상으로 하는 것에 비해 데이터 사이언스는 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영..
ADsP - 빅데이터 분석과 전략 인사이트, 빅데이터와 데이터 사이언스의 미래 빅데이터의 가치 산정이 어려운 이유 ① 빅데이터 열풍과 회의론 1. ‘고객관계관리(CRM)’를 통해 경험한 부정적 학습효과이다. CRM을 비롯한 IT 솔루션은 일종의 공포 마케팅이 잘 통하는 영역이다. 그래서 거액을 투자해 하드웨어 박스와 솔루션을 도입하지만 막상 도입하면 상황이 달라진다. 결국 관련 장비와 솔루션은 수십, 수백억원을 투자하고 방치하는 사태가 벌어진다. 2. 현재 소개되는 많은 빅데이터 성공사례가 사실 기존의 분석 프로젝트를 포장해 놓은게 많다. 과대포장들은 빅데이터 분석 전체의 신뢰성에 의심을 만들고 빅데이터 분석이 자리잡기도 전에 기반을 흔들어 놓을 수 있다. ② 빅데이터 분석, ‘big’이 핵심이 아니다...
ADsP - 빅데이터의 활용, 위기요인 빅데이터의 활용 기본 테크닉 7가지 1. 연관규칙 : 어떤 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법EX) 우유구매자는 기저귀를 더 많이 구매하는가? 2. 유형분석 : 문서를 분류하거나 조직을 그룹으로 나눌 때, 특성에 따라 분류할 때 사용한다.EX) 이 사용자는 어떤 특성을 가진 집단에 속하는가? 3. 유전 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법.EX) 최대의 실험 성과를 낼려면 언제부터 언제까지 몇일동안 실험해야 하는가? 4. 기계학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용하여 ‘예측’하는 일에 초점을 둔다.EX) 기존의 시청 기록을 바탕으로 시청자가 현..
ADsP - 빅데이터의 이해, 가치, 영향 빅데이터의 정의‘큰 데이터’ 단순히 용량만 큰 것이 아니라 복잡성도 증가하여 기존의 관리 툴(tool)로는 다루기 어려운 데이터세트의(collection of data sets) 집합을 뜻한다. 빅데이터의 특성 - 가트너그룹의 더그래니의 3V01. Volumer (규모) : 데이터의 규모02. Variety (댜양성) : 데이터의 유형과 소스03. Velocity (속도) : 데이터의 수집과 처리 측면 빅데이터의 출현 배경1. 산업계 - 고객 데이터 축적2. 학계 - 거대 데이터 활용 과학 확산3. 관련 기술 발전 - 디지털화, 저장기술, 인터넷 보급, 모바일 혁명 등 빅데이터의 기능1. 산업혁명의 석탄, 철에 비유 ㄴ 농업 중심의 1차산업에서 2차산업시대로 변..
ADsP - 데이터베이스의 활용 기업내부의 데이터베이스정보통신망 구축이 가속죙면서 1990년대 기업 내부 데이터베이스는 기업경영 전반에 관한 인사, 조직, 생산, 영업 활동을 포함한 모든 자료를 연계하여 일관된 체계로 구축, 운영하는 경영활동의 기반이 되는, 모든 회사의 자원을 합하여 관리하는 시스템인 전사 시스템으로 확되되었다. 아래에 나오는 정확한 용어와 뜻을 정확하게 암기해야 합니다.[Tip 한번에 다 암기하는 것 보단 자주 보는 것으로 정확한 느낌을 하는 것이 중요합니다.] ① OLTPOn Line Transaction Processing의 약어로 온라인 거래 처리이다. 다양한 과정의 연산이 하나의 단위 프로세스로 실행되되도록하는 단순 자동화에 치우쳐 있는 시스템으로 ‘운영자’가 ‘업무 처리 기반..
ADsP - 데이터베이스의 정의와 특징 데이터베이스의 정의 데이터베이의 정의는 여러 가지가 있지만 컴퓨터 용어사전으로써의 정의는 ‘동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합’이다. 데이터베이스의 특징 ① 통합된 데이터 : 동일한 내용의 데이터가 중복되어있지 않다. 데이터의 중복은 관리상의 복잡한 부작용을 초래한다. ② 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미한다. ③ 고용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용 가능하다. ④ 변화된 데이터 : 새로운 데이터가 추가되고 기존의 데이터는 삭제돼 항상 변화하면서도 현재..
ADsP - 데이터와 정보 데이터의 정의 데이터는 ‘객관적 사실’이라는 존재적 특성을 갖는 동시에 ‘추론, 예측, 전망, 추정을 위한 근거’로 기능하는 당위적 특성 또한 갖고 있다. 데이터의 유형1. 정성적 데이터 : 언어, 문자의 형태로 비정형데이터와 같이 형태와 형식이 정해져 있지 않아 검색, 저장, 분석 비용, 시간, 기술적 투자가 필요하다 2. 정량적 데이터 : 도형, 기호, 수치의 형태로 명확하게 표현되어 데이터의 양이 크게 증가해도 검색, 저장, 분석 활용이 용이하다. [Tip. 객관식으로 많이 출제, 정성적 데이터와 정량적 데이터의 형태를 물어보는 문제가 많이 출제됨] 암묵지와 형식지 암묵지 : 학습과 체험을 통해 개인이 습득한 지식, 무형의 지식ㄴ 특징 : 개인이 습득한 지식으로 다른 사람..