목록ADsP/ADsP - 1 (7)
편안한집
ADsP - 전략 인사이트 도출을 위한 필요 역량 데이터 사이언스 의미와 역할 데이터 사이언스 의미데이터로부터 의미있는 정보를 추출해 내는 학문, 분석 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적인 개념이다. 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식,등 해당분야의 전문 지식을 종합한 학문이다. 중요한 역량중 하나로 소통이 있다. 데이터 사이언스 대상통계학 :정형화된 실험 데이터 데이터 사이언스 : 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영상정보, 여러곳에서 생성되는 숫자와 문자 등 다양한 유형의 데이터 총체적 접근법통계학이 정형화된 실험데이터를 분석 대상으로 하는 것에 비해 데이터 사이언스는 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영..
ADsP - 빅데이터 분석과 전략 인사이트, 빅데이터와 데이터 사이언스의 미래 빅데이터의 가치 산정이 어려운 이유 ① 빅데이터 열풍과 회의론 1. ‘고객관계관리(CRM)’를 통해 경험한 부정적 학습효과이다. CRM을 비롯한 IT 솔루션은 일종의 공포 마케팅이 잘 통하는 영역이다. 그래서 거액을 투자해 하드웨어 박스와 솔루션을 도입하지만 막상 도입하면 상황이 달라진다. 결국 관련 장비와 솔루션은 수십, 수백억원을 투자하고 방치하는 사태가 벌어진다. 2. 현재 소개되는 많은 빅데이터 성공사례가 사실 기존의 분석 프로젝트를 포장해 놓은게 많다. 과대포장들은 빅데이터 분석 전체의 신뢰성에 의심을 만들고 빅데이터 분석이 자리잡기도 전에 기반을 흔들어 놓을 수 있다. ② 빅데이터 분석, ‘big’이 핵심이 아니다...
ADsP - 빅데이터의 활용, 위기요인 빅데이터의 활용 기본 테크닉 7가지 1. 연관규칙 : 어떤 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법EX) 우유구매자는 기저귀를 더 많이 구매하는가? 2. 유형분석 : 문서를 분류하거나 조직을 그룹으로 나눌 때, 특성에 따라 분류할 때 사용한다.EX) 이 사용자는 어떤 특성을 가진 집단에 속하는가? 3. 유전 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법.EX) 최대의 실험 성과를 낼려면 언제부터 언제까지 몇일동안 실험해야 하는가? 4. 기계학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용하여 ‘예측’하는 일에 초점을 둔다.EX) 기존의 시청 기록을 바탕으로 시청자가 현..
ADsP - 빅데이터의 이해, 가치, 영향 빅데이터의 정의‘큰 데이터’ 단순히 용량만 큰 것이 아니라 복잡성도 증가하여 기존의 관리 툴(tool)로는 다루기 어려운 데이터세트의(collection of data sets) 집합을 뜻한다. 빅데이터의 특성 - 가트너그룹의 더그래니의 3V01. Volumer (규모) : 데이터의 규모02. Variety (댜양성) : 데이터의 유형과 소스03. Velocity (속도) : 데이터의 수집과 처리 측면 빅데이터의 출현 배경1. 산업계 - 고객 데이터 축적2. 학계 - 거대 데이터 활용 과학 확산3. 관련 기술 발전 - 디지털화, 저장기술, 인터넷 보급, 모바일 혁명 등 빅데이터의 기능1. 산업혁명의 석탄, 철에 비유 ㄴ 농업 중심의 1차산업에서 2차산업시대로 변..
ADsP - 데이터베이스의 활용 기업내부의 데이터베이스정보통신망 구축이 가속죙면서 1990년대 기업 내부 데이터베이스는 기업경영 전반에 관한 인사, 조직, 생산, 영업 활동을 포함한 모든 자료를 연계하여 일관된 체계로 구축, 운영하는 경영활동의 기반이 되는, 모든 회사의 자원을 합하여 관리하는 시스템인 전사 시스템으로 확되되었다. 아래에 나오는 정확한 용어와 뜻을 정확하게 암기해야 합니다.[Tip 한번에 다 암기하는 것 보단 자주 보는 것으로 정확한 느낌을 하는 것이 중요합니다.] ① OLTPOn Line Transaction Processing의 약어로 온라인 거래 처리이다. 다양한 과정의 연산이 하나의 단위 프로세스로 실행되되도록하는 단순 자동화에 치우쳐 있는 시스템으로 ‘운영자’가 ‘업무 처리 기반..
ADsP - 데이터베이스의 정의와 특징 데이터베이스의 정의 데이터베이의 정의는 여러 가지가 있지만 컴퓨터 용어사전으로써의 정의는 ‘동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합’이다. 데이터베이스의 특징 ① 통합된 데이터 : 동일한 내용의 데이터가 중복되어있지 않다. 데이터의 중복은 관리상의 복잡한 부작용을 초래한다. ② 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미한다. ③ 고용 데이터 : 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용 가능하다. ④ 변화된 데이터 : 새로운 데이터가 추가되고 기존의 데이터는 삭제돼 항상 변화하면서도 현재..
ADsP - 데이터와 정보 데이터의 정의 데이터는 ‘객관적 사실’이라는 존재적 특성을 갖는 동시에 ‘추론, 예측, 전망, 추정을 위한 근거’로 기능하는 당위적 특성 또한 갖고 있다. 데이터의 유형1. 정성적 데이터 : 언어, 문자의 형태로 비정형데이터와 같이 형태와 형식이 정해져 있지 않아 검색, 저장, 분석 비용, 시간, 기술적 투자가 필요하다 2. 정량적 데이터 : 도형, 기호, 수치의 형태로 명확하게 표현되어 데이터의 양이 크게 증가해도 검색, 저장, 분석 활용이 용이하다. [Tip. 객관식으로 많이 출제, 정성적 데이터와 정량적 데이터의 형태를 물어보는 문제가 많이 출제됨] 암묵지와 형식지 암묵지 : 학습과 체험을 통해 개인이 습득한 지식, 무형의 지식ㄴ 특징 : 개인이 습득한 지식으로 다른 사람..