목록전체 글 (42)
편안한집
ADsP - 전략 인사이트 도출을 위한 필요 역량 데이터 사이언스 의미와 역할 데이터 사이언스 의미데이터로부터 의미있는 정보를 추출해 내는 학문, 분석 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적인 개념이다. 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식,등 해당분야의 전문 지식을 종합한 학문이다. 중요한 역량중 하나로 소통이 있다. 데이터 사이언스 대상통계학 :정형화된 실험 데이터 데이터 사이언스 : 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영상정보, 여러곳에서 생성되는 숫자와 문자 등 다양한 유형의 데이터 총체적 접근법통계학이 정형화된 실험데이터를 분석 대상으로 하는 것에 비해 데이터 사이언스는 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 영..
ADsP - 빅데이터 분석과 전략 인사이트, 빅데이터와 데이터 사이언스의 미래 빅데이터의 가치 산정이 어려운 이유 ① 빅데이터 열풍과 회의론 1. ‘고객관계관리(CRM)’를 통해 경험한 부정적 학습효과이다. CRM을 비롯한 IT 솔루션은 일종의 공포 마케팅이 잘 통하는 영역이다. 그래서 거액을 투자해 하드웨어 박스와 솔루션을 도입하지만 막상 도입하면 상황이 달라진다. 결국 관련 장비와 솔루션은 수십, 수백억원을 투자하고 방치하는 사태가 벌어진다. 2. 현재 소개되는 많은 빅데이터 성공사례가 사실 기존의 분석 프로젝트를 포장해 놓은게 많다. 과대포장들은 빅데이터 분석 전체의 신뢰성에 의심을 만들고 빅데이터 분석이 자리잡기도 전에 기반을 흔들어 놓을 수 있다. ② 빅데이터 분석, ‘big’이 핵심이 아니다...
ADsP - 빅데이터의 활용, 위기요인 빅데이터의 활용 기본 테크닉 7가지 1. 연관규칙 : 어떤 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법EX) 우유구매자는 기저귀를 더 많이 구매하는가? 2. 유형분석 : 문서를 분류하거나 조직을 그룹으로 나눌 때, 특성에 따라 분류할 때 사용한다.EX) 이 사용자는 어떤 특성을 가진 집단에 속하는가? 3. 유전 알고리즘 : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법.EX) 최대의 실험 성과를 낼려면 언제부터 언제까지 몇일동안 실험해야 하는가? 4. 기계학습 : 훈련 데이터로부터 학습한 알려진 특성을 활용하여 ‘예측’하는 일에 초점을 둔다.EX) 기존의 시청 기록을 바탕으로 시청자가 현..