과목명 | 내용 구분 | 주요내용 | 세부내용 |
---|---|---|---|
데이터 이해 | 데이터의 이해 | 데이터와 정보 | 1. 데이터의 정의 2. 데이터의 유형 1) 정성적 데이터 - 언어, 문자 등(비정형 데이터, 요약, 주관적 결론 등) 2) 정량적 데이터 - 수치, 도형, 기호, 그림 등(정형데이터, 통계분석, 객관적 결론 등) 3. 지식경영 핵심 이슈 1) 데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용 역할을 한다 (1) 암묵지 (2) 형식지 2) 지식경영(지식전환 모드) (1) 공통화 - 표출화 - 연결화 - 내면화 4. 데이터와 정보의 관계 1) DIKW 피라미드 (1) Data - 가공 전의 순수한 수치나 기호 (2) Information - 데이터의 가공 및 상관관계(연관관계) 속에서 의미가 도출됨 (3) Knowledge - 상호 연결된 정보 패턴을 이해한 토대로 예측한 결과 (4) Wisdom - 원리에 대한 이해를 바탕으로 도출된 아이디어 |
데이터베이스의 정의와 특징 | 1. 용어와 연혁 2. 데이터베이스 정의 1) 데이터베이스와 DBMS는 구분됨 (1) 데이터베이스 (2) 데이터베이스의 소프트웨어: DBMS 2) 데이터베이스+DBMS=데이터베이스시스템이라 칭함 3. 데이터베이스 특징 1) 통합된 데이터 2) 저장된 데이터 3) 공용 데이터 4) 변화되는 데이터 4. 데이터베이스 특성 1) 정보의 축적 및 전달 측면 2) 정보이용 측면 3) 정보관리 측면 4) 정보기술발전 측면 5) 경제/산업적 측면 |
||
데이터베이스 활용 | 1. 기업 내부 데이터베이스 1-1. 1980년대 1) OLTP(On-line Transaction Processing) 온라인 거래처리 (1) 하나의 과정, 하나의 프로세스 실행 (2) 진행중인 비즈니스 프로세스 2) OLAP(On-line Analytical Processing) 온라인 분석처리 (1) 통계적 요약 정보 제공 (2) 모든 유형의 비즈니스 활동을 다차원적으로 보여줌 1-2. 2000년대 1) CRM(Customer Relationship Managment) 2) SCM(Supply Chain Management) 2. 분야별 기업 내부 데이터베이스 1) 제조부문 (1) DW (2) ERP(Enterprise Resource Planning) (3) BI (4) CRM(Customer Relationship Management) 2) 금융부문 (1) EAI(Enterprise Architecture Integration) - ERP(전사적 자원관리), CRM(고객관계관리), SCM(공급망계획), 인트라넷 등 상호연동 통합 솔루션 (2) EDW (3) Blockchain (4) ERP, e-CRM 등 3) 유통부문 (1) KMS(Knowledge Management System) (2) RFID (3) CRM, SCM 3. 사회기반 구조로서의 데이터베이스 1) BI(Business Intelligence) (1) 과거 성과 측정, 향후 비스니스 계획 (2) 데이터 기반 의사결정 2) BA(Business Analuitics) (1) 데이터와 통계를 기반으로 성과 이해 및 비즈니스 통찰력에 초점 (2) 사전 예측, 최적화를 위함 (3) BI보다 진보한 형태 4. 분야별 사회기반 구조로서의 데이터베이스 1) 물류부분 (1) 종합물류정보망 (2) 부가가치통신망(VAN, Value Added Network) 2) 지리부문 (1) 국가지리정보체계(NGIS) (2) RS (3) GPS 3) 교통부문 (1) 지능형교통시스템(ITS) 4) 의료부문 (1) 의료 EDI 5) 교육부문 (1) 교육행정정보시스템(NEIS) |
||
데이터의 가치와 미래 | 빅데이터의 이해 | 1. 빅데이터의 정의 1) 데이터 크기 관점 - 범위를 초과하는 규모의 데이터 2) 데이터 분석 관점 - 저렴한 비용으로 가치를 추출, 초고속 수집/발굴/분석 고안된 기술 3) 데이터 가치 관점 - 작은 용량에서 얻을 수 없던 새로운 통찰이나 가치 추출 * 가트너 그룹 더그래니의 빅데이터 정의: Volume(크기/양), Variety(다양성), Velocity(속도) 2. 출현 배경 1) 산업계: 산업계의 다량의 고객데이터 보유(데이터 크기: 메가-기가-테라-페타-엑사-제타-요타바이트) 2) 학계: 거대 데이터 활용 과학 확산(인간 게놈 프로젝트) 3) 관련 기술 발전: 디지털화, 저장 기술, 인터넷 보급, 모바일 혁명, 클라우드 컴퓨팅(디지털 데이터의 양 기하급수적 증가) 3. 빅데이터 기능 1) 산업혁명의 석탄, 철에 비유 - 생산성 향상으로 혁명적 변화를 가져옴 2) 원유에 비유 - 각종 산업분야의 필요한 정보를 제공함으로 산업 전반의 생산성을 한 단계 향상 3) 렌즈에 비유 - 현미경이 생물학 발전에 미친 영향 만큼 산업 전반에 영향 4) 플랫폼에 비유 - 공동 활용의 목적으로 구축된 유무형의 구조물 4. 빅데이터가 만들어내는 본질적인 변화 1) 사전처리→사후처리 2) 표본조사→전수조사 3) 질→양 4) 인과관계→상관관계 |
|
빅데이터의 가치와 영향 | 1. 빅데이터의 가치 1) 빅데이터의 가치 선정이 어려운 이유 (1) 데이터의 활용 방식 (2) 새로운 가치 창출 (3) 분석 기술의 발달 2. 빅데이터의 영향 - 생활 전반의 스마트화 1) 기업: 혁신, 경쟁력 제고, 생산성 향상 2) 정부: 환경탐색, 상황분석, 미래대응 3) 개인: 목적에 따라 활용 * 맥킨지의 빅데이터 보고서(2011) '빅데이터 가치를 만들어내는 5가지 방식' (1) 투명성 제고로 연구개발 및 관리 효율성 제고 (2) 시뮬레이션을 통한 수요 포착 및 주요 변수 탐색으로 경쟁력 강화 (3) 고객 세분화 및 맞춤 서비스 제공 (4) 알고리즘을 활용한 의사결정 보조 혹은 대체 (5) 비즈니스 모델과 제품, 서비스의 혁신 |
||
비즈니스 모델 | 1. 빅데이터 활용 사례 1) (검색로그, 패턴분석 등) 구글의 검색엔진, 월마트의 구매패턴 분석, IBM 왓슨 의료 분야에 활용 2) (국가적 활용) 정부의 실시간 교통정보 활용, CCTV 국가안전에 활용 3) (SNS, 음악청취 기록) 정치인의 사회관계망분석을 통한 유세, 가수의 팬 음악청취 기록 분석 활용 등 4) (창조활동) 아마존 킨들 읽기 관련 데이터 분석 후 저자들에게 제공 2. 빅데이터 활용 테크닉 1) 연관규칙학습: 변수간 상관관계(슈퍼마켓에서 상관관계가 높은 상품 함께 진열) 2) 유형분석: 특성에 따라 집단 분류 3) 유전 알고리즘: 문제 해결용, 최적화 메커니즘 찾는 방법(시청률을 위한 편성) 4) 기계학습: 학습한 특성을 통한 예측(넷플릭스 추천 알고리즘) 5) 회귀분석: 구매자의 나이가 차량의 타입에 어떤 영향을 미치는가?와 같은 질문의 답을 위함 6) 감정분석: 소셜미디어에 나타는 의견을 바탕으로 니즈 파악 7) SNA(Social network analysis) 사회관계망 분석: 영향력 있는 사람을 찾으면 고객간 소셜 관계 파악 |
||
위기 요인과 통제 방안 | 1. 위기 요인 및 통제 방안 1) 사생활 침해 - 동의에서 책임으로, 익명화 2) 책임 원칙 훼손(예측 알고리즘의 희생양 가능성 증가) - 기존 책임 원칙 강화 3) 데이터의 오용(잘못된 인사이트로 손실 발생) - 데이터 알고리즘 접근권 허용 및 객관적 인증 방안 도입 |
||
미래의 빅데이터 | 1. 빅데이터 활용 3요소 1) 데이터 2) 기술 3) 인력 |
||
가치 창조를 위한 데이터 사이언스와 전략 인사이트 | 빅데이터 분석과 전략 인사이트 | 1. 빅데이터 분석과 전략 인사이트 1) 빅데이터 열풍과 회의론 2) 왜 싸이월드는 페이스북이 되지 못했나? - 데이터 분석 기반 비즈니스 없었음 3) 빅데이터 분석, BIG이 핵심이 아니다. - 데이터의 양보다 유형의 다양성이 핵심 4) 전략적 통찰이 없는 분석의 함정: 쓸모없는 결과 발생 가능성 높음 * 성과가 우수한 기업들도 가치 분석적 통찰력을 갖추기 힘듬(데이터 분석 내재화 어려움) 5) 일차적인 분석 vs 전략 도출을 위한 가치 기반 분석 (1) 가치 기반 분석을 위해서 - 인구통계학적 변화, 경제사회 트렌드, 고객 니즈의 변화 등을 고려 (2) 대표적인 일차적인 분석 사례 (2)-1 금융서비스: 신용점수 산정, 사기 탐지, 고객 수익성 분석 (2)-2 소매업: 재고 보충, 수요예측 (2)-3 제조업: 맞춤형 상품 개발, 신상품 개발 (2)-4 에너지: 트레이딩, 공급, 수요예측 (2)-5 온라인: 웹 매트릭스, 사이트 설계, 고객 추천 |
|
전략 인사이트 도출을 위한 필요 역량 | 1. 데이터 사이언스 의미와 역할 1) 데이터 사이언스와 통계학의 차이점: 총체적 접근법을 사용함. 2. 데이터 사이언스의 3대 구성 요소 1) IT(Data Management) 2) 분석(Analytics) 3) 비즈니스 분석(비즈니스 컨설팅) 3. 데이터 사이언티스트의 역량 1) Hard skill (1) 빅데이터에 대한 이론적 지식: 관련 기법 이해와 방법론 습득 (2) 분석 기술에 대한 숙련: 최적의 분석 설계 및 노하우 2) Soft skill (1) 통찰력: 창의적 사로, 호기심, 논리적 비판 (2) 설득력: 스토리텔링, Visualization (2) 다분야 간 협력: Communication 3) 가트너가 본 데이터 사이언티스트의 역량 (1) 데이터 관리 - 데이터 사이언스 3대 구성요소 (2) 분석 모델링 - 데이터 사이언스 3대 구성요소 (3) 비즈니스 분석 - 데이터 사이언스 3대 구성요소 (4) 소프트 스킬 - 데이터 사이언티스트 역량 4. 데이터 사이언스 1) 과학과 인문학의 교차로 - 소프트 스킬은 대부분 인문학의 주요 주제 5. 전략적 통찰력과 인문학의 부활 1) 최근 사회경제적 환경의 변화 (1) 단순 세계화 - 복잡한 세계화 : 다양성과 각 사회의 정체성과 맥락, 관계, 연결성, 창조성 등이 키워드 (2) 비즈니스의 중심의 변화: 제품 생산 - 서비스 (3) 경제와 산업의 논리: 생산 - 시장 창조(새로운 현지화 패러다임에 근거) 6. 데이터 사이언티스트에 요구되는 인문학적 사고의 특성과 역할 7. 데이터 분석 모델링에서 인문학적 통찰역의 적용 사례 1) 인간을 바라보는 유형별 3가지 관점 (1) 선천적 성향 (2) 행동적 관점 (3) 상황적 관점(반복 행동 확률) |
||
빅데이터 그리고 데이터 사이언스의 미래 | 1. 빅데이터의 시대 2. 빅데이터 회의론을 넘어: 가치 패러다임의 변화 1) 디지털화 2) 연결 - 사람 기기 다양한 연결성. 사물인터넷의 성숙 3) 에이전시(Agency) - 복잡한 연결을 얼마나 효과적으로 믿을 만하게 관리해주는가? 3. 데이터 사이언스의 한계와 인문학 1) 명심할 것은 모든 분석은 가정에 근거한다는 사실이다. - 2008년 전후의 글로벌 금융위기는 잘못된 분석이 가져오는 엄청난 결과를 보여줬다. - 따라서, 모델의 능력에 대해 항상 의구심을 갖고 가정과 현실의 불일치에 대한 고찰, 예측 불가 위험을 항상 주시 |
||
데이터 분석 기획 | 데이터 분석 기획의 이해 | 분석 기획 방향성 도출 | 1. 분석 기획의 특징 1) 분석 주제 유형 (1) 최적화(Optimization) (2) 솔루션(Solution) (3) 통찰(Insight) (4) 발견(Discovery) 2) 목표 시점별 분석 기획 방안 (1) 과제 중심적 접근 방식: Quick-win(즉각적 실행을 통한 성과 도출) (2) 장기적 마스터플랜 방식: Long Term View(분석 문화 내재화) *위 둘을 융합적으로 적용하는 것이 바람직 2. 분석 기획시 고려사항 1) 가용한 데이터 - 정형? 비정형? 반정형? 2) 유스케이스(Use-Case) 탐색 : 유사 분석 시나리오 및 솔루션 활용 3) 장애 요소에 대한 사전 계획 수립: 정확도를 늘리기 위해 기간과 리소스가 늘어 - 비용 상승으로 연결 - 사전 고려 필요 |
분석 방법론 | 1. 분석 방법론 개요 2. KDD 분석 방법론 1) 데이터 베이스에서 의미있는 지식을 탐색하는 데이터 마이닝, 기계 학습, 인공지능, 데이터시각화 등에서 응용 2) KDD 분석 절차 (1) 분석 대상의 비즈니스 도메인에 대한 이해와 프로젝트 목표 정확하게 설정 (2) 데이터셋 선택 (3) 데이터 전처리: 잡음, 이상값, 결측치를 식별하고 필요시 제거 (4) 데이터 변환(데이터셋 변경): 변수 선택, 데이터 차원 축소 (5) 데이터 마이닝: 알고리즘 선택, 데이터 패턴 찾기, 데이터 분류 또는 예측의 마이닝 작업 (6) 데이터 마이닝 결과평가: 결과에 대한 해석 평가 그리고 활용 3. CRISP-DM 분석 방법론 1) 계층적 프로세스 모델, 4개의 레벨로 구성됨 2) CRISP-DM 분석 절차 (1) 업무 이해: 업무 목적 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립 (2) 데이터 이해: 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인 (3) 데이터 준비: 분석용 데이터셋 선택, 데이터 정제, 데이터 통합, 데이터 포맷팅 (4) 모델링: 찾아낸 모델은 테스트 평가하여 모델 과적합(Overfitting)*등의 문제 발견, 대응 마련 * 모델 과적합(Overfitting): 너무 많은 것을 학습해서 불필요한 것 까지 학습하는 현상 (5) 평가: 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가 (6) 전개: 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰 4. KDD와 CRISP-DM 비교 1) 분석 대상 비즈니스 이해 - 업무 이해 2) 데이터셋 선책, 데이터 전처리 - 데이터 이해 3) 데이터 변환 - 데이터 준비 4) 데이터 마이닝 - 모델링 5) 데이터 마이닝 결과 평가 - 평가 6) 데이터 마이밍 활용 - 전개 5. 빅데이터 분석 방법론 1) 분석 기획 - *데이터 준비 - *데이터 분석 - 시스템 구현 - 평가 및 전개 * 데이터 준비 - 데이터 분석 - 추가 데이터 필요 - 데이터 준비 - 데이터 분석 6. 분석 기뢱 1) 비즈니스 이해 및 범위 설정 2) 프로젝트 정의 및 계획 수립 (1) 데이터 분석 프로젝트 정의: KPI(핵심성과지표), 목표수준 구체화 - 상세 프로젝트 정의서 작성, 평가기준 설정 (2) 프로젝트 수행 계획 수립: 프로젝트 수행 계획서 작성 - *WBS작성 *WBS: 전체 업무를 분류하여 구성 요소를 만든 후 각 요소를 평가하고 일정별로 계획하며 그것을 완수할 수 있는 사람에서 할당해주는 역할 (=업무분장) (3) 프로젝트 위험 계획 수립 7. 데이터 준비 1) 필요 데이터 정의 (1) 데이터 정의: (예시: 메타데이터, ERD 포함) 가용 데이터의 모든 내/외부 데이터를 포함하고 데이터 속성, 오너, 관련 담당자를 포함한 정의서 작성 (2) 데이터 획득 방안 수립 2) 데이터 스토어 설계 (1) 정형 데이터 스토어 설계 (예) 데이터 매핑* 정의성 *데이터 매핑(Mapping): 관련된 데이터를 연관시키는 작업 (2) 비정형 데이터 스토어 설계: 하둡, NoSQL 등으로 비정형/반정형 데이터를 저장하기 위한 논리/물리적 스토어 3) 데이터 수집 및 적합성 점검 (1) 데이터 수집 및 저장 (2) 데이터 정합성(무결정) 점검 8. 데이터 분석 1) 분석용 데이터 준비 2) 텍스트 분석 3) 탐색적 분석 4) 모델링 5) 모델 평가 및 검증 9. 시스템 구현 1) 설계 및 구현 (1) 시스템 분석 및 설계, 구현 (2) 시스템 테스트 및 운영 10. 평가 및 전개 1) 모델 발전 계획 수립 2) 프로젝트 평가 보고 |
||
분석 과제 발굴 | 1.분석 과제 도출의 유형 1) 하향식 접근 방법(Top Down Approach) (1) 문제 탐색 (2) 문제 정의 (3) 해결 방안 탐색 (4) 타당성 평가 (5) 분석 과제 도출 * 프로토타이핑(Prototyping)접근법: 아무것도 파악이 안되는 상황에서 일단 분석 - 결과확인 - 반복해서 개선 (1) 문제 탐색 (1)-1 비즈니스 모델 기반 문제 탐색 - 비즈니스 모델 캔버스*에서 기회 도출 *비즈니스 모델 캔버스: 문제 발굴 - 업무, 제품, 고객 / 문제 관리 - 규제와 감사, 지원인프라 (1)-2 분석 기회 발굴의 범위 확장: 환경과 경쟁 구도의 변화, 역량의 재해석을 통해 기회 도출 (1)-2-(1) 거시적 관점 요인 *STEEP 영역 폭넓게 기회 탐색 *STEEP: Social(사회), Technological(기술), Economic(경제), Environmental(환경), Political(정치) (1)-2-(2) 경쟁자 확대 관점 (1)-2-(3) 시장 니즈 탐색 (1)-2-(4) 역량의 재해석 관점 (1)-3 외부 참조 모델 기반 문제 탐색 2) 상향식 접근 방법(Bottom Up Approach) |
||
분석 프로젝트 관리 방안 | |||
분석 마스터플랜 | 분석 마스터플랜 수립 | ||
분석 거버넌스 체계 수립 | |||
데이터 분석 |
0 개의 댓글:
댓글 쓰기