본문 바로가기
ADsP 정리 내용 백업

1과목 데이터 이해 1장 데이터 이해

by metal-11 2017. 4. 9.

과목1 1장.hwp

※ ADsP 정리글은 어디까지나 한국데이터진흥원에서 발행한 데이터분석 전문가 가이드를 읽어야 그 맥락이 이해되는 물건입니다. 그러니 꼭 사서 정리을 보길 추천합니다.


1과목 데이터의 이해

1장 데이터의 이해

1절 데이터와 정보.

1. 데이터의 정의

- 데이터 : 추론과 추정의 근거를 이루는 사실. 정성(언어, 문자 등), 정량(수치, 기호, 도형)

- 암묵지 : 학습과 체험을 통해 개인에게 습득된 무형의 지식. 과학적 발견은 여기에 기초함.

- 형식지 : 형상화되어 전달공유가 용이

암묵지

형식지

공통화(Socialization)

표출화(Externalization)

내면화(Internalization)

연결화(Combination)

내면화된 지식 >> 표출화 >> 공통화 >> 연결화 >>내면화 와 같은 순환을 거친다.

2. 데이터와 정보의 관계

DIKW : Data Info, Knowledge, Wisdom hierarchy로 최종적으로 지혜를 얻어내는 과정

- 데이터 : 상관관계 없는 가공 전의 순수한 수치나 기호(A100, B200원에 연필 판매)

- 정보 : 가공 & 상관관계 이해를 통해 패턴을 인식하고 의미를 부여(A 연필이 더 쌈)

- 지식 : 상호 연결된 정보 패턴을 이해해 예측한 결과물(더 싼 A에서 사야겠다.)

- 근본 원리에 대한 깊은 이해를 판단으로 도출되는 창의적 아이디어(A의 다른 물건도 쌀 듯)

 

2절 데이터베이스 정의와 특징

2. 정의 : 상호 관련된 다수 콘텐츠를 정보처리 및 정보 통신기기에 의하여 체계적으로 수집 축적하여, 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

3. DB 특징 : 저장 + 검색

1) 통합된(integrated) 데이터 : 중복 되지 않음

2) 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장매체

3) 공용 데이터 : 여러 사용자가 공동이용

4) 변화되는 데이터 : 저장하는 내용은 곧 DB의 상태. 현재 정확한 데이터 유지

4. 특성

정보의 축적 및 전달 : 기계 가독성, 검색가능성, 원격조작성

정보의 이용 : 다양한 정보를 신속, 정확, 경제적으로 찾아낼 수 있다.

정보의 관리 : 체계적 축적, 내용 추가나 갱신이 용이

정보기술 발전 : 정보처리, IR SW·HW, 네트워크 기술 발전을 견인

경제 산업적 측면 : 인프라로서 효율성 제고, 편의 증진

 

3DB활용 (용어위주)

1. 기업내부 DB(=인하우스 DB라고도 부름)

MIS : 경영정보 시스템, DW(Data Warehouse) : 공통형식으로 변환해 관리하는 DB

90년 중반 기점으로 OLTP(Online Transaction Processing) 수집 >> OLTP(Online Analytical Processing) 분석 중심 시스템으로 변화

2000DBCRM(Customer Relationship Management, 고객관계관리)SCM(Supply Chain Management, 공급망관리 : 자재구매, 생산·재고, 유통·판매, 고객 데이터로 구성. 뒤의 2개가 CRM과 관련 깊음.)로 화두 바뀜.

. 제조부분 : ERP(Enterprise Resource Planning), BI(Business Intelligence), . 금융부분, . 유통부분

2. 사회기반구조로서 DB

EDI(Electoronic Data Interchange, 전자문서 교환)기반, VAN 부가가치 통신망,

. 물류부분 : 종합물류 시스템 존재

. 지리부분 : 2단계 국가지리체계구축사업이 완료됨

. 교통부분 : 지능형 교통체계(ITS)

. 의료부분 : 원격 의료

. 교육부분 : 교육행정정보시스템(NEIS)