데이터 정의
- 존재적 특성 : 객관적 사실
- 당위적 특성 : 추론, 예측 전망, 추정을 위한 근거
데이터의 유형
- 정성적 데이터 : 저장, 검색, 분석에 많은 비용이 소모되는 언어, 문자 형태의 데이터 (예. 회사 매출이 증가함)
- 정량적 데이터 : 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터 도형, 기호, 수치 (예. 나이, 몸무게, 주가 등)
지식영영의 핵심 이슈
- 암묵지 : 학습과 경험을 통해 개인에 체화된 지식 (ex. 김치 담그기, 자전거 타기) : 공유와 전달이 어렵다, 내면화 ⇒ 공통화 필요
- 형식지 : 문서나 메뉴얼처럼 형식화된 지식 (ex. 교과서, 비디오, DB) : 공유와 전달이 용이, 표준화 ⇒ 연결화
DIKW 피라미드
- 데이터 : 개별 데이터 자체로 의미가 중요하지 않은 객관적 사실
- 정보 : 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출
- 지식 : 정보를 구조화하여 유의미한 정보를 분류하고 개인적 경험을 결합하여 내재화한 것
- 지혜 : 지식의 축적과 아이디어가 결합된 창의적 산물
2. 데이터베이스 정의와 특징
용어의 연혁
- 1950 년대 미국에서 군대의 군비상황을 집중 관리하기 위하여 컴퓨터 도서관 설립 ⇒ 데이터 베이스 탄생
- 1963년대 미국 SDC가 개최한 심포지엄에서 공식 용어로 사용
- 1970년대 초반 유럽에서 데이터베이스라는 단일어로 일반화됨
- 1975 년 미국의 CAC가 KORSTIC을 통해 서비스되면서 우리나라에서 데이터베이스 이용이 이루어짐
- 1980 년대 중반 국내의 데이터베이스 관련 기술의 연기, 개발
데이터베이스 정의
- EU : 체계적이나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물
- 국내 저작권법 : 소재를 체계적으로배열 또는 구성한 편집물로 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것
- 국내 컴퓨터 용어 사전 : 동시의 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합
데이터베이스 특징
- 통합된 데이터 integrated data : 동일한 내용의 데이터가 중복되어 있지 않다. 데이터 중복은 관리상의 복잡한 부작용 초래
- 저장된 데이터 stored data : 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것. : 데이터베이스는 기본적으로 컴퓨터 기술을 바탕으로 한다.
- 공용 데이터 shared data : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다. 대용량화되고 구조가 복잡한 것이 보통
- 변화되는 데이터 changeable data : 데이타베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 함.
3. 데이터 베이스 활용
1980년대 기업내부 데이터베이스
- OLTP (On-Line Transaction Processing) : 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보내는 형태 : 데이터베이스의 데이터를 수시로 갱신하는 프로세싱 : 주문입력시스템, 재고관리시스템 등 현업의 거의 모든 업무는 이와 같은 성격을 띠고 있다
- OLAP (On-Line Analytical Processing) : 정보 위주의 분석 처리 ⇒ 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술 : 데이터 조회 위주
OLTP 데이터 갱신 위주 OLAP 조회 위주, 다차원의 데이터를 대화 식으로 분석하기 위한 기술
2000년대 기업내부 데이터베이스
- CRM (Customer Relationship Management) : 고객 관계 관리 : 기업이 고객과 관련된 내/외부 자료를 분석, 통합해 고객 중심 자원을 극대화하고, 이를 토대로 고객특성에 맞게 마케팅 활동을 계획, 지원, 평가하는 과정
- SCM (Supply Chain Management) : 공급망 관리 : 기업에서 원재료의 생산, 유통 등 모든 공급망 단계를 최적화해 수요자가원하는 제품을 원하는 시간과 장소에 제공하는 것
각 분야별 내부 데이터베이스
- 제조부문 : 대기업을 위주로 ERP에서 CRM으로 발전
- 금융부문 : 2000년대 초반, EAI, ERP, e-CRM을 통한 정보 공유 및 통합, 그리고 고객 정보의 전략적 활용이 시작됨 : 2000년대 중반, DW 도입을 통한 DB 활용 마케팅이 강화되었고, DW를 위한 최적화와 BI 기반의 시스템 구축이 급속도로 퍼지게 되었다
- 유통부문 : 2000년 이후, IT 환경 변화에 따라 CRM과 SCM의 구축이 활발하게 진행됨 : 상거래를 위한 인프라와 KMS를 위한 백업시스템 구축도 함께 진행 : RFID의 등장으로 유비쿼터스 시대를 준비
사회기반구조로서의 데이터베이스
- EDI (Electronic Data Interchange) : 주문서, 납품서, 청구서 등 무역에 필요한 각종 서류를 표준화된 양식을 통해 전자적 신호로 바꿔 컴퓨터 통신망을 이용하여, 거래처에 전송하는 시스템
- VAN (Value Added Network) : 부가가치통신망, 공중 전기통신사업자로부터 통신회선을 차용하여 독자적인 네트워크를 형성
- CALS (Commerce At Light Speed) : 전자상거래 구축을 위해 기업 내에서 비용 절감과 생산성 향산을 추구할 목적으로 시작된 제품의 설계, 개발, 생산에서 유통, 폐기에 이르기까지 제품의 라이프 사이클 전반에 관련된 데이터를 통합하고 공유, 교환할 수 있도록 한 경영통합정보시스템
반응형
'Work_Praciatal Competence > 05_Certificate' 카테고리의 다른 글
[ADsP 정리] 3과목 5장 3절 앙상블 & 인공 신경망 분석 (0) | 2021.02.08 |
---|---|
[ADsP 정리] 3과목 3장 데이터 마트 (0) | 2021.02.08 |
[ADsP 정리] 2과목 데이터 분석기획 (0) | 2021.02.08 |
[ADsP 정리] 1과목 3장 가치 창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2021.02.08 |
[ADsP 정리] 1과목 2장 데이터 가치와 미래 (0) | 2021.02.08 |