STUDY/정보처리기사
[정보처리기사] 데이터 입출력 구현
✨sunee✨
2022. 7. 18. 22:49
데이터 모델 구성요소
- 연산
- 구조
- 제약조건
데이터 모델 절차
구분 | 설명 | |
개념적 데이터 모델 | 현실세계 정보를 추상적, 개념적으로 표현 산출물: E-R D |
|
논리적 데이터 모델 | 논리적 데이터 베이스 구조로 매핑 목표 DBMS 설정, 스키마 설계 정규화 수행 |
|
관계 데이터 모델(R) | 2차원 테이블 형태 Codd 박사 제안 1:1 / 1:N / N:M |
|
계층 데이터 모델(H) | 트리 형태 상하관계 존재 1:N |
|
네트워크 데이터 모델(N) | 그래프, 망 형태 N:M |
|
물리적 데이터 모델 | 객체 생성, 반정규화 수행 |
관계대수 / 관계해석
구분 | 설명 | ||
관계대수 | 원하는 정보를 어떻게 유도하는가에 대한 절차적 정형 언어 | ||
일반 집합 연산자 |
합집합 (Union) |
||
교집합 (Intersection) |
|||
차집합 (Difference) |
|||
Cartesian Product | |||
순수 관계 연산자 |
셀렉트 | ||
프로젝트 | |||
조인 | |||
디비전 | |||
관계 해석 | 원하는 정보가 무엇인가에 대한 비절차적 언어 |
E-R 다이어그램 구성요소
- 개체: □
- 속성: ○
- 다중 값 속성: ◎
- 관계: ◇
- 관계-속성: ㅡ
정규화 (Normalization)
데이터의 중복성을 제거하여 이상 현상을 방지하는 과정
정규화 단계
구분 | 설명 |
1NF | 도메인은 원자값 |
2NF | 부분 함수 종속 제거 (완전 함수적 종속 단계) |
3FN | 이행 함수 종속 제거 |
BCNF | 결정자는 모두 후보키 |
4NF | 다치 종속 제거 |
5NF | 조인 종속제거 |
이상현상 (Anomaly)
데이터 중복으로 인해 릴레이션 조작시 발생하는 비합리적인 현상
반정규화(De-Normalization)
정규화 된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 과정
반정규화 기법
- 테이블 병합
- 테이블 분할
- 중복 테이블 추가 (집계 테이블, 진행테이블, 특정테이블)
- 중복 컬럼 허용
- 중복 관계 허용
DBMS
사용자와 DB 사이에서 사용자의 요구에 따라 정보를 생성하고 DB를 관리해주는 소프트웨어
DBMS 특징
구분 | 설명 |
데이터 일관성 | 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정해야 하는 성질 |
데이터 회복성 | 장애가 발생한 경우 특정 상태로 복구되어야 하는 성질 |
데이터 무결성 | 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질 |
데이터 효율성 | 응답 시간, 저장 공간 활용 등이 최적화되어 요구 조건을 만족시켜야 하는 성질 |
데이터 보안성 | 불법적인 노출, 변경으로부터 보호되어야 하는 성질 |
빅데이터
시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리가 가능한 수십 페타바이트 크기의 비정형 데이터
빅데이터 특징
- 데이터의 양 (Volume) : 페타바이트 수준의 대규모 데이터
- 데이터의 다양성 (Variety) : 정형, 비정형, 반정형의 다양한 데이터
- 데이터의 속도 (Velocity) : 빠르게 증가하고 수집되며 처리되는 데이터
데이터 마이닝
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
데이터 마이닝 주요 기법
구분 | 설명 |
분류 규칙 | 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 결과 값 예측 |
연관 규칙 | 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법 |
연속 규칙 | 연관 규칙에 시간 관련 정보가 포함된 형태의 기법 |
데이터 군집화 | 대상 레코드들을 유사한 특성을 지는 몇 개의 소그룹으로 분할하는 작업 |