STUDY/정보처리기사

[정보처리기사] 데이터 입출력 구현

✨sunee✨ 2022. 7. 18. 22:49

데이터 모델 구성요소

  • 연산
  • 구조
  • 제약조건

 

데이터 모델 절차

구분 설명
개념적 데이터 모델 현실세계 정보를 추상적, 개념적으로 표현
산출물: E-R D
논리적 데이터 모델 논리적 데이터 베이스 구조로 매핑
목표 DBMS 설정, 스키마 설계
정규화 수행
관계 데이터 모델(R) 2차원 테이블 형태
Codd 박사 제안
1:1 / 1:N / N:M
계층 데이터 모델(H) 트리 형태
상하관계 존재
1:N
네트워크 데이터 모델(N) 그래프, 망 형태
N:M
물리적 데이터 모델 객체 생성, 반정규화 수행

 

관계대수 / 관계해석

구분 설명
관계대수 원하는 정보를 어떻게 유도하는가에 대한 절차적 정형 언어
일반
집합
연산자
합집합
(Union)
 
교집합
(Intersection)
 
차집합
(Difference)
 
Cartesian Product  
순수
관계
연산자
셀렉트  
프로젝트  
조인  
디비전  
관계 해석 원하는 정보가 무엇인가에 대한 비절차적 언어

 

E-R 다이어그램 구성요소

  • 개체: □
  • 속성: ○
  • 다중 값 속성: ◎
  • 관계: ◇
  • 관계-속성: ㅡ

 

정규화 (Normalization)

데이터의 중복성을 제거하여 이상 현상을 방지하는 과정

 

정규화 단계

구분 설명
1NF 도메인은 원자값
2NF 부분 함수 종속 제거 (완전 함수적 종속 단계)
3FN 이행 함수 종속 제거
BCNF 결정자는 모두 후보키
4NF 다치 종속 제거
5NF 조인 종속제거

 

이상현상 (Anomaly)

데이터 중복으로 인해 릴레이션 조작시 발생하는 비합리적인 현상

 

반정규화(De-Normalization)

정규화 된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 과정

 

반정규화 기법

  • 테이블 병합
  • 테이블 분할
  • 중복 테이블 추가 (집계 테이블, 진행테이블, 특정테이블)
  • 중복 컬럼 허용
  • 중복 관계 허용

 

DBMS

사용자와 DB 사이에서 사용자의 요구에 따라 정보를 생성하고 DB를 관리해주는 소프트웨어

 

DBMS 특징

구분 설명
데이터 일관성 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정해야 하는 성질
데이터 회복성 장애가 발생한 경우 특정 상태로 복구되어야 하는 성질
데이터 무결성 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질
데이터 효율성 응답 시간, 저장 공간 활용 등이 최적화되어 요구 조건을 만족시켜야 하는 성질
데이터 보안성 불법적인 노출, 변경으로부터 보호되어야 하는 성질

 

빅데이터

시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리가 가능한 수십 페타바이트 크기의 비정형 데이터

 

빅데이터 특징

  • 데이터의 양 (Volume) : 페타바이트 수준의 대규모 데이터
  • 데이터의 다양성 (Variety) : 정형, 비정형, 반정형의 다양한 데이터
  • 데이터의 속도 (Velocity) : 빠르게 증가하고 수집되며 처리되는 데이터

 

데이터 마이닝

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

 

데이터 마이닝 주요 기법

구분 설명
분류 규칙 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 결과 값 예측
연관 규칙 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
연속 규칙 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
데이터 군집화 대상 레코드들을 유사한 특성을 지는 몇 개의 소그룹으로 분할하는 작업