본문 바로가기

Database/MySQL

[데이터베이스(강의)] 1. 데이터베이스 기본 개념

 

 

* database (DB)

전자적(electronically)으로 저장되고 사용되는 관련있는(related) 데이터들의 조직화된 집합(organized collection).

 

 

 

* DBMS (database management systems)

 - 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템. 

    e.g.) PostgreSQL, MySQL, ORACLE database, (Microsoft SQL) Server

 - DB를 정의하다 보면 부가적인 데이터가 발생.

                                     => metadata

 

 

* metadata _ data about data (data를 설명하기 위한 data)

 - database를 정의하거나 기술하는(descriptive) data.

 - catalog 라고도 부름.

     e.g.) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등등

 - metadata 또한 DBMS를 통해 저장/관리된다.

 

 

* database system

 - database + DBMS + 연관된 applications

 - 줄여서 database라고도 부름. 

 

 

** database 동작방식 **

 


 

* data models

 - DB의 구조(structure)*를 기술하는데 사용될 수 있는 개념들이 모인 집합.

 - DB 구조*를 추상화해서 표현할 수 있는 수단을 제공한다.

 - data model은 여러 종류가 있으며 추상화 수준과 DB구조화 방식이 조금씩 다르다.

 - DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함.

 

* DB구조 : 데이터 유형, 데이터 관계(relationship), 제약 사항(constraints) 등등

 

 

 

* data models 분류

 1. conceptual (or high-level) data models

 2. logical (or representational) data models

 3. physical (or low-level) data models

 


 

1) conceptual data models

 - 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델.

 - 추상화 수준이 가장 높음

 - 비즈니스 요구 사항을 추상화하여 기술할 때 사용.

 

e.g.)  entity-relationship model (ER diagram)

  => 데이터베이스의 구조를 entity 와 entity들간 의 관계로 모델링.

 


 

2) logical data models 

 - 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공.

 - 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함.

 - 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화 할 수 있는 모델.

 

 e.g.) relational data model, object data model, object-relational data model

      (데이터 테이블_가장 많이 사용)

 

더보기

relational data model   => MySQL, Oracle database, SQL Server

object-relational data model  => PostgreSQL

 


 

3) physical data models

 - 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공.

 - data format, data orderings, access path 등등

                          데이터 검색을 빠르게 하기 위한 구조체 (  e.g.)  index )

 


 

[ schema & state ]

 

 

* database schema

 - data model 을 바탕으로 database의 구조를 기술(description)한 것.

 - schema는 database를 설계할 때 정해지며 한 번 정해진 후에는 자주 바뀌지 않는다.

 

 e.g.)

더보기

 

relation data model 에서의 database schema 예시

 

Youtube (쉬운코드) 데이터베이스 강의

 

 

 

* database state (database snapshot)

 - database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.

 - 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다.

 - 혹은 database에 있는 현재 instances의 집합이라고도 한다.

 

 


 

* three-schema architecture

 - database system을 구축하는 architecture 중의 하나.

 - user application으로부터 물리적인(physical) database를 분리시키는 목적.

더보기

 물리적인 데이터베이스 구조가 바뀐다 하더라도,

이 데이터베이스를 사용하는 실제 user application에는 영향을 주지 않도록 하기 위해

 - 세 가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다.

 


 

 

1) internal schemas at internal level  (내부 스키마)

 - 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현.

 - data storage, data structure, access path 등등 실체가 있는 내용 기술.

 

 

 

2) external schemas (or user views) at external (or view) level  (외부 스키마)

 - external views, user views 라고도 불림.  _실제 사용자가 바라보는 스키마

 - 특정 유저들이 필요로 하는 데이터만 표현.

 - 그 외 알려줄 필요가 없는 데이터는 숨김.

 - logical data model을 통해 표현.

 

 

더보기

 

** database system의 초창기 architecture는 위의 두가지로 구성 ( internal + external )

각각의 유저마다 필요로 하는 데이터가 달라지다 보니, internal level에서도 중복되는 데이터가 발생.

좀 더 효율적인 데이터 관리를 위해 conceptual schema등장

 

Youtube (쉬운코드) 데이터베이스 강의

 

 

 

 

3) conceptual schemas at conceptual level  (개념 스키마)

 - 전체 database에 대한 구조를 기술. _ internal schema를 한번 추상화 시켜 표현한 스키마

 - 물리적인 저장 구조에 관한 내용은 숨김.

 - entities, data types, relationships, user operations, constraints에 집중.

 - logical data model을 통해 기술.

 


 

[ three-schema architecture 정리 ]

 - 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함. _각 레벨 사이의 매핑만 변경

 - 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음.

 - 데이터가 존재하는 곳은 internal level. (각각의 스키마는 database 구조를 표현하기 위한 것)

 

 


 

[ database language ]

 

 

* data definition language (DDL)                               => 대부분 모든 스키마를 커버함

 - conceptual schema 를 정의하기 위해 사용되는 언어.

 - internal schema까지 정의할 수 있는 경우도 있음.

 

 

* storage definition language (SDL)

 - internal schema를 정의하는 용도로 사용되는 언어.

 - 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정로 대체됨.

 

 

* view definition language (VDL)

 - external schemas를 정의하기 위해 사용되는 언어. 

 - 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행.

 

 

* data manipulation language (DML)

 - database에 있는 data를 활용하기 위한 언어.

 - data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어.

 

 

 

오늘날의 DBMA는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재

 => 대표적인 예가 relational database language : SQL

 

 


 

https://www.youtube.com/watch?v=aL0XXc1yGPs&list=PLcXyemr8ZeoREWGhhZi5FZs6cvymjIBVe