Home 회복과 병행 제어
Post
Cancel

회복과 병행 제어

회복과 병행 제어

트랜잭션

테이터베이스는 항상 정확하고 일관된 상태를 가져야 하므로 이를 위해 트랜잭션이라는 기능을 제공한다. 트랜잭션은 한 작업을 수행하기 위해 모아놓은 여러 작업의 집합으로 볼 수 있으며, 데이터베이스의 논리적인 작업 단위이다.

예시로 내 계좌에서 다른 사람의 계좌로 입금을 진행할 때 내 계좌에서 돈이 빠져나감과 동시에 다른 사람의 계좌에 입금이 진행되어야 한다. 하지만 도중에 오류가 발생해 내 계좌에서만 돈이 빠져나가고 다른 사람의 계좌에는 입금이 되지 않는다면 돈이 사라지게 되는데, 이를 복구하기 위해 돈이 빠져나가는 작업을 취소해 원래의 상태로 돌아가야 한다. 이때 트랜잭션을 사용한다면, 이 두 가지 작업을 한 트랜잭션으로 묶어 오류가 발생했을 때 계속 진행하지 않고 원래의 상태로 돌려 데이터베이스의 일관성을 유지시켜 줄 수 있다.

트랜잭션의 특성

트랜잭션이 데이터베이스의 무결성과 일관성을 보장하려면 네 가지 특성을 만족해야 하는데 이를 영어 단어의 첫 자를 따서 ACID 특성이라 한다.

원자성 (atomicity)

트랜잭션을 구성하는 작업들이 모두 정상적으로 실행되거나, 아님 전부 실행되지 않아야 한다는 all-or-nothing 방식을 의미한다. 이는 트랜잭션을 수행하는 도중 장애가 발생하면 전부 취소하고 데이터베이스를 원래의 상태로 복구하는 것을 의미한다. 이 원자성을 만족한다면 작업중 일부만 실행한 결과를 데이터베이스에 반영하는 일이 발생하지 않는다. 이 원자성을 보장하려면 데이터베이스를 원래 상태로 복구하는 회복 기능이 필요하다.

일관성 (consistency)

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관성있는 상태를 유지해야한다는 의미이다. 트랜잭션이 수행중에는 일관적인 상태가 아닐 수 있지만 수행이 완료된 후에는 항상 일관된 상태를 유지해야 한다.

격리성 (isolation)

고립성 이라고도 하며, 현재 수행중인 트랜잭션이 완료될 때까지 트랜잭션이 생성한 중간 연산 결과에 다른 트랜잭션이 접근할 수 없음을 의미한다. 데이터베이스는 일반적으로 동시에 여러 트랜잭션이 발생하지만 각 트랜잭션은 독립적으로 수행되도록 다른 트랜잭션의 중간에 서로 접근하지 못하게 한다.

지속성 (durability)

영속성 이라고도 하며, 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영된 결과는 어떠한 경우에도 손실되지 않고 영구적이여야 함을 의미한다. 시스템에 장애가 발생하더라도 작업 결과는 사라지지 않고 그대로 남아있어야 한다. 이 트랜잭션 지속성을 보장하려면 장애가 발생했을 때 원상태로 복구하는 회복 기능이 필요하다.

트랜잭션의 연산

트랜잭션에는 commit 연산과 rollback 연산이 있다.

  • commit 연산
    • 트랜잭션이 성공적으로 완료되었음을 뜻하고 commit이 실행된 후에 트랜잭션의 수행결과가 데이터베이스에 반영된다.
  • rollback 연산
    • 트랜잭션의 수행이 실패하여 데이터베이스를 작업하기 이전의 원래의 상태로 되돌리는 연산이다.

트랜잭션의 상태

트랜잭션은 아래의 5가지의 상태 중 하나에 속하게 된다.

  • 활동 상태
    • 트랜잭션이 수행을 시작하여 현재 수행중인 상태를 말하며 상황에 따라 부분 완료 상태나 실패 상태가 된다.
  • 부분 완료 상태
    • 트랜잭션의 마지막 작업이 실행된 후의 상태를 말하며, 트랜잭션의 모든 작업이 완료되었지만 수행한 결과를 데이터베이스에 반영하지 않은 상태로 성공적으로 트랜잭션이 완료되었다고 하지 못한다. 이는 트랜잭션의 상황에 따라 완료 상태나 실패 상태가 될 수 있다.
  • 완료 상태
    • 트랜잭션이 성공적으로 완료되어 commit 연산이 실행된 상태로 이 상태가 되면 트랜잭션의 결과를 데이터베이스에 반영하고 데이터베이스가 새로운 일관된 상태가 되며 트랜잭션이 종료된다.
  • 실패 상태
    • 각종 오류로 장애가 발생해 트랜잭션의 수행이 중단된 상태로 트랜잭션이 더는 정상적으로 수행할 수 없다.
  • 철회 상태
    • 트랜잭션의 수행이 실패하여 rollback 연산이 실행된 상태로 트랜잭션의 모든 작업을 취소하고 데이터베이스를 이전의 상태로 되돌리며 트랜잭션이 종료된다. 종료된 트랜잭션은 내부 문제가 아닌 하드웨어의 이상이나 소프트웨어의 오류로 트랜잭션이 중단되었다면 다시 시작하고, 데이터가 존재하지 않거나 논리적 오류로 종료된 경우에는 트랜잭션을 폐기한다.

장애와 회복

데이터베이스는 트랜잭션의 특성을 보장하고 일관된 상태로 유지하기 위해 DBMS는 회복 기능을 제공한다. 회복은 장애가 발생한 경우 발생하기 전의 일관된 상태로 복구하는 것을 말한다.

장애의 유형

시스템이 제대로 동작하지 않는 상태를 장애라 말하며, 원인은 사용자의 실수, 하드웨어 고장, 소프트웨어의 논리적 오류 등 매우 많다. 장애의 유형은 크게 3가지로 분류할 수 있다.

  • 트랜잭션 장애
    • 트랜잭션 수행 중 오류가 발생한 상태로 트랜잭션의 논리적 오류나 잘못된 데이터 입력 등이 원인이다.
  • 시스템 장애
    • 하드웨어으 결함으로 발생하는 장애로 메인 메모리에 저장된 정보가 손실되거나 교착상태가 발생한 경우 등이 원인이다.
  • 미디어 장애
    • 디스크 장치의 결함으로 디스크에 저장된 데이터베이스가 손상된 상태로 디스크 헤드의 손상이나 고장이 원인이다.

회복 기법

DBMS의 회복 관리자가 담당하는데, 이 회복 관리자는 장애 발생을 탐지하고 데이터베이스를 복구하는 기능을 제공한다.

데이터베이스 회복의 핵심 원리는 데이터 중복으로 데이터를 미리 복사해두고 장애가 발생했을 경우 이를 불러와 원상복구 시키는 것이다. 데이터 복사는 덤프 혹은 로그를 사용한다.

  • 덤프 : 데이터베이스 전체를 주기적으로 복사
  • 로그 : 데이터베이스 변경 연산이 실행될 때마다 데이터를 변경 전의 값과 이후의 값을 별도의 파일에 기록

장애가 발생하면 덤프나 로그 방법으로 중복 저장된 데이터를 가져오는데, 이 회복 방법으론 redo 또는 undo 연산을 실행한다. redo 연산은 로그에 기록된 변경 연산 후의 값을 이용해 변경 연산을 재실행하는 방법으로 복구하고, undo 연산은 변경 이전의 값을 이용해 변경 연산을 취소하는 방법으로 복구한다. redo 연산은 전반적인 데이터 손상에 사용하고, undo 연산은 주로 신뢰성을 잃은 경우 사용한다.

데이터베이스 회복 기법으로는 크게 3가지로 나눌 수 있다.

  • 로그 회복 기법
    • 즉시 갱신 회복 기법
    • 지연 갱신 회복 기법
  • 검사 시점 회복 기법
  • 미디어 회복 기법

로그 회복 기법

데이터를 변경한 연산 결과를 반영하는 시점에 따라 즉시 갱신과 지연 갱신으로 나눈다.

즉시 갱신 회복 기법

트랜잭션 수행중에 데이터를 변경한 연산의 결과를 즉시 반영하며, 장애 발생을 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록한다. 장애가 발생하는 경우 로그에 commit 이 존재한다면 redo 연산을, 존재하지 않는다면 undo 연산으로 회복한다.

지연 갱신 회복 기법

트랜잭션이 수행중에 데이터를 변경한 연산의 결과를 로그파일에만 기록하였다가 트랜잭션이 부분 완료된 후 로그에 기록된 내용을 바탕으로 데이터베이스에 한번에 반영한다. 트랜잭션 과정에 장애가 발생하면 데이터베이스에 반영하기 전이므로 로그의 기록만 버리면 된다. 장애 발생 시 기록을 자체적으로 버리므로 undo 연산이 필요없고 로그에 commit 기록이 있다면 redo 연산으로 회복한다.

검사 시점 회복 기법

로그 회복과 같은 방법으로 로그 기록을 이용하는데, 일정 간격마다 검사 시점 을 만들어둔다. 장애가 발생했을 때 가장 최근 검사 시점 이전의 트랜잭션에선 회복 작업을 수행하지 않고 이후의 트랜잭션만 회복 작업을 수행한다. 이 방식을 사용하면 불필요한 회복 작업이 없어져 회복 시간이 단축된다.

회복 범위가 정해지면 즉시 갱신 회복이나 지연 갱신 회복으로 회복 작업을 수행한다.

미디어 회복 기법

디스크 장애에 대비한 회복 기법으로, 전체 데이터베이스의 내용을 일정 주기마다 다른 저장 장치에 복사해두는 덤프를 사용한다. 장애가 발생하면 가장 최근에 복사한 덤프를 이용해 장애 이전의 일관된 상태로 복구한다. 그 다음 필요에 따라 로그의 내용을 보며 redo 연산을 수행한다.

병행 제어

DBMS는 여러 사용가자 데이터베이스를 동시에 공유할 수 있도록 여러 개의 트랜잭션이 동시에 수행되는 병행 수행을 지원한다. 병행 수행은 트랜잭션들이 번갈아 수행되는 인터리빙 방식으로 진행된다.

여러 트랜잭션이 병행 수행되면서 같은 데이터에 접근할 때 발생하는 문제를 막아 정확한 수행 결과를 얻도록 제어하는 것을 병행 제어 또는 동시성 제어 라고 말한다.

병행 수행의 문제

병행 수행을 특별한 제어 없이 진행하면 여러 문제가 발생할 수 있다.

  • 갱신 분실
    • 한 트랜잭션이 수행한 데이터 연산의 결과를 다른 트랜잭션이 덮어 쓰는 문제
  • 모순성
    • 한 트랜잭션이 여러 개의 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스(다른 트랜잭션이 접근한 데이터베이스)에서 데이터를 가져와 연산을 실행해 생기는 문제
  • 연쇄 복귀
    • 한 트랜잭션에 장애가 발생해 rollback 되는 경우, 이와 연관된 트랜잭션들이 연쇄적으로 rollback 되어야 하는 문제로 이미 수행된 트랜잭션은 rollback을 진행할 수 없다.

트랜잭션 스케줄

트랜잭션 스케줄은 3가지로 구분할 수 있다.

직렬 스케줄

인터리빙 방식을 사용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것으로, 모든 트랜잭션이 완료될 때 까지 다른 트랜잭션의 방해를 받지않고 독립적으로 수행한다. 직렬 스케줄은 정확한 결과를 얻을 수 있지만 병행 수행이라 할 수 없어 잘 쓰지 않는다.

비직렬 스케줄

인터리빙 방식을 이용해 트랜잭션을 병행 수행하는 스케줄로, 트랜잭션의 순서에 따라 앞에서 말한 문제가 발생할 수 있어 정확한 값을 보장할 수 없다.

직렬 가능 스케줄

직렬 스케줄을 수행한 것 처럼 정확한 결과를 생성하는 비직렬 스케줄이다. 이 스케줄을 보장받기 위해 DBMS는 병행 제어 기법을 제공한다.

병행 제어 기법

직렬 가능 스케줄을 보장받기 위해 사용하는 기법으로, 모든 트랜잭션이 따르면 직렬 가능성이 보장되는 규칙을 정해 이 규칙을 따르도록 한다. 이를 위해 주로 로킹 기법을 사용한다.

로킹 기법

병행 수행되는 트랜잭션이 같은 데이터에 동시에 접근하지 못하도록 lockunlock 연산을 통해 제어한다. 이는 한 트랜잭션이 먼저 접근한 데이터에 관한 연산이 모두 끝날 때 까지 다른 트랜잭션이 접근하지 못하도록 상호 배제하여 직렬 가능성을 보장한다.

일반적인 데이터베이스 접근 연산 순서

lock → read → write → unlock

한 트랜잭션이 데이터에 접근하면 읽기 전에 lock 연산으로 잠그고 모든 연산이 종료되면 unlock 연산으로 열어준다.

  • 공용 lock
    • 모든 트랜잭션이 lock된 데이터에 read연산은 가능하지만 write연산은 불가능하다. 또한 다른 트랜잭션도 공용 lock 연산을 동시에 수행할 수 있다.
  • 전용 lock
    • 한 트랜잭션만 해당 데이터에 read연산과 write연산이 모두 실행가능하다.

기본 로킹 기법으로는 완벽한 직렬 가능성을 보장할 수 없다. 예를 들어 두 데이터에 접근하며 서로 연관이 있는 트랜잭션에서 한 데이터에 대한 연산을 마치고 다른 데이터에 대한 연산을 마치기 전에 unlock하여 다른 트랜잭션이 변경된 데이터와 변경되지 않는 두 데이터에 접근해 일관성이 깨질 수 있다. 이를 방지하기 위해 2단계 로킹 규약이 사용된다.

2단계 로킹 규약

트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock연산의 수행 시점에 대한 새로윤 규약을 추가한 것으로, lock과 unlock 연산을 2단계로 나누어 실행한다.

  • 확장 단계
    • 트랜잭션이 lock만 실행할 수 있고 unlock을 실행할 수 없는 상태
  • 축소 단계
    • 트랜잭션이 unlock만 실행할 수 있고 lock은 실행할 수 없는 상태

2단계 로킹 규약을 사용하면 앞서 말한 예시에서 두 데이터에 대한 연산이 종료되기 전엔 unlock을 수행할 수 없어 직렬 가능성이 보장된다.하지만 교착 상태가 발생할 수 있어 주의해야 한다.

This post is licensed under CC BY 4.0 by the author.

데이터베이스 정규화

보안과 권한 관리