SQLP - SQL 파싱 부하

@markdown

# SQL 파싱 부하

## SQL 처리 과정

____

- 사용자는 구조화된 질의언어(SQL)을 통해 사용자가 원하는 결과집합을 정의

- DBMS는 사용자의 SQL을 SQL 옵티마이저를 통해 실행계획으로 작성해줌

<pre><code class="SQL" style="font-size:14px">Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=209 Card=5 Bytes=175)

1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMP' (Cost=2 Card=5 Bytes=85)

2 1 NESTED LOOPS (Cost=209 Card=5 Bytes=175)

3 2 TABLE ACCESS (BY INDEX ROWID) OF 'DEPT' (Cost=207 Card=1 Bytes=18)

4 3 INDEX (RANGE SCAN) OF 'DEPT_LOC_IDX'(NON-UNIQUE) (Cost=7 Card=1)

5 2 INDEX (RANGE SCAN) OF 'EMP_DEPTNO_IDX'(NON-UNIQUE) (Cost=1 Card=5)

</code></pre>

### SQL 파싱

- 1) SQL을 실행하면 먼저 SQL Parser가 SQL 문장에 문법적 오류가 없는지 검사(Syntax 검사)

- 2) 문법적 오류가 없다면 의미상 오류가 없는지 검사(Semantic 검사, Object 존재유무 등)

- 3) 검사를 마치면, 사용자가 발생한 SQL과 그 실행계획이 라이브러리캐시에 캐싱되어 있는지 확인

- 4) 캐싱되어 있다면 소프트파싱, 캐싱되어 있지 않다면 하드파싱

#### 소프트파싱(Soft Parsing)

- SQL과 실행계획을 캐시에서 찾아 곧바로 실행단계로 넘어가는 경우

#### 하드 파싱(Harding Parsing)

- SQL과 실행계획을 캐시에서 찾이 못해 최적화 과정을 거치고 나서 실행단계로 넘어가는 경우

### 최적화(Optimization)

- SQL 최적화를 담당하는 옵티마이저는 사용자가 요청한 SQL을 가장 빠르고 효율적으로 수행할 최적의 처리경로를 선택해주는 DBMS의 핵심

- 1) 5개의 테이블을 조인한다면, 발생하는 경우의 수가 5!이고 120개의 실행계획을 평가

- 2) 120가지 실행계획에 포함된 각 단계별 다양한 조인 방식을 고려

- 3) 해당 테이블을 Full Scan 할지, Index를 사용할지 고려

- 위와 같이 최적화 과정이 무거운 작업이므로 최적화된 SQL 실행계획을 한번만 사용한다면 비효율이 발생하므로 여러 사용자가 공유해서 재사용할 수 있도록 공유메모리에 캐싱해놓는다.

## 캐싱된 SQL 공유

____

### 실행계획 공유 조건

- 1) 문법적 오류와 의미상 오류가 없는지 검사

- 2) 해시 함수로부터 반환받은 해시 값으로 라이브러리 캐시 내 해시버킷 탐색

- 3) 찾아간 해시 버킷에 체인으로 연결된 엔트리를 차례로 스캔하면서 같은 SQL 문장 탐색

- 4) SQL 문장을 찾으면 함께 저장된 실행계획을 가지고 바로 실행

- 5) 찾아간 해시 버킷에 SQL 문장을 찾이 못하면 최적화를 수행

- 6) 최적화를 거친 SQL과 실행계획을 방금 탐색한 해시 버킷 체인에 연결

- 7) 위 과정을 거쳐 최적화된 실행계획을 가지고 실행

하드파싱을 반복하지 않고 캐싱된 버전을 찾아 재사용하려면 SQL을 먼저 찾아가야 하며, 캐시에서 SQL을 찾기위해 사용되는 키값은 SQL 문장 그 자체

→ 이 때문에 SQL 문장안의 작은 공백 하나로도 DBMS는 서로 다른 SQL 문장으로 인식할수 있으므로 주의 해야함

### 실행계획을 공유하지 못한 경우

- 1) 공백 또는 줄바꿈