Professional Documents
Culture Documents
데이터베이스 10 gisa
데이터베이스 10 gisa
5.4 정렬
1) 내부정렬기법
① 정의
데이터량이 적을 때 주기억장치 내에서 정렬하는 방법
② 특징
속도는 빠르나, 정렬할 자료의 양이 많은 경우 부적합 0007 0010
③ 종류
• 히프 정렬(heap sort) 0209 0203 0205
• 버블 정렬(bubble sort)
• 퀵 정렬(quick sort)
• 삽입 정렬 (insertion sort) 0209
• 쉘 정렬(shell sort)
2) 외부정렬기법
① 정의
대용량의 데이터를 몇 개의 서브 파일로 나누어 각각 내부 정렬을 한 후에,
테이프나 디스크 내에서 각 서브 파일을 합병하는 방법
② 특징 0003
90
www.gisa79.com
(3) 정렬기법 종류
1) 버블 정렬 (bubble sort) 0106 0209 0509
91
PART 1 | 데이터베이스
92
www.gisa79.com
<1회전>
<2회전>
<3회전>
<4회전, 완료>
|오|답|쪽|지|
(4) 정렬 알고리즘의 선택 시 고려사항 0007 0007 0305 0503 0609
정렬 알고리즘 선택 시
고려사항 오답
1) 키 값들의 분포상태 ✗증가 데이터의 배열상태
✗운영체제의 종류
2) 소요 공간 및 작업시간 ✗액세스 빈도
4) 데이터의 양
5) 초기 데이터의 배열상태
6) 사용 컴퓨터 시스템의 특성
93
PART 1 | 데이터베이스
|기|출|문|제| 0503
0106 0303
3. 다음 영문의 괄호 안에 적합한 정렬 방법은? 6. 이진트리의 레코드 R=(88,74,63,55,37,25,33,19
,26,14,9)에 대하여 힙(heap) 정렬을 만들 때, 37
The ( ) arranges the adjacent record
의 왼쪽과 오른쪽의 자노드(child node)의 값은?
keys as a result of comparing these. That
가. 55, 25 나. 63, 33
is, if they are not ordered, the two keys 다. 33, 19 라. 14, 9
are exchanged each other.
0007
가. bubble sort 나. insert sort
7. 정렬(Sort) 알고리즘의 선택 시 고려사항으로 거
다. heap sort 라. radix sort
리가 먼 것은?
가. 증가 데이터의 배열상태
나. 키 값들의 분포상태
다. 소요 공간 및 작업시간
라. 정렬에 필요한 기억공간의 크기
94
www.gisa79.com
5.5 검색
(1) 검색기법 종류
1) 이진 검색(binary search) 0007 0205 0303 0409 0505 0005 0205 0403 0503 0509
2) 보간(Interpolation) 검색 0603
3) 버킷(bucket) 0403
4) 슬롯(slot)
한 개의 레코드를 저장할 수 있는 공간으로 n개의 슬롯이 모여 하나의 버킷을 형성
5) 충돌(collision) 0603
95
PART 1 | 데이터베이스
|오|답|쪽|지|
해싱함수의 종류 오답
(3) 해싱함수의 종류 0405
✗체인(chain) 방법
1) 중간제곱(mid-square) 방법
레코드의 키를 제곱한 후 그 중간 부분의 값을 목적 주소로 사용하는 방법
2) 숫자분석(digit analysis) 방법
레코드 키를 구성하는 수들이 모든 키들 내에서 각 자리별로 어떤 분포인지를
조사하여 비교적 고른 분포를 나타내는 자릿수를 필요한 만큼 선택하여, 목적
주소로 사용하는 방법
3) 제산(division) 방법
레코드의 키를 해시테이블의 크기보다 큰 소수로 나누는 방법
② 개방 주소법(Open Addressing)
충돌(Collision)이 발생했을 때 순서대로 다음 버킷에 저장하는 방법
③ 체인 방법
오버플로우 발생 시 이를 별도의 기억 공간에 두고 링크로 연결하여 사용하는
방법
96
www.gisa79.com
0505
0007 0205 0409
2. 다음과 같이 레코드가 구성되어 있을 때, 이진 5. 해싱함수 중 주어진 키를 여러 부분으로 나누고,
검색 방법으로 14를 찾을 경우 비교되는 횟수 각 부분의 값을 더하거나 배타적 논리합(XOR :
는? Exclusive OR) 연산을 통하여 나온 결과로 주소
를 취하는 방법은?
“1 2 3 4 5 6 7 8 9 10 11 12 13 14 15” 가. 중간 제곱 방법(Mid-square method)
가. 2번 나. 3번 다. 4번 라. 5번 나. 제산 방법(Division method)
다. 중첩 방법(Folding method)
0603 라. 기수 변환법(Radix conversion method)
3. 탐색 방법 중 키 값으로부터 레코드가 저장되어
있는 주소를 직접 계산하여, 산출된 주소로 바로 0405
접근하는 방법으로 키-주소 변환 방법이라고도 6. 해싱함수(Hashing Function)의 종류가 아닌 것
하는 것은? 은?
가. 이진 탐색 나. 피보나치 탐색 가. 제곱(mid-square) 방법
다. 해싱 탐색 라. 블록 탐색 나. 숫자분석(digit analysis) 방법
다. 체인(chain) 방법
라. 제산(division) 방법
97
PART 1 | 데이터베이스
5.6 파일조직 기법
(1) 파일조직
1) 막대한 양의 자료를 각종 매체에 저장하는 기법
2) 파일 편성 혹은 파일 구성 방법이라 함
4) 인덱스 구분 9910
① 정적 인덱스
• 데이터 파일의 레코드가 삽입되거나 삭제됨에 따라 인덱스의 내용은 변하
지만 구조자체는 변하지 않음
② 동적 인덱스 9908
98
www.gisa79.com
※ 직접 접근 방식(DAM: Directed Access Method) 0603 0005 0106 0203 0405 |오|답|쪽|지|
DAM 오답
• 데이터의 입/출력이 빈번히 발생하는 곳에 응용 ✗기억 공간의 효율성이 매우
• 해싱 함수를 이용하여 레코드의 저장 위치를 결정 좋음
99
PART 1 | 데이터베이스
6) 다중 키 파일의 종류
① 역파일 (inverted file) 0003
비교 오답
✗다중 리스트 방식은 동일한 구 분 역파일 다중 리스트 파일
키의 모든 레코드를 검색하
는 성능이 더 우수함 데이터 레코드 중에서
포인터 수 데이터 레코드 수만큼
한 개의 레코드
인덱스 형태 가변길이 고정길이
데이터 레코드
영향 없음 포인터 필드 추가
파일 구조
4) 트랜잭션이나 검색 요청에 대한 응답 시간
5) 파일저장 매체의 접근 특성
6) 자료처리의 주기
7) 자료처리 순서
100
www.gisa79.com
|기|출|문|제| 0603
6. 직접 접근 방식(DAM: Directed Access Method)
에 대한 설명으로 거리가 먼 것은?
9910 가. 데이터의 입/출력이 빈번히 발생하는 곳에 응
1. 인덱스 파일에서 다단계 인덱스를 사용하는 주된 용하는 것이 좋다.
이유는? 나. 해싱 함수를 이용하여 레코드의 저장 위치를
가. 탐색수를 줄인다. 결정한다.
나. 인덱스 크기를 줄인다. 다. 다른 레코드를 참조하지 않고 어떤 레코드를
다. 인덱스에 삽입, 삭제가 편리하다. 접근할 수 있다.
라. 논리적으로 관련된 데이터들을 물리적으로 집 라. 기억 공간의 효율성이 매우 좋다.
중시킨다.
0503
0007 7. 인덱스 순차 파일(ISAM : Indexed sequential
2. 인덱스(Index)에 대한 설명으로 부적절한 것은? access-method) 에 대한 설명으로 옳지 않은 것은?
가. 인덱스는 데이터베이스의 물리적 구조와 밀접 가. 인덱스를 저장하기 위한 공간과 오버플로우
한 관계가 있다. 처리를 위한 별도의 공간이 필요하다.
나. 인덱스는 하나 이상의 필드로 만들어도 된다. 나. 실제 데이터 처리 외에 인덱스를 처리하는 추
다. 레코드의 삽입과 삭제가 수시로 일어나는 경 가적인 시간이 소모되므로 파일 처리 속도가
우는 인덱스를 최소화한다. 느리다.
라. 인덱스를 통해서 테이블의 레코드에 대한 액
다. 인덱스 영역은 실린더 색인 영역, 섹터 색인
세스를 빠르게 수행할 수 있다.
영역, 트랙 색인 영역으로 구분 된다.
0103 0209
라. 순차 처리와 직접 처리가 모두 가능하다.
3. 트라이(trie) 색인에 대한 설명으로 옳지 않은 것 0305
은? 8. VSAM 파일에 대한 설명으로 거리가 먼 것은?
가. 키 탐색을 위해 키 값을 직접 표현한다.
가. 기본 데이터 영역과 오버플로우 영역을 구분
나. 트라이의 차수는 키 값을 표현하기 위해 사용
하지 않는다.
하는 문자의 수(radix)에 의해 결정한다.
나. 레코드를 삭제하면 그 공간을 재사용 할 수
다. 키 값의 분포를 미리 예측할 수 있다면 기억
있다.
장소를 절약할 수 있다.
라. 트라이의 크기는 나타내려고 하는 키 값의 기 다. 제어 구간에 가변 길이 레코드를 쉽게 수용할
수와 키 필드 길이에 의해 결정된다. 수 있다.
라. 특정 레코드에 대해 빠르고 직접적인 접근을
0106 지원할 수 있기 때문에 대화형 처리에 많이
4. 키 값이 문자열 또는 숫자일 경우 일련의 키 값 이용된다.
들에 대해 일부분이 같은 문자나 숫자로 구성되
0003
었을 때, 즉 전체 키 값의 길이보다 키 값들 사
이에 별개의 전위(prefix) 수가 작을 때 적합하 9. 역파일(inverted file)에 관한 설명으로 옳지 않은
고, 가변 길이의 키 값을 효과적으로 나타낼 수 것은?
있으며, 삽입 및 삭제 시 노드의 분열과 병합이 가. 검색 속도가 빠르다.
없는 특징을 가진 색인구조는? 나. 데이터 파일에 접근하지 않아 질의응답 시간
가. B* - 트리 색인 나. 트라이(trie)색인 이 줄어들고, 처리가 비교적 쉽다.
다. B - 트리 색인 라. B+ - 트리 색인 다. 질의를 만족하는 레코드 검색 시 한번 씩만
접근하면 된다.
0103 0209 라. 색인의 각 항의 길이가 고정적이므로 기억 공
5. 파일에 대한 설명 중 옳지 않은 것은? 간이 절약된다.
가. 순차 파일(Sequential file)은 생성되는 순서
0403
에 따라 레코드를 순차적으로 저장하므로, 저
장 매체의 효율이 가장 높다. 10. 다양한 파일 조직 방법 중에서 응용에 적합한
나. 직접파일(Direct file)은 특정 레코드에 접근 파일 조직을 선택하는데 영향을 주는 요인들로만
하기 위해서 디스크의 물리적인 주소로 변환 구성된 것은?
할 수 있는 함수를 사용한다. ㉠ 사용할 보조 기억장치의 유형
다. 색인 순차 파일(Indexed sequential file)은
순차 및 직접 접근 형태를 모두 지원할 수 있 ㉡ 응용이 필요로 하는 파일 연산의 유형
으나, 기억 장소의 낭비를 초래한다. ㉢ 파일 활동 비율(file activity ratio)
라. VSAM 파일(Virtual storage access method ㉣ 트랜잭션이나 검색 요청에 대한 응답 시간
file)은 검색속도를 빠르게 하기 위하여, 기본
데이터 구역과 오버플로우 구역을 구분하여 가. ㉠ ㉡ ㉢ ㉣ 나. ㉡ ㉢ ㉣
갖추어야 한다. 다. ㉠ ㉡ ㉢ 라. ㉠ ㉡
101