데이터베이스는 컴퓨터 저장 장치에 합리적으로 구성되고 저장되는 상호 연관된 데이터의 모음입니다. 그것은 컴퓨터 기술과 정보 검색 기술의 결합의 산물이며 전자 정보 자원의 주체이며 정보 검색 시스템의 핵심 부분 중 하나이다. 제공된 정보에 따라 데이터베이스는 주로 참조 데이터베이스와 소스 데이터베이스로 나눌 수 있습니다.
1. 참조 데이터베이스
주로 일련의 설명 정보 내용을 저장하고 사용자를 다른 정보 소스로 안내하여 전체 원본 정보를 얻는 데이터베이스 (주로 서지 데이터베이스 및 가이드 데이터베이스 포함) 입니다.
(1) 서지 데이터베이스는 카탈로그, 제목, 요약 등의 서지 단서를 저장하는 데이터베이스입니다. , 일명 2 차 문헌 정보 데이터베이스. 다양한 도서관 카탈로그 데이터베이스, 서지 데이터베이스, 다이제스트 데이터베이스 등이 이 범주에 속하며, 사용자에게 원본 정보를 얻을 수 있는 단서를 알려 주는 역할을 합니다.
도서관 카탈로그 데이터베이스는 기계 판독 카탈로그라고도 하며, 데이터 내용은 책 제목, 저자, 출판 항목 등의 서지 정보뿐만 아니라 사용자가 원본 정보를 요청할 수 있도록 수집 정보를 제공합니다. 제목 및 요약 데이터베이스에 설명된 데이터 내용은 인쇄된 제목 및 요약과 유사하며 사용자가 검색할 수 있는 논문 정보 또는 특허 정보와 같은 정보 소스를 제공합니다.
(2) 안내 데이터베이스는 기관, 사람, 제품, 활동 등에 대한 대상을 설명하는 데이터베이스를 저장합니다. 다른 데이터베이스와 비교할 때 가이드 데이터베이스는 사용자에게 관련 정보뿐만 아니라 다양한 유형의 엔티티도 포함하며 대부분 이름을 사용하여 검색합니다. 예를 들어, 생산 및 업무 활동에 대한 정보를 저장하는 기관 카탈로그 데이터베이스, 인력에 대한 정보를 저장하는 전기 데이터베이스, 제품 또는 상품에 대한 정보를 저장하는 제품 안내서 데이터베이스, 펀드에 대한 정보를 저장하는 펀드 데이터베이스 등이 있습니다. 이 범주는 사용자가 다른 관련 정보 소스에서 보다 자세한 정보를 얻을 수 있도록 안내하는 기능입니다.
2. 소스 데이터베이스
주로 전체 텍스트, 숫자, 구조 등의 정보를 저장합니다. 또한 원본 정보 또는 특정 데이터를 직접 제공할 수 있으므로 사용자는 다른 정보 소스의 데이터베이스를 참조할 필요가 없습니다. 주로 전체 텍스트 데이터베이스와 숫자 데이터베이스를 포함합니다.
(1) 전체 텍스트 데이터베이스는 원본 정보의 전체 텍스트 또는 주요 부분을 저장하는 소스 데이터베이스입니다. 정기 전체 텍스트 데이터베이스, 특허 전체 텍스트 데이터베이스, 백과사전 전체 텍스트 데이터베이스 등과 같은 사용자는 특정 단어나 구의 원본 정보가 포함된 전체 텍스트를 직접 검색할 수 있습니다.
(2) 숫자 데이터베이스는 주로 숫자 정보를 나타내는 소스 데이터베이스와 유사한 텍스트-숫자 데이터베이스를 저장합니다. 서지 데이터베이스에 비해 디지털 데이터베이스는 정보 심도 처리의 산물이며 필요한 데이터 정보를 직접 제공할 수 있습니다. 각종 통계 데이터베이스, 과학 기술 데이터베이스 등. 일반적인 검색 기능 외에도 숫자 데이터베이스에는 정확한 데이터 연산, 데이터 분석, 그래픽 처리 및 검색된 데이터 정리 및 재구성 기능이 있습니다.
데이터베이스 구조
1. 서지 데이터베이스의 구조
서지 데이터베이스는 레코드라고 하는 문서로 구성된 일련의 데이터이며, 레코드에는 여러 필드가 포함되어 있습니다.
(1) 레코드 및 필드 레코드는 한 단위로 처리되는 관련 데이터의 집합이며 문서를 구성하는 기본 데이터 단위입니다. 레코드에 포함된 몇 개의 필드는 레코드를 구성하는 기본 데이터 단위입니다. 서지 데이터베이스에서 레코드는 제목 또는 요약과 동일하므로 레코드는 일반적으로 제목 필드, 작성자 필드, 소스 필드, 요약 필드, 주제 필드, 분류 번호 필드, 언어 필드 등으로 구성됩니다. 일부 필드에는 여러 개의 하위 필드가 있으며, 하위 필드는 필드의 하위 데이터 단위입니다. 예를 들어 제목 필드에는 여러 주제어가 포함되어 있습니다. 필드가 나타내는 레코드의 특성에 따라 필드는 일반적으로 기본 필드와 보조 필드의 두 가지 범주로 나뉩니다. 일반적인 필드 이름과 코드는 표 4- 1 에 나와 있습니다.
표 4- 1 필드 이름 및 코드
기본 필드
보조장
필드명
도메인 코드
필드명
도메인 코드
제목
전음계의 제 7 음
레코드 번호
(down 과 동일) 아래로
요약
A 형 혈액
저자
에
설명자
델라웨어 주
저자 단위
프랜차이즈 측량사
분류: 인식자
신분증
로그 이름
존 존
출판 연도
파라과이
출판국
사령관 (commanding officer)
언어의 종류
대음계 제 6 음
(2) 특정 구조에 따라 구성된 관련 기록의 집합. 문헌은 서지 데이터베이스에 있는 데이터 조직의 기본 형태이며, 문헌 구성 방식은 검색 시스템의 하드웨어 및 소프트웨어 기능과 밀접한 관련이 있습니다. 서지 데이터베이스에서 문헌 구조는 주로 직열 문헌과 역문헌으로 나뉜다.
1) 인라인 문서 레코드는 순차적으로 저장되고, 레코드 간의 논리적 순서는 물리적 순서와 일치하며, 인쇄 도구에서 요약의 정렬 순서에 해당하며, 선형 문서입니다. 인라인 문서는 데이터베이스의 주요 부분이지만 해당 주제어와 기타 특징에 대한 인식은 무질서하다. 직접 검색할 때는 처음부터 끝까지 전체 기록을 검색해야 하는데 시간이 오래 걸리고 실용적이지 않습니다.
2) 역방향 문서는 주제 특성이 있는 필드 (예: 주제 필드, 제목 필드, 설명 필드 등) 를 추출합니다. ) 및 분야 특성이 없는 필드 (예: 작성자 필드, 기관 필드, 소스 필드 등). ) 에 있는 각 레코드를 특정 순서로 재구성하여 문서를 얻습니다. 항목 특성이 있는 역파일을 기본 색인 문서라고 하고, 항목 특성이 없는 역파일을 보조 색인 문서라고 합니다.
요약하면 전방 및 후방 이동의 주요 차이점은 전방 이동은 전체 레코드를 처리 및 검색 단위로 하는 마스터 문서이고 후방 이동은 레코드의 필드를 처리 및 검색 단위로 하는 인덱스 문서라는 것입니다. 컴퓨터를 검색할 때는 먼저 후진으로 들어가 관련 정보를 찾는 열람번호를 찾은 다음 전진파일에 들어가 열람번호에 따라 기록을 찾는다.
2. 전체 텍스트 데이터베이스의 구조
일반 전체 텍스트 데이터베이스의 구조는 서지 데이터베이스와 유사합니다. 전체 텍스트 데이터베이스의 한 레코드는 전체 텍스트 텍스트로, 여러 필드로 구분됩니다. 기본 문서는 정방향 행으로 구성된 텍스트 문서이고 역방향 문서는 레코드의 감지 가능한 필드에 해당하는 색인 문서입니다.
3. 수치 데이터베이스의 구조
숫자 데이터베이스의 구조는 데이터베이스의 내용과 검색 목적을 종합적으로 고려해야 합니다. 즉, 내용에서 숫자 데이터베이스의 주요 내용은 숫자 정보이지만 필요한 설명 텍스트 정보는 배제하지 않습니다. 검색에서 단일 검색과 통합 검색이 용이하며 검색된 데이터에 대한 정확한 데이터 연산, 데이터 분석, 그래픽 처리 및 정렬 재구성이 가능합니다. 디지털 데이터베이스의 데이터 구조는 셀 또는 리스트 형식일 수 있습니다. 전자는 원시 데이터의 시뮬레이션이고, 후자는 통계표의 기계 읽기 시뮬레이션이다. 디지털 데이터베이스에는 일반적으로 포함된 파일, 인라인 파일, 색인 파일 등 다양한 문서가 있습니다. 앞으로 이동은 마스터 문서와 해당 색인 문서인 숫자 데이터로 구성됩니다. 쉽게 액세스할 수 있도록 색인 파일은 기본적인 직접 액세스 구조로 구성되어 있습니다. 역류에도 해당 색인 문서가 있으며 계층적으로 구성되어 있습니다. 숫자 데이터베이스의 문서 구조를 통해 모든 문서를 검색할 수 있으며 모든 데이터를 계산할 수 있습니다. 이는 숫자 데이터베이스의 특징을 구성합니다.
4. 가이드 데이터베이스의 구조
가이드 데이터베이스의 구조에는 정방향 파일, 역방향 파일, 색인 파일 및 데이터 사전을 포함한 서지 데이터베이스, 전체 텍스트 데이터베이스 및 디지털 데이터베이스의 특성이 있습니다. 일반적으로 주제 영역이 많고 내용이 포괄적인 대형 가이드 데이터베이스의 경우 마스터 문서는 여러 하위 문서의 구조를 채택할 수 있으며, 단일 분야 및 전문 컨텐츠의 경우 단일 마스터 문서 및 가변 길이 다중 필드의 레코드 형식을 사용해야 합니다.