1, 디지타이즈
컴퓨터 기술을 통해 아날로그 신호를 디지털 신호로 변환하는 과정.
2. 종이 문서의 디지털화
스캐너 또는 디지털 카메라와 같은 디지털 장치를 사용하여 종이 파일을 디지털화하고 테이프, 디스크, 광 디스크 등의 캐리어에 저장된 컴퓨터에서 인식할 수 있는 디지털 이미지 또는 디지털 텍스트로 변환하는 프로세스입니다.
3. 디지털 이미지
물리적 이미지를 나타내는 정수 배열입니다. 같은 차원의 연속 이미지에 의해 생성된 2D 또는 더 높은 차원의 샘플링 및 정량화 함수입니다. 행렬 (또는 기타) 네트워크에서 연속 함수를 샘플링하고 샘플링 점의 값을 최소화합니다.
4. 흑백 이진 이미지
흑백 그레이스케일만 있는 디지털 이미지. 흑백의 문자초안, 선화 등에 해당한다.
5, 연속톤 스틸 이미지
두 개 이상의 회색 음영 또는 서로 다른 색상 채널의 서로 다른 음영으로 구성된 정적 디지털 이미지입니다. 종이 파일을 디지털화하는 과정에서 일반적으로 회색조 스캔과 컬러 스캔이라는 두 가지 모드가 있습니다.
6. 해결
단위 길이당 이미지에 포함된 포인트 또는 픽셀 수는 일반적으로 인치당 도트 수 (dpi) 로 표시됩니다.
7. 변형
디지털 변환 후 디지털 이미지가 원본 파일과 색상 및 기하 도형에서 벗어나는 정도입니다.
8, 이해력
디지털 이미지가 사람이나 기계에 정보를 제공하는 능력.
9. 이미지 압축
이미지 중복 또는 이미지 근사화를 제거하는 모든 프로세스로, 보다 간결한 형식으로 이미지를 나타내기 위한 것입니다.
둘째, 디지털 종이 파일의 기본 요구 사항
1, 기본 원칙
종이 파일 디지털화의 기본 원칙은 파일 정보 자원을 정확하고 편리하며 빠르게 이용할 수 있도록 하여 공개될 수 있는 아카이브 정보 자원을 이용할 수 있도록 하는 것입니다.
2. 디지털 객체 결정 원칙.
디지타이즈할 대상은 일정한 원칙과 방법에 따라 확인해야 하며, 일정한 요구 사항을 충족하는 종이 서류만 디지털화할 수 있다.
1) 국내법 및 규정의 원칙을 준수합니다.
종이 서류의 디지털화는 반드시 국가의 문서 개방에 관한 규정 및 관련 규정을 준수해야 한다.
2) 가치 원칙
아카이브 범위에 속하며 영구적이거나 장기간 보관해야 하며 사회적 활용 가치가 높은 파일은 디지털 처리 범위에 포함될 수 있습니다.
3. 기본 링크
종이 파일 디지털화의 기본 부분은 파일 정리, 카탈로그 작성, 파일 스캔, 이미지 처리, 이미지 저장, 데이터 품질 검사, 데이터 연계, 데이터 수락, 데이터 백업, 결과 관리 등입니다.
4. 프로세스 관리
1) 원본 파일 및 디지털 아카이브 정보의 보안을 보장하기 위해 종이 파일 디지털화의 모든 측면에 대한 보안 및 기밀 관리 메커니즘을 강화해야 합니다.
2) 종이 문서 디지털화의 각 부분은 상세히 등록하고, 제때에 총집을 정리하고, 책으로 제본하고, 디지털화 작업을 마치면서 완전한 규범의 기록을 세워야 한다.
셋째, 문서 정리
스캔하기 전에 파일 관리 상황에 따라 아래 단계에 따라 파일을 적절히 정리하고 필요에 따라 표시를 하여 파일의 디지털화 품질을 보장해야 합니다.
1 카탈로그 데이터 준비
2 번들 제거
3 스캔 부품과 비스캔 부품을 구분합니다
4 페이지 오려내기
5 기록 및 등록
6 제본
넷째, 파일 스캔
1, 스캔 모드
1) 파일 형식의 크기 (A4, A3, A0 등) 를 기준으로 합니다. ), 해당 규격의 스캐너나 전문 스캐너를 선택하여 스캔합니다 (예: 도면 시트는 시트 0 스캐너를 사용할 수 있음). 대형 파일은 대형 디지털 플랫폼으로 스캔하거나, 마이크로필름 디지털 변환 장치로 스캔하거나, 소폭 스캔한 이미지로 패치할 수 있습니다.
2) 용지 상태가 좋지 않고, 너무 얇거나, 너무 부드럽거나, 너무 두꺼운 문서는 태블릿으로 스캔해야 합니다. 종이 조건이 좋은 서류는 고속으로 스캔하여 생산성을 높일 수 있다.
2. 스캔 색상 모드
1) 스캔 색상 모드는 일반적으로 흑백 바이너리, 그레이스케일, 컬러 등을 포함합니다. 보통 흑백 이진 값이 사용됩니다.
2) 흑백 페이지, 글씨가 또렷하고 삽화가 없는 파일은 흑백 이진 모드로 스캔할 수 있습니다.
3) 흑백 페이지, 글씨 선명도나 그림이 좋지 않은 파일, 다색 페이지 파일은 회색 모드로 스캔할 수 있습니다.
4) 페이지에 빨간 헤더 파일, 도장 또는 흑백 사진, 컬러 사진, 컬러 삽화가 있는 문서는 필요에 따라 컬러 모드 스캔을 할 수 있습니다.
3. 스캔 해상도
1) 스캔 해상도 매개변수 선택은 스캔한 이미지가 선명하고 완전하며 이미지 활용에 영향을 주지 않는다는 전제하에 한다.
2) 흑백 바이너리, 그레이스케일, 컬러 모드에서 파일을 스캔할 때 해상도는 일반적으로 ≥ 100dpi 를 권장합니다. 특수한 경우, 예를 들면 글자가 작고, 글자가 촘하고, 선명도가 떨어지는 등. , 해상도를 적절하게 향상시킬 수 있습니다.
3) OCR 한자 인식이 필요한 파일의 경우 스캔 해상도는 ≥200dpi 를 선택하는 것이 좋습니다.
4. 등록 검사
종이 문서 디지털화 변환 프로세스 전송 등기표를 꼼꼼히 기입하고, 스캔 페이지 수를 등록하고, 각 파일의 실제 스캔 페이지 수가 파일 정리량에 채워진 파일 페이지 수와 일치하는지 확인합니다. 일치하지 않으면 구체적인 원인과 처리 방법을 명시해야 한다.
동사 (verb 의 약어) 이미지 처리
1, 이미지 데이터 품질 검사
1) 이미지의 왜곡, 선명도 및 왜곡 정도를 검사합니다. 이미지 품질 요구 사항을 충족하지 못하는 경우 이미지를 다시 처리해야 합니다.
2) 스캔한 이미지 파일이 불완전하거나 부적절한 조작으로 명확하게 인식되지 않을 경우 다시 스캔해야 합니다.
3) 스캔 파일이 누락된 경우 제때에 스캔하여 이미지를 올바르게 삽입합니다.
4) 스캔한 이미지의 정렬 순서가 원본 파일과 일치하지 않는 경우 제때에 조정해야 합니다.
5) 관련 양식을 꼼꼼히 작성해 품질 검사 결과와 처리 의견을 기록한다.
2. 수정, 교정; [화학] 증류; [전기] 정류; [수] 길이를 구하다
편향의 기본 시각적 인식을 위해 편향 이미지를 교정해야 합니다. 방향이 잘못된 사진은 회전 복원을 해야 하며, 독서 습관에 부합해야 한다.
3. 정화
검은 점, 검은 선, 검은 상자, 검은 가장자리 및 기타 불순물. 이미지 페이지에서 이미지 품질에 영향을 미치는 불순물은 제거해야 합니다. 처리 과정에서 이해력에 영향을 주지 않고 문서의 원래 모습을 보여주는 원칙을 따라야 한다.
4. 이미지 모자이크
서로 다른 영역의 큰 면 파일을 스캔하여 형성된 여러 개의 이미지는 파일 디지털 이미지의 무결성을 보장하기 위해 하나의 완전한 이미지로 결합되어야 합니다.
5, 트리밍 처리
컬러 모드에서 스캔한 이미지는 클리핑하여 불필요한 흰색 가장자리를 제거하여 이미지 파일의 용량을 효과적으로 줄이고 저장 공간을 절약해야 합니다.
여섯째, 이미지 저장
1, 저장 형식
흑백 바이너리 모드로 스캔된 1) 이미지 파일은 일반적으로 TIFF(G4) 형식으로 저장됩니다. 회색 모드와 컬러 모드에서 스캔한 파일은 일반적으로 JPEG 형식으로 저장됩니다. 저장시 압축비 선택은 스캔한 이미지의 가독성을 보장하고 저장 용량을 최소화하는 것을 전제로 해야 한다.
2) 웹 조회를 제공하는 스캔 이미지이며 CEB, PDF 또는 기타 형식으로 저장할 수 있습니다.
2. 이미지 파일 이름 지정
1) 종이 파일 카탈로그 데이터베이스의 각 파일에는 스캔 이미지 파일의 이름이 지정된 고유 파일 번호가 있습니다.
2) 다중 시트 파일은 이 파일 번호로 해당 폴더를 만들 수 있으며, 이미지 파일은 페이지 번호순으로 이름을 지정할 수 있습니다.
일곱, 카탈로그 데이터베이스.
1, 데이터 형식 선택
카탈로그 데이터베이스 구축은 일반 데이터 형식을 선택해야 합니다. 선택한 데이터 형식은 XML 문서를 통해 직접 또는 간접적으로 데이터를 교환할 수 있어야 합니다.
2, 문서 설명
기록 규칙 (DA/T 18) 의 요구 사항에 따라 기록 카탈로그 데이터베이스가 구축되었습니다.
3, 카탈로그 데이터 품질 검사
수동 교정 또는 소프트웨어 자동 교정을 통해 카탈로그 데이터베이스의 품질을 검사합니다. 설명 항목이 완전한지, 설명 내용이 정확한 사양인지 확인합니다. 불합격한 데이터가 발견되면 수정하거나 다시 기록해야 한다.
여덟, 데이터 후크
1, 요약 훅
아카이브 디지털화 변환 과정에서 형성된 카탈로그 데이터베이스 및 이미지 데이터베이스는 품질 검사를 통해' 합격' 을 확인한 다음 네트워크를 통해 적시에 데이터 서버에 로드하여 요약합니다. 프로그래밍 또는 적절한 소프트웨어를 통해 카탈로그 데이터가 관련 디지털 이미지를 자동으로 찾고 적절한 전자 주소 정보를 추가하여 배치, 빠른 후크를 구현할 수 있습니다.
2. 데이터 연결
종이 파일 카탈로그 데이터베이스를 기반으로 각 종이 파일에서 스캔한 하나 이상의 이미지를 이미지 파일로 저장합니다. 이미지 파일을 해당 폴더에 저장할 때 각 이미지 파일의 이름이 아카이브 카탈로그 데이터베이스의 파일 번호와 같은지, 이미지 파일의 페이지 수가 아카이브 카탈로그 데이터베이스의 파일 페이지 수와 같은지, 이미지 파일의 총 수가 아카이브 카탈로그 데이터베이스의 파일 수와 같은지 자세히 확인해야 합니다. 각 이미지 파일의 파일 이름과 아카이브 카탈로그 데이터베이스에 있는 해당 파일의 파일 번호의 일관성 및 고유성을 통해 일대일 대응 관계를 구축하여 아카이브 카탈로그 데이터베이스와 이미지 파일의 대량 연결을 위한 조건을 제공합니다.
3. 종이 파일 디지털화 변환 프로세스 인수인계등기서를 꼼꼼히 작성하며, 데이터 연결 후의 페이지 수를 기록하고, 각 파일 연결 후의 페이지 수가 파일 정리 스캔 시 채운 페이지 수와 일치하는지 점검한다. 일치하지 않으면 구체적인 원인과 처리 방법을 명시해야 한다.
아홉, 데이터 수용
1, 데이터 샘플링
1) 카탈로그 데이터베이스, 이미지 파일, 데이터 훅의 전체 품질을 포함하여 샘플링된 모든 디지털화된 데이터를 검사합니다.
2) 전종 문서의 경우 데이터 수용 시 샘플링률이 5% 이하여야 합니다.
2, 수락 지표
1) 카탈로그 데이터베이스가 이미지 파일에 errorcode 링크가 있거나 카탈로그 데이터베이스와 이미지 파일에 불완전한, 불분명, 오류 등의 품질 문제가 있을 때 샘플링은' 불합격' 으로 표시됩니다.
2) 전종파일 디지털 변환 품질 샘플링 검사 합격률이 95% 이상 (95% 포함) 에 이를 때' 통과' 로 간주된다.
합격률: 샘플링 검사를 통과한 문서 수/샘플링 검사 문서 총 수 × 100% 입니다.
3. 검수 심사
"통과" 검수의 결론은 반드시 분관 지도자의 심사 서명을 거쳐야 효력을 발휘할 수 있다.
4. 수락 등록
종이 파일 디지털 수락 등록 양식을 신중하게 작성하십시오.
X. 데이터 백업
1, 백업 범위
완전하고 검증된 데이터는 적시에 백업해야 합니다.
2. 백업 방법
데이터 보안을 위해 백업 캐리어의 선택은 다양해야 하며, 온라인 및 오프라인 결합을 통해 여러 개의 백업을 구현하고 원격 스토리지에 주의를 기울일 수 있습니다.
3. 데이터 검사
백업 데이터도 확인해야 합니다. 백업 데이터 검사에는 주로 백업 데이터를 열 수 있는지 여부, 데이터 정보가 완전한지 여부, 파일 수가 정확한지 여부 등이 포함됩니다.
4. 백업 탭
데이터를 백업한 후에는 쉽게 찾고 관리할 수 있도록 해당 백업 미디어에 레이블을 지정해야 합니다.
5. 백업 등록
종이 문서 디지털 백업 관리 등록 양식을 작성합니다.
XI. 디지털 결과 관리
1. 종이 파일 디지털화 결과 관리를 강화하여 보안, 무결성 및 장기 가용성을 보장해야 합니다.
2. 종이 파일 디지털화 성과 온라인 검색 이용을 제공할 때 제작단위의 전자 로고를 제공해야 하며, 상황에 따라 각각 다운로드 가능하거나 다운로드할 수 없는 데이터 형식을 채택해야 한다.