현재 위치 - 법률 상담 무료 플랫폼 - 특허 조회 - 검색 전략을 조정하여 만족스러운 검색 결과를 얻으려면 어떻게 해야 합니까?
검색 전략을 조정하여 만족스러운 검색 결과를 얻으려면 어떻게 해야 합니까?
컴퓨터 문서 검색의 기본 방법 및 전략

컴퓨터 정보 검색은 기본적으로 컴퓨터가 입력한 검색 정책을 시스템에 저장된 문서 특징 식별 및 논리적 조합 관계와 비교하는 프로세스입니다. 정보 요구 사항 자체의 불확실성, 데이터베이스의 문서 특성에 대한 충분한 이해 부족, 시스템 기능의 제한 사항 등으로 인해 검색 효과는 다양한 정도에 따라 달라질 수 있습니다. 그러나 특정 검색 단계를 따르고 좋은 검색 전략을 개발하면 다양한 불리한 요인의 영향을 줄일 수 있으며, 정보 요구 사항 및 검색 시스템과 검색 물음표를 최대한 일관되게 유지하여 시스템에서 사용자의 요구에 맞는 메시지를 검색할 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 검색명언)

1. 검색 단계

(1) 정보 요구 사항 및 검색 목적을 명확히 합니다.

정보 수요는 객관적이거나 주관적으로 각종 정보 정보에 대한 일종의 수요이다. 이러한 요구는 사람들이 정보 정보를 요청하는 출발점이자 온라인 정보 검색에서 데이터베이스를 선택하고 검색 전략을 결정하고 검색 효과를 평가하는 근거이다. 주제 유형에 따라 정보 요구 사항이 다릅니다. 예를 들어 발명 신청, 성과상 신고, 감정항목 등 새로운 과제는 종종 특정 학과 범위 내의 문헌 정보를 전면적으로 수집해야 한다. 이런 제목은 조사성과 추적성의 특징을 가지고 있으며, 마땅히 종합 검색을 위주로 해야 한다. 과학 연구 생산에서 특정 문제를 해결하는 핵심 연구 과제는 종종 탐지된 정보만 자신의 연구에 도움이 되도록 요구하며, 발견된 문헌의 범위는 넓지 않아도 된다. 그래서 이런 제목은 정확한 조사가 필요하다.

정보 요구 사항을 올바르게 분석하려면 어떻게 해야 합니까? 우리는 정보 수요의 형식과 내용의 두 가지 측면에서 분석할 수 있습니다. 명확한 정보 형식이 필요한 문제는 다음과 같습니다.

① 명확한 검색 목적. 결과 신고를 위한 것인지, 과제의 최신 진척 등을 파악하기 위한 것인지 등을 검색한다. 을 눌러 전체 또는 정확도 요구 사항을 충족하는 검색 전략을 개발합니다.

(2) 필요한 문서의 양을 명확히하십시오. 필요한 문서 수의 상한을 설정하는 것은 나중에 검색 정책을 결정하고 검색 비용을 제어하는 중요한 매개 변수입니다. 또한 검색된 주제에 존재할 수 있는 관련 문헌의 양을 추정해야 합니다.

(3) 필요한 문헌의 언어, 연령 범위, 유형, 작성자 또는 기타 외관 특징을 결정하는 것도 중요하며 검색 범위를 제한하는 데도 중요합니다.

명확한 정보 내용이 필요한 주요 문제는 다음과 같습니다.

(1) 주제 내용과 관련된 주요 주제 범위를 명확하게 검색하는 것이 중요합니다. 이는 나중에 적합한 데이터베이스를 선택하는 데 매우 중요합니다.

② 검색 주제의 주요 내용을 분석하고 자연어로 표현하는 것은 온라인 검색의 중요한 부분이다.

(2) 데이터베이스를 선택하여 검색 경로를 결정합니다.

정보 요구 사항을 분석한 후 알려진 조건에 따라 적절한 데이터베이스를 선택할 수 있습니다. 이는 검색 시스템의 선택을 의미합니다. 외국 특허 문헌을 검색하려면 BDSIRS 시스템의 국내 GWZL 라이브러리를 검색할 수 있습니다. 그러나 검색 경로와 최신 특허 문헌에 대한 보도는 미국 DIALOG system 의 WPI 라이브러리보다 못하다. 검색 요구 사항이 높을 때에도 미국식 대화 시스템을 자주 사용합니다.

데이터베이스를 선택할 때 먼저 다음 사항을 이해해야 합니다.

(1) 데이터베이스에서 수집된 정보와 관련된 주제 영역

② 포함된 문헌 유형은 문헌의 주요 출처를 더 잘 이해하는 것이 좋다.

③ 포함 된 시간 범위;

(4) 데이터베이스의 기본 및 보조 인덱스와 검색 방법 및 검색 태그의 특성

⑤ 기계 시간 비용과 레코드당 인쇄 비용을 포함한 데이터베이스 검색 비용

데이터베이스가 선택되면 제공되는 검색 방법도 결정되며 알려진 조건에 따라 하나 이상의 검색 방법을 결정할 수 있습니다. 컴퓨터 저장 용량, 연산 속도, 다중 분야 비교를 통해 색인을 작성하면 수동 검색에서 일반적으로 사용되는 주제어, 분류 번호, 저자로부터 검색할 수 있을 뿐만 아니라 문장 자유어, 문헌 유형, 정기 간행물 이름에서도 검색할 수 있습니다. 또한 여러 가지 방법으로 조합하여 상호 검색할 수 있습니다. 이것은 수동 검색으로는 할 수 없는 것이다.

(3) 주제의 개념 그룹을 결정하고 id 를 검색합니다.

검색된 주제의 정보 요구 사항 및 주요 내용을 파악한 후 개념 그룹을 식별하고 id 를 검색하는 것이 중요한 단계입니다. 검색 주제에 복잡한 주제 내용이 포함된 경우 주제의 내용을 구성하는 여러 개념 그룹을 명시적으로 정의하여 특정 논리적 조합을 통해 특정 복합 개념 또는 개념 관계를 형성하여 사용자의 정보 요구 사항을 표현해야 합니다.

주제의 개념 평면을 결정하고 개념 평면을 시스템 인식의 해당 검색 식별자로 변환해야 합니다. ID 를 읽어들이는 표현은 두 가지 요구 사항을 충족해야 합니다. 하나는 종속성입니다. 즉, ID 를 읽어들이면 정보 요구 사항이 반영됩니다. 두 번째는 일치입니다. 즉, 검색 id 는 검색 시스템의 저장 피쳐 id 와 일치합니다.

검색 식별자는 일반적으로 다음 세 가지 형식으로 제공됩니다.

① 사양어: 데이터베이스 색인 및 검색이 따라야 하는 검색 언어이기 때문에 검사할 데이터베이스의 시소러스 또는 시소러스에서 사양의 단어나 구를 선택합니다. 검색 문제의 인식을 문서 특성의 인식과 일치시키고 최상의 검색 결과를 얻으려면 먼저 사양의 단어를 선택해야 합니다.

② 표준화 코드: 색인 코드는 데이터베이스 시스템이 특정 분야 범주 또는 분야 개념에 대해 지정한 색인 단위입니다. 이 단위는 특이성이 뛰어나 검색 효과가 좋은 문서 특징 인식이다. 국제 특허 분류 번호 IC =, PTS 데이터베이스의 제품 코드 PC =, 표준 산업 코드 SC = 등

③ 자유어: 자유어 검색은 시스템의 전체 텍스트 검색 기능을 최대한 활용할 수 있다. 표준어 또는 코드 선택은 시어표나 분류표를 이용하여 자연언어에서 표준어로 전환해야 하며, 검색자와 검색자의 사고방식이 다르면 검색 효과에도 영향을 미친다. 이때 자유어로 제목, 요약, 심지어 전문을 검색하면 몇 가지 장점이 드러난다. 자유어는 직설적이고 간결하며, 과학기술자들이 받아들일 수 있는 상용적인 방법이다.

(4) 검색문형 작성, 구체적인 검색절차 확정.

검색 문제 표현식은 컴퓨터 정보 검색에서 사용자 검색 문제를 표현하는 논리 표현식으로, 검색어, 다양한 부울 논리 연산자, 위치 연산자 및 시스템 지정 기타 조합 및 연결 기호로 구성됩니다. 어떤 의미에서 검색 스타일은 검색 전략의 구체적인 표현이며, 그 좋고 나쁨은 검색 전략의 성패와 관련이 있다.

검색 태그가 결정되면 다음 단계는 모든 검색 태그를 특정 조합 관계로 연결하여 검색 문제를 형성하고 다양한 복잡한 개념 관계를 표현하여 정보 요구 사항을 정확하게 표현하는 것입니다. 다양한 논리 연산자, 위치 연산자, 절단 연산자 사용 (예: 위치 연산자의 견고성 및 순서, 각 검색어에 대한 한정 요구 사항 및 입력 순서, 피드백 정보에 따른 검색 공식 조정) 에 유의해야 합니다. 정책 검색 섹션을 참조하십시오.

2. 검색 정책

(1) 검색 정책의 개념

검색 전략은 주제 내용의 개념 단위를 분석하여 검색 시스템, 문서 검색, 검색 방법 및 검색어를 결정하고 검색어 간의 위치 관계, 논리 관계 및 검색 단계를 과학적으로 배정하는 것입니다. 검색 전략이 포괄적인지 여부는 문서의 전체 비율과 정확도에 직접적인 영향을 미칩니다.

(2) 검색 전략 개발 단계

검색 전략을 개발하려면 데이터베이스와 전체 검색 시스템의 기본 성능을 명확히 해야 합니다. 데이터베이스마다 포함 내용, 색인 방법, 검색 방법이 다르며, 검색 시스템마다 기술 성능과 운영자가 다릅니다. 검색 정책을 개발하기 전에 데이터베이스에는 여러 가지 검색 방법이 있으며 이러한 방법의 색인이 따르는 규칙을 명확하게 이해해야 합니다. 시스템에 없는 검색점을 문제 표에 나열하면 문헌을 열람할 수 없다.

(3) 검색 전략 수립의 기초는 검색된 주제의 내용 요구 사항과 검색 목적을 파악하는 것이다. 이를 바탕으로 검색된 주제의 개념을 분석할 수 있습니다. 만약 주제가 단일 개념에 속한다면, 우리는 하나의 검색어로 표현할 수 있다. 주제 개념이 복잡할 경우 복잡한 개념을 여러 개념 단위로 분할한 다음 논리 연산자를 사용하여 개념 단위를 나타내는 검색 구를 일치시킬 수 있습니다. 개념 단위를 검색어로 변환할 때는 가능한 한 규범적인 단어를 선택해야 한다. 새로운 주제, 변두리 학과 또는 모호한 개념을 검색할 때는 특히 조심해야 한다. 이러한 단어는 종종 시스템 내에 없기 때문이다. 여기에서는 전문 범주에서 본 학과에서 검색의의가 있는 키워드, 즉 자유어를 선택해야 한다. 그렇지 않으면 오검이나 누락으로 이어질 수 있다.

(4) 검색 전략으로 구성된 관건은 선택어가 정확하고 논리적 부호가 붙는다는 것이다.

(5) 검색 전략을 조정합니다. 컴퓨터 검색에서 문서가 너무 적거나 0 이거나 문서가 너무 많은 경우가 많습니다. 검색자로서 사용자와 함께 분석하고 적시에 검색 전략을 조정하여 검색이 만족스러운 결과를 얻을 수 있도록 해야 합니다. 문헌 자원이 너무 많거나 적으면 검색어를 늘리고 부울 논리를 사용하여 적중 문헌 수를 줄이거나 늘려서 검색 범위를 늘리거나 줄일 수 있습니다. 일반적으로 논리와 항상 검색 범위를 좁히여 정확한 검색 목적을 달성합니다. 논리적 또는 항상 검색 범위를 확장하여 모든 검색 목적을 달성합니다. 논리적 비배타적 검색은 항상 검색 범위를 좁혀 정확한 검색 목적을 달성합니다.

3. 효율성 검색

검색 효율성은 검색 시스템 (또는 도구) 을 사용하여 검색 서비스를 수행할 때 효과적인 결과입니다. 검색 시스템의 성능을 직접 반영하며 정보 시장에서의 시스템 경쟁력과 사용자의 이익에 영향을 미칩니다. 검색 효율성에는 기술적 효과와 사회경제적 효과의 두 가지 측면이 포함됩니다. 기술적 효과는 주로 시스템의 성능 및 서비스 품질, 시스템이 사용자 정보 요구 사항을 충족하는 정도를 나타냅니다. 사회경제효과는 시스템이 어떻게 사용자의 요구를 경제적으로 만족시켜 사용자나 시스템 자체가 일정한 사회경제적 효과를 얻을 수 있는지를 말한다. 다음은 주로 시스템 기술 효과 평가입니다.

검색시 리콜률과 정확도가 모두 100% 인 것이 가장 좋습니다. 즉, 데이터베이스에서 수집된 모든 관련 문서를 검색하고 검색된 문서는 관련 문서입니다. 하지만 사실 이 지표가 달성하기 어려운 요소가 많아 항상 약간의 오차가 있다. 그런 다음 오차를 평가하는 두 가지 지표, 즉 누락률과 오검률이다.

평가 작업에서 검사율과 정확도는 가장 많이 사용되며 동시에 사용해야 합니다. 그렇지 않으면 검색 시스템의 기능과 검색 결과의 효율성을 반영하기 어렵습니다. 정확도와 검사율의 결합은 시스템의 검색 성공률, 검사율, 검사율 간의 상호 관계를 설명합니다. 즉, 검사율이 증가하고, 검사율이 낮아지며, 그 반대의 경우도 마찬가지입니다. 컴퓨터 검색에서 일반적으로 정확도는 60-70%, 검사율은 40-60% 로 간주됩니다.

시스템의 범위, 색인 언어, 색인 및 검색은 모두 조사율 및 정확도에 영향을 미치는 요소이며 여기서는 자세히 설명하지 않습니다.

4. 검색 효율성 향상을위한 조치

(1) 문서 라이브러리의 편집 품질을 향상시켜 컬렉션 범위를 더욱 포괄적으로 만들고 해당 분야 또는 전문 요구 사항을 충족하며 설명 내용을 보다 상세하고 정확하게 설명합니다.

(2) 색인의 질을 향상시키고, 색인 앞뒤가 일치하고, 단어가 적절하고, 조합이 합리적이며, 주제를 정확하게 밝히기 위해 노력해야 한다. 주제를 충분히 반영하고, 표준을 빠뜨리지 않는다. 로고를 간결하게 사용하고 표준을 남용하지 마십시오.

(3) 색인 언어의 특이성과 시소러스의 질을 높이다. 색인 어휘의 통제를 강화하고, 서사표의 구조와 그 인용 관계를 개선하여, 색인 언어가 민족 색인과 특색 검색에 도움이 되도록 한다. 어휘 구조는 완벽해야 하고, 단어와 단어 사이의 관계는 정확해야 하며, 동의어, 다의어는 정확해야 하며, 새로운 학과, 신기술의 용어는 제때에 구현되어야 한다.

(4) 검색인의 업무 수준과 능력을 향상시키고, 데이터베이스에 수록된 내용을 이해하고, 시소러스 구조에 대한 이해를 깊게하고, 올바른 주제 분석을 하고, 적합한 검색어를 선택하고, 주제 내용을 표현하는 적절한 검색어를 선택하고, 적절한 논리적 조합을 수행하고, 최적의 검색 방법을 찾아 최적의 검색 전략을 개발합니다.

(5) 리콜 비율과 정확도를 조정합니다.

실제 검색에서는 검색 요구 사항에 따라 검색 결과와 검색 요구 사항을 극대화하도록 전체 비율과 정확도를 합리적으로 조정할 수 있습니다. 실제 검색에서, 때로는 조사율이 매우 높으며, 관련 문헌을 빠뜨리지 않기를 바라며, 정확도는 더 낮아질 것이다. 가끔은 그냥 새로운 중요 한 문장, 전부는 아니지만 찾아보기 해야 합니다. 여기서, 너는 더 높은 정확도와 낮은 리콜률이 필요하다. 결론적으로, 검색 과정에서 최적의 검색 결과를 얻기 위해 전체 비율과 정확도를 합리적으로 조정해야 한다.