CNKI 중복 검사의 원리는 주로 텍스트 비교와 장별 감지의 두 부분으로 구성됩니다.
텍스트 비교: CNKI의 중복 검사 시스템은 논문의 텍스트와 데이터베이스의 문서를 비교하여 유사성 탐지를 수행합니다. 이 과정에서 시스템은 논문의 텍스트 내용을 식별한 다음 이를 데이터베이스의 문헌과 비교합니다. 유사성이 특정 임계값을 초과하는 것으로 확인되면 해당 콘텐츠 부분은 중복으로 판단됩니다.
장별 감지: CNKI의 중복 검사 시스템은 논문의 장을 기준으로 장별 감지도 수행합니다. 논문의 각 장의 내용을 개별적으로 비교하고 각 장의 반복률을 계산합니다. 마지막으로, 이러한 장의 반복 속도에 가중치를 부여하고 평균을 내어 전체 논문의 최종 반복 속도에 도달합니다.
또한 CNKI의 중복 검사 시스템은 텍스트 유사성을 감지할 때 문장과 단락의 구조와 의미도 고려합니다. 문장에 다른 문헌에서 인용된 내용이 다수 포함되어 있는 경우에는 적절한 인용 주석을 달아도 중복으로 판단됩니다.
CNKI 중복 검사 시스템은 텍스트 유사성을 감지할 때 완전히 정확하지 않다는 점에 유의해야 합니다. 예를 들어, 그림, 표, 수식 등과 같은 텍스트가 아닌 콘텐츠를 인식할 수 없으며 참조 내용도 인식할 수 없습니다. 또한 문헌마다 인용방법이나 언어 표현의 차이로 인해 오판이 발생하는 경우도 있다. 따라서 CNKI 중복검사 시스템을 이용할 때에는 자신의 논문 내용과 실제 상황을 토대로 판단과 과정을 진행해야 합니다.