198 1 년, 우한 대학 등은' 신화사전' 어집 내 어근 빈도에 대한 통계 결과를 발표했다. 65438-0984 년 국가문자개혁위원회와 우한 대학은' 사직' 범위 내에서 한자 획, 부품, 구조 동적 통계 분석 결과를 발표했다.
1985 년 국가문자개혁위원회와 산서대는 인간 성씨의 글자샘플통계 분석 결과를 발표했다.
1986 베이징항공우주대학과 신화통신은 컴퓨터 기술을 이용해 대형 코퍼스 기반 한자 사용 빈도와 유통빈도에 대한 새로운 통계를 발표했다. 북경 사범대학, 상해 교통대학, 베이징 어학원 등. 대규모 코퍼스를 기반으로 한 현대 중국어 어휘 사용 빈도 통계를 각각 발표했다. 베이징대학교 컴퓨터언어연구소는 중국어 문법을 중심으로 포괄적이고 상세하며 편리한 중국어 코퍼스와 단어 속성 데이터베이스도 구축해 한자 코딩 키보드 입력 기술의 발전에 중요한 역할을 했다.
90 년대 이후 발표된 한자 키보드 입력 시스템 관련 국가 표준은 GB 13000. 1' 정보기술 8 자리 인코딩 문자 (UCS)', GB 18030' 정보기술 정보 GB 15834 "문장 부호 사용" 및 GB/T 18220-2000 "정보 기술 일반 키보드 한자 입력 일반 요구 사항" 이 곧 출판될 예정입니다. 어위가 발표한 규격은 GF300 1' 정보 처리 GB 13000. 1 한자 부품 규격', GF3002' GB/KLOC-0' 이다.
다음은 1 세대 입력기 에서 마이크로소프트 입력기 에 이르기까지 몇 가지 소개 입니다.
1 세대 한자 코딩 입력기
전자공업부 제 6 원은 1983 년 첫 중국어 디스크 운영 체제인 CC-DOS 를 공식 발표해 중국어 정보 처리사에서 획기적인 의미를 지녔다. CC-DOS 는 PC-DOS 의 확장 및 수정입니다. 널리 사용되는 CC-DOS 2. 1 버전에서는 간단한 철자, 접두어 접미어, 빠른 코드, 위치 코드 입력기 등이 있으며, 이미 음코드, 형식 코드, 음코드, 디지털 코드를 포함한 주요 입력기 유형을 포괄하여 우리나라 컴퓨터 어플리케이션의 보급에 획기적인 역할을 했다.
당시 가장 널리 사용된 입력기 중 하나는 간결합과 이니셜, 운모 코드였다. 간결은 전체 철자와 이중 철자 사이의 병음 방법을 사용하여 모음을 3 개 이상의 글자로 압축하는 순음코드입니다. 접두어 접미어 코드는 97 개 부분으로 구성된 순수 쉐이프 코드이며 52 개 범주로 나뉩니다. 부품과 키보드 문자 간의 매핑은 따라야 할 규칙이 별로 없고 메모리가 크다. 인코딩할 때 접두어와 접미어는 하나의 성분만 취합니다. 나열되지 않은 변형 어셈블리의 경우 사용자가 자신이 속한 키 비트를 추측해야 합니다. 두 방법 모두 연관이나 구를 지원하지 않으며 많은 중복 코드가 있습니다. 따라서 입력할 때 선택 및 페이지 넘기기 작업이 매우 빈번합니다. 눈은 끊임없이 프롬프트 라인을 스캔해야 많은 무거운 코드에서 필요한 단어를 찾을 수 있습니다. 입력이 피곤하고 속도가 느리며 맹타를 실현할 수 없습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 입력명언)
속코드는 병음 가코드를 압축하여 이뤄지며, 어느 정도 중코드를 분산시킬 수 있다. 퀵 코드 인코딩 방식이 규칙적이지 않아 실제 적용이 되지 않았다. 위치코드는 6763 자의 한자와 부호를 기억하는 숫자 코드를 통해 완전히 입력해야 하기 때문에 당시 다른 입력 방식이 없었던 구두점을 제외하고는 아무도 사용하지 않았다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 위치명언)
또 다른 초기 한자 코딩 입력기 전신 코드입니다. 전신코드는 4 자리 등장코드 체계로, 0000 ~ 9999 범위의 코드를 사용하며 10000 자 (한자, 글자, 기호 포함) 를 나타낼 수 있습니다. 전보 코드에는 무거운 코드가 없지만, 코드의 규칙성이 강하지 않아 기억하기 어렵다. 따라서 우편 및 통신 부서가 이미 전신 코드에 익숙한 사람들의 요구를 위해 컴퓨터에 이식한 것으로, 일반 한자 입력자에게는 아무런 의미가 없다.
1986, Lenovo 그룹과 Lenovo 한카는 Lenovo 한자 환경을 동시에 선보였다. 처음에는 연상법으로 한자의 입력을 가속화했다. 당시에는 아직 어구 입력기 () 가 없었고, 연상 기술은 사람들의 눈과 귀를 상쾌하게 했다. 한자 입력 과정이 원래 인코딩에서->; 페이지 넘기기-> 선택-> 암호 ... 코드로 변경-> 선택-> 선택 ... 그래서 나중에 많은 입력기 들이 이 기술을 채택했다. 하지만 현대한자 인코딩 입력 기술의 기준에 따르면 레노버 기술에는 두 가지 치명적인 약점이 있다. 한 가지 단점은 뒤에 입력할 단어와 이전에 입력한 단어가 하나의 구를 구성할 수 없는 경우 연관이 실패한다는 것입니다. 또 다른 약점은 Lenovo 선택형 중 인간-컴퓨터 상호 작용이 너무 빈번하다는 것이다. 평균 야드 길이가 짧아졌지만 실제 입력 속도는 떨어질 것이다.
간단히 말해서, 1 세대 한자 인코딩 입력기 특징은 DOS 환경에서 단어 단위로 입력하고, 화면 아래에 특수한 프롬프트 행을 제공하고, 대량의 중복 단어를 표시하여 잦은 페이지 넘기기와 선택 작업을 발생시키는 것입니다. 숫자 키를 사용하여 반복 단어를 선택하고 ALT+ 숫자 키를 사용하여 선택 프롬프트 행에 나타나는 반복 단어를 반복합니다. 매우 일반적으로 사용되는 구두점의 입력조차도 위치 지정 코드를 사용해야 합니다. 매우 불편합니다. Lenovo 기술의 채택은 입력 효율을 높였지만, 그 역할은 상당히 제한적이었다. 복합 기능 키인 ALT+Fn(F 1-F 12) 을 통해 다양한 입력기 간 전환 (영어로의 전환 포함); 전각 및 반각 모드는 지원되지만 중국어 구두점은 지원되지 않습니다. 구 입력이나 사용자 정의 구는 지원되지 않습니다.
2 세대 한자 코딩 입력기
1986 년 사통회사와 삼정물산주식회사가 합작하여 4 통 MS-2400 중국어 전자타자기를 내놓으며 중국 전문 전자타이핑 시대가 도래했다고 발표했다. 4 방향 타자기가 널리 사용됨에 따라 4 방향 타자기에 묶여있는 5 자 모양의 입력기 (5 자) 가 먼저 전파된 뒤 유위민이 발명한 4 방향 타자기에 묶인 이중음 입력기 (2 음) 도 당시 널리 사용되고 있다.
오피서체는 가장 전형적인 순수 코드 구성 요소 클래스 구성이다. 오피서체에서는 부품을 흔히 자근이라고 부른다. 오피서체는 130 기본 옆을 사용합니다. 기본 편변은 획에 따라 5 가지 범주로 나뉘는데, 일반 키보드의 5 개 영역에 해당합니다. 각 범주는 각각 키보드 문자에 해당하는 5 개의 그룹으로 나뉩니다. 한자에서 루트와 루트 사이의 관계는 단일 루트, 분산 루트, 루트 연결 및 교차 루트의 네 가지 유형으로 나눌 수 있습니다. 한자를 분할할 때는' 대주, 직관을 겸비하고, 접할 수 있고, 흩어지지 않을 수 있다' 는 원칙을 따라야 한다. 오피서고는 한자를 키명 한자, 어근 한자, 키가 아닌 한자 등 세 가지 유형으로 나누어 각각 다른 인코딩 규칙을 적용한다. 또한 단어 코드에는 1, 2, 3 급 단축 코드가 있으며 전체 코드의 처음, 2, 3 자로 구성됩니다. 오피서체는 구를 두 글자, 세 글자, 여러 글자의 세 가지 유형으로 나누었다. 두 단어는 각 단어의 처음 두 개의 루트를 순서대로 취하여 인코딩한다. 세 단어는 처음 두 단어의 첫 번째 루트와 마지막 단어의 처음 두 개의 루트 코드를 순서대로 취합니다. 여러 단어는 첫 번째, 두 번째, 세 번째, 마지막 단어의 첫 번째 루트를 순서대로 인코딩합니다.
오피서체는 GB23 12-80 문자 세트의 낮은 반복률과 교환하기 위해 매우 복잡한 코딩 규칙을 가지고 있다. 강제 단축 코드를 사용하면 낮은 중코드율을 더 낮출 수 있습니다. 구문 코드를 모든 코드의 나머지 인코딩 공간에 배치하여 혼합 문자 인코딩을 구현합니다. 수록된 어구의 수가 크지 않으면 중복될 가능성이 비교적 적다. 일반 오피서체 자체는 조자 기능이 없다. 오피서체의 이러한 특징들은 마침 전문 타자의 요구를 만족시켰으며, 또한 전문 타자 시대에 큰 인기를 끌었던 중요한 이유 중 하나가 되었다.
오피서체가 시장에서 큰 성공을 거두었지만, 그 존재의 문제도 간과해서는 안 된다. 우선, 오피서체는 배우기 어렵고 잊기 쉽다. 복잡한 코딩 규칙 외에도 기억해야 할 많은 예외가 있습니다. 오필타자수가 타자를 칠 때 자주 쓰는 글자에 끼는 것은 매우 흔하다. 이때 일시적으로 병음 입력기 로 전환해야 한다. 둘째, 오피서체의 확장성이 떨어진다. 문자 세트가 GB23 12-80 에서 GBK 및 GB1 오피서체는 4 야드 자동 스크린 전략을 채택하여 무거운 코드가 없다. 4 야드 무거운 코드의 증가는 타이피스트가 원고에서 눈을 떼고 그들의 입력을 확인하도록 강요함으로써 입력 속도를 줄였다. 마지막으로, 오피서체의 가장 치명적인 약점은 그 나쁜 표준화이다. 장효존 등은 이에 대해 격렬한 비판을 제기했다. "오피서체는 언어문자의 규범을 위반했다. 한자의 구분에는 큰 임의성이 있어 국민의 기본 문화 자질에 부정적인 영향을 미친다. 한자 교육을 규범화하는 데 미치는 영향은 적용 범위의 확대에 비례한다 [20]. "
더블 톤 입력기 영리한 순수 톤 코드입니다 [23][25]. 쌍음 입력기 의 가장 큰 특징 은' 어정어, 역연상' 으로 순음 코드 모드 에서 단어 중복 을 완화하는 문제 이다. 두 글자의 수가 비교적 많기 때문에, 보통 항상 한 두 글자를 찾을 수 있는데, 그것의 첫 글자는 바로 네가 입력하려는 글자이다. 이 두 단어가 프롬프트 행의 첫 번째 후보 위치에 있는 경우 선택 키를 생략할 수 있습니다. 그렇지 않으면 숫자 키를 사용하여 선택해야 합니다. 두 단어 전체가 필요한 경우 스페이스 바를 하나 추가하여 두 번째 단어를 입력할 수 있습니다. 즉, 이중 철자를 사용하는 경우 "단어" 기술을 사용하면 일반적으로 사용되는 단어의 입력에서 평균 키 입력 횟수가 2.5 회에 이를 수 있으며, 기존의 병음+Lenovo 모드에서 프롬프트 행 스캔, 페이지 넘기기, 선택 문제를 거의 피할 수 있습니다. 이중음 입력기 중 세 글자와 네 글자에 대해 각 글자의 이니셜을 코드로 입력하고 필요한 경우 공백을 추가합니다. 모르는 단어의 경우 "\" 를 입력하여 "필기 시뮬레이션" 을 호출할 수 있습니다. 이 구를 사용자 정의할 수는 있지만 온라인 단어 형성은 지원하지 않습니다. 단어를 만들 때 외부 문자 편집기를 사용하여 정의된 형식으로 코드와 해당 구를 입력합니다.
쌍음 입력기 은 병음 한자 입력 사상 의 큰 진보 로 당시 많은 비전문 타자수 의 환영 을 받았다. 그러나, 그것은 또한 심각한 결점이 있어서, 그것을 다시 사용하는 사람이 거의 없다. 첫째, 전통적인 병음에 비해 입력 효율성이 크게 향상되었지만, 이후 스마트 ABC 등 문장급 병음 입력기 에 비해 상당한 차이가 있다. 또한 많은 단어들은 "단어로" 할 때 여러 단어에 의해 결정될 수 있지만, 어떤 단어들은 단어를 찾기가 어려워 사용자가 어찌할 바를 느끼지 못하는 경우가 많다. (윌리엄 셰익스피어, 햄릿, 언어명언) 이중 톤 입력기 텍스트 입력 문제를 해결 하기 위해 여러 가지 다른 방법을 제공 하지만. 예를 들어 덩, 곽, 요 등의 성 입력에는 여섯 가지 보조 규칙이 있다. 이 방법들을 기억하고 언제 어떤 방법을 채택할지 판단하는 것은 쉽지 않다. 단어는 오프라인으로만 만들 수 있기 때문에 사용자 정의 구가 불편하다.
제 3 세대 한자 코딩 입력기
90 년대 말, 마이크로컴퓨터 가격이 더욱 하락하면서 저장과 처리능력이 더욱 강화됨에 따라 Windows 그래픽 운영 체제의 보급과 인터넷의 흥흥, 사용자 인터페이스가 매우 우호적이 되고, 마이크로컴퓨터가 대규모로 우리나라 일반인 가정에 진입하여 초중고등학교 교육에 진입하여, 우리나라에서 마이크로컴퓨터의 대폭적인 보급을 실현하였다. (윌리엄 셰익스피어, 마이크로컴퓨터, 마이크로컴퓨터, 마이크로컴퓨터, 마이크로컴퓨터, 마이크로컴퓨터, 마이크로컴퓨터, 마이크로컴퓨터)
마이크로컴퓨터의 보급은 타자를 모든 사람의 기본 기술로 만들어 한자를 쓰는 것과 같다. 누군가 타이핑을 해야 하는 것은 사실 문맹의 표현이다. 마치 누군가 대필을 해야 하는 것과 같다. 이것은 거대한 비전문가 타이피스트 집단을 만들었다. 타이피스트는 직업으로서 빠르게 사라지고 있다. 일반 사용자가 타자를 칠 때의 조작 모드는' 타이핑하고 싶다' 로 전문 타자수의' 블라인드 타자' 모드와는 완전히 다르다. "맹타" 는 운영자가 가능한 한 화면을 적게 볼 것을 요구하며, 입력기 제공 피드백은 운영자가 "맹타" 를 할 수 없을 때 가끔 유용하다. 운영자는 타자를 칠 때 항상 화면을 보고 있다. 입력기 피드백 제공 방식과 피드백 정보의 양은 운영자의 입력 활동에 큰 영향을 미칠 수 있다. Windows 그래픽 운영 체제는 다양한 피드백 정보의 요구를 충족할 수 있는 풍부한 인간-기계 인터페이스를 위한 사전 요구 사항을 제공합니다.
현대 마이크로컴퓨터의 강력한 저장 및 처리 능력은 새로운 저장 집약적이고 처리 집약적인 입력기 탄생을 위한 물질적 기반을 제공합니다. 입력기 프로그램은 더 이상 DOS 시대의 64KB 상주 메모리에 국한되지 않습니다. 기가비트 컴퓨팅 속도를 통해 복잡한 지능형 알고리즘을 가동할 수 있습니다. 하드 드라이브의 용량은 메가바이트에서 기가비트까지 확장할 뿐만 아니라 DOS 시대보다 하드 드라이브에 액세스하는 속도도 크게 향상되었습니다. 방대한 어휘를 하드 드라이브에 저장해서 빨리 찾는 것은 더 이상 문제가 되지 않는다.
초중고등학교에서 컴퓨터 교육을 광범위하게 실시한 후, 학생들은 어려서부터 타자를 배우기 시작했다. 한자 코딩과 언어 교육의 관계가 제기되었다. 최소 요구 사항은 한자 코딩이 언어 지식과 충돌할 수 없다는 것이다. 이상적으로 한자의 코드 입력은 언어 지식의 학습과 결합하여 서로 촉진해야 한다.
이러한 맥락에서, 3 세대 한자 코딩 입력기, 즉 규범, 이학, 사용 편의성, 입력 속도 유지라는 지침이 생겨났다. 이 기간 동안 스마트 병음 입력기 연구의 절정이 겹치면서 획이나 펜 쌍을 입력 단위로 하는 순수 형식 코드와 성모와 획 (또는 펜 쌍) 을 기반으로 한 병음 코드 [29]-[48] 도 나타났다.
(1) 스마트 병음 입력기
스마트 병음 입력기 구현 원리에 따라 이해 기반, 실용적 통계 기반, 템플릿 기반 일치 및 컨텍스트 기반 유형으로 나눌 수 있습니다.
스마트 ABC 는 현재 Windows 운영 체제에서 가장 널리 사용되는 준문장 병음 입력기 중 하나입니다. 이는 전체 문장이 아닌 어구와 구를 변환하기 때문입니다. 스마트 ABC 의 가장 큰 특징은 구를 사용자 정의하고 중복된 단어의 순서를 조정하는 것이 매우 편리하다는 것이다. 사용자는 자신의 생각대로 입력하기만 하면 되고, 입력할 때는 수동 분사를 할 필요가 없다. 시스템은 자동으로 앞에서 뒤로 하나씩 분사합니다. 어구가 없을 경우 중복 단어는 사용자가 선택할 수 있도록 단어 모드로 자동 표시됩니다. 일단 사용자가 새로운 단어를 선택하여 형성하면, 시스템은 그것을 기억할 수 있다. 시스템 분사가 정확하지 않거나 시스템에서 제공한 단어가 사용자가 필요로 하지 않을 때 사용자가 수정할 수 있으며, 시스템은 사용자가 수정한 내용을 기억할 수 있습니다. 오랜 사용 끝에 사용자가 변경되지 않으면 시스템이 사용자의 사용 습관에 점차 적응하여 사용자의 입력 프로세스를 편안하게 합니다.
스마트 ABC 도 개선해야 할 점이 많다. 먼저 입력할 때 전체, 짧은, 혼합 철자를 자유롭게 사용할 수 있으며 가져오기에서 언제든지 음사 변환을 수행할 수 있습니다. 사용자에게 어떤 것이 가장 좋은지 알려주는 방법은 너무 많다. 매우 유연해 보이지만 실제로는 사용자에게 입력을 최적화하는 작업을 제공합니다. 하지만 대부분의 사용자들은 이 분야의 전문가가 아니며, 이 임무를 잘 완수할 수 없어 많은 시행착오나 비효율적인 입력 습관을 초래하고 있다. 둘째, 음자 변환의 정확도가 높지 않고 문장의 변화가 잦아 입력 속도가 좋지 않아 이중 철자를 사용해도 자연코드보다 효율적이지 않다.
Microsoft 병음은 진정한 문장급 음자 변환 스마트 입력기, Microsoft 자연어 처리 기술의 다년간 과학 연구 성과의 결정체입니다. Microsoft 병음은 병음을 한자 입력 방식으로 사용하므로 사용자는 전문적인 학습과 훈련 없이 이러한 한자 입력 기술을 쉽게 사용하고 익힐 수 있습니다. Microsoft 병음은 문장 기반 문장 기반 전체 문장 변환 모드를 사용하여 사용자가 인공 분사와 후보 단어 선택 없이 전체 문장 병음을 연속적으로 입력할 수 있으며, 사용자 사고의 유창성을 보장하고 입력 효율성을 크게 향상시킬 수 있습니다. 마이크로소프트 병음이 제공하는 인간-기계 인터페이스는 매우 특색이 있다. 입력 중인 텍스트의 삽입 커서에 그룹 단어 창을 포함할 수 있어 입력 시 시선의 이동 빈도를 줄이고 입력기 사용 편의성을 크게 높일 수 있습니다. 키별로 변환하고 변환 결과를 묻는 메시지를 표시하므로 변환 시기를 스스로 결정할 필요가 없습니다. 사용자가 입력할 수 있는 코드 길이에는 제한이 없습니다. 시스템 길이가 상한을 초과하거나 마침표를 만나면 자동으로 변환되어 사용자가 계속 입력할 수 있습니다. 마이크로소프트 병음은 어경이 넓기 때문에 높은 전환 정확도를 얻을 수 있다. Microsoft 병음은 기본적으로 사용자가 짧은 철자와 혼합 철자를 입력하는 것을 거부하여 사용자가 좋은 입력 습관을 개발하도록 안내할 수 있습니다.
마이크로소프트 병음에도 몇 가지 문제가 있다. 첫째, 인코딩 입력이 잘못되었거나 변환이 잘못된 경우 문장에서 편집하는 것은 번거롭고 비효율적입니다. 둘째, 키를 바꿀 때 올바르게 변환된 내용은 종종 잘못 수정되고, 사용자는 언제든지 입력 내용의 정확성을 모니터링해야 하며, 변환된 내용이 많은 경우 매우 피곤합니다. 또한 Microsoft 병음은 단어 입력 속도를 높일 수 있는 방법이나 알 수 없는 단어를 입력하는 방법을 제공하지 않는 불완전한 입력기.
획 (또는 펜 쌍) 및/또는 이니셜을 기반으로 한 입력기
획과 성모라는 가장 간단한 한자 특징 정보를 이용하여 입력기 학습 [12] 을 크게 향상시킬 수 있다. 그러나 한자의 획은 일반적으로 다섯 가지로 나뉜다. 획의 종류가 너무 적으면 인코딩 길이가 늘어나 입력 속도에 영향을 줄 수 있습니다. 따라서 코드 길이를 줄이고 입력 효율성을 높이는 방법은 이러한 입력기 성공의 관건이 됩니다.
푸젠 쌍획코드 소프트웨어 개발유한공사가 개발한 쌍획코드는 획을 기반으로 한 순형코드입니다. 획 유형이 너무 적은 문제를 극복하기 위해 새로운 획 유형' 십자형' 이 이중 획 코드에 도입되어 획 유형이 6 개로 확장되었습니다. 코드를 뽑을 때, 두 펜마다 순서대로 펜을 하나씩 취하여 펜 쌍을 형성하고, 36 개의 서로 다른 펜 쌍을 형성하고, 키보드의 해당 키 비트 영역에서 키 비트 입력을 선택할 수 있다. (윌리엄 셰익스피어, 펜, 펜, 펜, 펜, 펜, 펜, 펜) 또한 이중 획 사양은 병자 옆에 있는 코드, "입", "손", "일" 이 전체적으로 이루어져야 한다고 규정하고 있다. 한자의 다른 구조의 조합 모양에 따라 한자는 세 가지 기본 서체, 즉 좌우형, 상하형, 종합형으로 나뉜다. 어떤 한자든 4 야드에 따라 코딩되어 있습니다. 2 야드 구를 입력하는 방법은 각 단어의 처음 두 코드를 두 단어로 입력하는 것입니다. 세 글자는 처음 두 글자의 접두어와 끝 코드를 입력하고, 네 글자 이상은 첫 번째, 두, 세, 마지막 글자의 접두어를 입력합니다.
2 펜 코드의 장점은 기존 부품 입력기 대비 메모리가 많이 줄어든다는 것입니다. 펜 쌍과 36 키로 인코딩된 평균 코드 길이도 상당히 짧습니다. 펜 쌍을 누르지 않고 단일 획을 누르면 이중 펜 코드를 숫자 키보드로 쉽게 이식할 수 있습니다. 그러나 이중 스트로크 코드의 단점도 분명합니다. 획 입력기, 코드 및 코딩 규칙은 복잡하고 예외가 많으며 배우기가 여전히 어렵습니다. 위쪽 숫자 키는 인코딩에 사용되며 두드리기가 불편하며 일반적으로 사용되는 숫자 입력과 충돌하여 실제 입력 속도에 영향을 줍니다.
진강송 씨가 발명한 두 편의 입력기 () 는 현재 널리 사용되고 있는 입력기 중 하나이다. 이니셜과 획을 기반으로 한 입력기, 또는 간단한 획 기반 입력입니다. 두 개의 입력기 30 개의 인코딩된 문자는 일반 키보드의 6 개 영역, 즉 5 개의 이중 펜 영역과 1 단일 펜 영역에 분산되어 있습니다. 이중 또는 단일 획의 두 번째 획에 따라 가로, 세로, 왼쪽, 점, 접힘 순서로 영역을 배치합니다. 하지만 부수를 설정하는 10 키는 기억이 필요합니다. 두 입력기 글자는 서체 구조에 따라 한자를 단어와 조합자로 나눈다. 한자를 입력할 때, 1 야드는 한어병음의 첫 글자를 취하고, 획은 2 야드, 최대 4 야드를 취한다. 4 야드 미만이면 모두 빼야 합니다. 만약 두 번 그릴 수 없다면, 한 번 그어야 한다. 전문 저서는 분할할 필요가 없다. 1 야드는 병음 이니셜을 취하고, 2 야드는 획 순서에 따라 획 코드를 최대 4 야드까지 취한다. 조합된 한자는 둘로 나뉜다. 한자 필순의 규칙에 따르면 첫 번째 부분은 전반부, 두 번째 부분은 후반부이다. 첫 번째 야드는 병음 이니셜을 취하고, 두 번째 야드 앞부분은 첫 번째, 두 번째, 세 번째 야드 후반은 첫 번째, 두 번째, 네 번째 야드 후반은 세 번째, 네 번째 펜을 취한다. 두 개의 입력기 어구의 코딩 규칙은 두 단어가 각 단어의 처음 두 코드를 취하고, 세 단어가 첫 번째 단어의 처음 두 코드와 마지막 두 단어의 처음 두 코드를 취하고, 네 개 이상의 단어가 처음 세 코드와 마지막 두 코드를 취한다는 것이다.
두 개의 입력기 장점은 코딩 규칙이 두 개의 코드보다 간단하고 30 개의 인코딩 문자만 사용한다는 것입니다. 이니셜과 획이라는 한자 특징 정보 인코딩을 통해 동호어에 대한 인식 능력을 높이고 입력 효율을 높였다. 모르는 단어의 경우 전각 입력도 가능합니다. 펜 쌍을 누르지 않고 단일 획을 누르면 숫자 키보드에 쉽게 이식할 수 있습니다. 그러나, 두 펜 입력기 여전히 몇 가지 문제가 있다: 펜 쌍과 편측부 사용 때문에, 단어와 조합자를 구별하여 서로 다른 코딩을 해야 하기 때문에, 학습과 사용은 여전히 어렵다.
숫자 키패드 코딩 입력기
지금까지 우리나라의 휴대전화 보유량은 이미 3 억 대를 넘어섰고, 휴대전화 문자메시지 생산액은 50 억 원을 넘어섰다. 휴대전화 사용자 수는 이미 PC 사용자를 초과했고, 휴대전화로 한자를 입력하는 사람은 범용 키보드로 한자를 입력하는 사람보다 훨씬 많다.
현재 미국 특걸사의 T9 병음과 T9 획 입력기, 캐나다 자원사의 단어는 입력기, 모토로라의 iTap 입력기, 중국 본토와 항구대 지역의 휴대폰 입력기 시장을 독점하고 있다. 그러나 외국의 휴대전화 디지털 키보드 입력기 는 오히려 만족스럽지 못하다. 획 입력을 예로 들면, iTap 는 9 펜, 문자는 8 펜, T9 는 5 펜을 사용할 수 있다. 같은 획으로 휴대폰마다 다른 위치에 놓을 수 있어 입력 속도가 좋지 않다.
외국 휴대전화 입력기 독점 중국 휴대전화 시장을 타파하기 위해 휴대전화 입력기 비표준 어색한 국면. 중국중국어정보학회가 주최하고, 김코드출판사 (홍콩) 유한공사가 주최하는 제 1 회 중국 휴대전화 중국어 입력 대회 및 한자 디지털 입력 기술 응용최고봉 포럼은 2004 년 6 월 5438+065438+ 10 월 2 1 일 인민대회당에서 3 일간 열렸다 32 개 팀 중 23 개 팀이 아날로그 휴대전화 한자 디지털 코드 입력 대회에 참가했고, 9 개 팀이 휴대전화 한자 입력 대회에 참가했다. 이미 출전한 디지털 코딩 방안 외에도 왕영민 씨의 다섯 개의 디지털 스트로크 [49] 와 정 선생의 좌우 디지털 스트로크 [50] 가 더욱 주목받고 있다. 다음은 가장 널리 사용되는 T9 병음과 T9 획과 제 1 회 휴대전화 중국어 입력 대회에서 우승한 금코드와 유행코드만 소개한다.
본질적으로, T9 병음은 초기의 전합 전연상의 범용 키보드 입력 기술이다. 가장 중요한 혁신은 휴대전화 키보드의 키 조합에 따라 합법적인 표준어 음절로 조합될 수 있는지 여부를 판단할 수 있어 전통적인 여러 번의 키 입력으로 병음 글자를 입력하는 폐단을 피할 수 있다는 점이다. 그러나 키 조합이 여러 개의 합법적인 표준어 음절에 적용되고 기본 표준어 음절이 사용자가 원하는 것이 아닌 경우에도 사용자가 수동으로 선택해야 합니다. 또한 긴 스펠링, 1 키를 눌러야 선택 상태로 들어가고 Lenovo 로 인한 과도한 인간 상호 작용으로 인해 T9 병음의 입력 효율성이 매우 낮아 표준어가 좋지 않은 사람들에게는 매우 어렵다.
T9 획은 가로, 세로, 아포스트로피, 점, 접힘 5 범주로 나뉘며 각각 1, 2, 3, 4, 5 로 표시됩니다. 한자를 기록할 때, 필순입력, 하나의 힌트, 화면당 몇 개, 고주파가 우선한다. 최대 입력 12 펜, Lenovo 지원. 5 개의 키를 사용하여 각각 5 개의 획을 나타내므로 T9 병음처럼 조합을 지능적으로 판단할 필요가 없습니다. 내부 처리 논리는 매우 간단합니다. T9 획은 길이가 다른 풍부한 획 정보와 짧은 코드 비트를 최대한 활용하므로 반복 코드를 직접 선택할 수 있으므로 실제 입력 효율이 T9 병음보다 높습니다.
인기 있는 디지털 코드 [5 1] 는 10 개의 숫자로 단어를 인코딩합니다. 1, 2,3,4,5 로 각각 5 개의 획을 나타내는 것 외에도 6,7,8,9,0 으로 교신, 삽입, 8, 작은, 입 5 종 부품을 나타낸다. 단어는 획 순서에 따라 1, 2, 3, 4, 4, 5 야드를 취하고, 부족할 때는 실제 코드 길이를 취하고, 구코드 길이는 6 자리이다. 인기 있는 디지털 코드는 획의 상당 부분을 부품으로 사용하지만, 분류가 분명하기 때문에 많은 동종 입력기 보다 기억하기 쉬우며, 세밀한 코딩 규칙은 반복률을 낮춰 경쟁에서 눈에 띄도록 한다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) 그러나, 그것은 많은 구성 요소를 사용 하 고, 코딩 규칙은 간단 하지 않습니다, 학습은 여전히 매우 어렵습니다 주목할 필요가 있다.
금색 코드는 9 자리 숫자로 단어를 인코딩합니다. 1, 2, 3, 4, 5 로 각각 5 펜을 나타내는 것 외에도 6, 7, 8, 9 로 입, 10, 8, 4 가지 부품을 나타냅니다. 인코딩 시간대는 접두사와 접미사로 구분되며 단일 문자와 조합 문자의 차이도 구별됩니다. 프롬프트 행이 비어 있지 않을 때 0, * 및 # 이 선택 키로 사용됩니다. 김코드의 가장 큰 특징은 인코딩에 사용된 숫자와 입력 코드가 다른 코드를 형성할 수 없을 때 숫자 키로 같은 코드의 단어를 선택할 수 있어 입력기 키 선택 능력이 크게 향상되어 동적 평균 코드 길이를 줄일 수 있다는 것입니다. 주파수가 높은 예측된 다양한 길이의 코드와 함께 입력 시 페이지를 넘기지 않아도 되므로 입력 효율성이 더욱 향상됩니다. 그러나 접두사와 접미사를 구분하는 기준은 종종 사람마다 다르다. 나머지 인코딩 키를 동적으로 사용하여 무거운 단어를 선택하면 선택 키의 위치가 너무 많이 변경되어 인간-컴퓨터 상호 작용의 부담이 가중됩니다.
이상은 내가 컴퓨터 일에 종사한 이래 접한 비교적 익숙한 입력기 들이다. 나는 그들이 너를 도울 수 있는지 알고 싶다.