WordNet 의 미성숙에 대한 생각은 20 여 년 전으로 거슬러 올라갈 수 있다. 1985 이후에야 생각이 점차 구체화되고 명료해지기 시작했다. 1985 년 이후 WordNet 은 지식 프로젝트로서 이미 본격적으로 전개되고 있다. 하지만 당시 WordNet 과 10 년이 지난 오늘날의 WordNet 은 이미 크게 달라졌다.
이 프로젝트의 초기 전제 조건 중 하나는' 분리성 가설' 이다. 즉, 한 언어의 어휘 성분을 분리해 특별히 연구할 수 있다는 것이다. 사전 편찬의 역사는 어휘 수준에서 유용한 연구 성과를 얻을 수 있다는 것을 분명히 알려 준다. 어휘는 물론 다른 언어 성분과는 완전히 독립적이지는 않지만, 다른 성분에서 분리할 수 있다. 예를 들어, 음성과 문법 지식은 초기 생활에서 형성되었지만, 지적 활동이 축적됨에 따라 어휘량이 증가할 수 있습니다. 이것은 언어의 다른 성분이 다른 인지 과정을 포함한다는 것을 보여준다.
또 다른 전제는' 패턴 가설' 이다. 한 사람이 한 언어를 사용하는 데 필요한 모든 단어를 파악할 수 없다. 그가 시스템의 패턴과 의미 사이의 관계를 이용할 수 없다면. 적어도 플라톤 시대부터 이런 시스템의 정신 모델은 일종의 사변적인 지식이었고, 현대언어학 연구는 이미 자연언어의 의미 구조에서 이런 모델을 확정하기 시작했다. 그러나, 이 노선을 따르는 많은 우수한 연구작업이 이 문제에 어려움을 겪었다. 한 작가는 의미 이론을 제시하고, 20 개에서 50 개의 영어 단어를 예로 들어 그의 이론을 보여주고, 독자가 실천할 수 있도록 654.38+ 백만 개의 단어를 남겨 둘 수 있다.
세 번째 전제는 소위' 전면적인 가정' 이다. 전산언어학은 인간처럼 자연어를 다루려면 가능한 많은 어휘지식을 저장해야 한다.
어의설명이 포함된 대규모 서사표를 만드는 방법 중 하나는 의미성분분석 (의소분석으로도 번역될 수 있음) 을 기반으로 한 성분어휘 의미론법이다. 이렇게 한 단어의 의미는 더 작은 개념 원자의 조합으로 분석된다. 그러나 개념 원자 세트를 정의하는 것은 쉽지 않습니다. 사실 조지. WordNet 감독 A.Miller 는 1976 년 Philip N. Johnson-Laird 와 합작한' 언어와 지각' 에서도 의소 분석의 의미 설명 방법을 탐구했지만/Kloc-까지
1985 까지 많은 인지심리학자와 계산언어학자들이' 인터넷' 형식으로 단어의 의미를 묘사하기 시작했다. 예를 들어, "테이블" 과 "가구" 는 두 개의 노드를 나타냅니다. 이 두 노드 사이에는 테이블이 가구의 명제, 즉 "예-하나-"의 의미 관계라는 표창이 있습니다. 이 방면의 연구가 늘어남에 따라 점점 더 많은 사람들이 의미성분 (의소 분석) 뿐만 아니라 관계도 의미 (관계어 의미학) 를 표현하는 데 사용될 수 있으며, 후자는 전자를 대체할 수 있다는 것을 의식적으로 인식하고 있다.
WordNet 초기에 연구원들은 단순히 장난감 프레젠테이션의 수준에 머물지 않고 관계 의미가 광범위하게 적용될 수 있을지에 대해 주로 고려했다. (윌리엄 셰익스피어, 윈스턴, Northern Exposure (미국 TV 드라마), 예술명언) 연구원들이 이것이 가능하다고 확신하자, 그들은 앱을 작성하여 생각을 현실로 만들었다. 사실, 초기에 밀러는 대형 어휘를 만드는 것에 대한 완전한 생각을 가지고 있지 않았다. 초기 아이디어는 문자열로 구성된 가장 중요한 단어 노드를 식별하고 그 사이의 의미 관계 모델을 탐색하는 것입니다. 당시 생각은 정확한 의미 관계 모델을 얻으면 단어의 정의를 추론할 수 있다는 것이었다. 따라서 의미의 의미에 관한 관계 네트워크에는 의미의 정의가 불필요하다.
1978 에서 밀러는' 자동사전' 의 생각을 묘사했다. 그러나 당시 그는 이 생각을 어떻게 실현해야 할지 전혀 몰랐다. 밀러는 슬로언 재단, 스펜서 재단, IBM 의 왓슨 연구센터의 지원 덕분에 중도에 포기하지 않고 자신의 생각을 유지할 수 있었다. 밀러는 1984 까지 IBM PC 에' 단어망' 이라는 45 개 명사의 작은 의미망을 만들기까지 했다. 밀러는 IBM 과 Bellcore 에서 이 성과를 선보였다. Bellcore 에 있는 그의 친구 Lance Miller, Roy Byrd, Michael Lesk, Donald Walker, Robert Amsler, Stephen Hanson 은 그가 계속하도록 격려하고 실용적인 기술 지침을 많이 주었다.
Lesk 는 Miller 를 6 월 캐나다 워털루 대학교 뉴옥스포드 영어사전센터 첫 회의 1985 1 1 에 초청했다. 밀러는 논문을 제출했다. 그 논문에서 Miller 는 우리가 동의어 집합을 사용하여 어휘 개념을 표현하고, 어휘 행렬을 묘사하며, 즉 단어의 형식과 의미 사이에 매핑 관계를 만들 수 있다는 사상을 설명했다. (윌리엄 셰익스피어, 윈프리, 독서명언) (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 언어명언) 사실, 이것은 WordNet 개발에서 연구를 지도하는 주요 사상이다.
그러나 아마도 밀러가 그 회의에서 보고서에 소개한 관점은 여전히 2 위일 것이며, 보고서의 제목은 더욱 의미가 있을 것이다. 이 제목은 Lesk 가 제시한' WordNet: 사전 브라우저' 입니다. WordNet: 사전 브라우저. 여기서 WordNet 은 기계가 읽을 수 있는 사전의 보조 도구인 사전 브라우저로 간주됩니다. 그러나 이런 기계사전은 전통적으로 알파벳순으로 정렬하는 것이 아니라 의미에 따라 정렬하는 것이다.
즉, WordNet 이 처음 규모를 갖추었을 때 밀러와 같은 생각을 가진 동료들이 프린스턴에서 인지 연구 프로젝트를 공동으로 시작했습니다. 리처드 칼린포드는 1983 부터 1985 까지 프린스턴을 방문했다. 그, 길버트 헤르만, 밀러는 교무장인 닐 루던스틴에게 마이크로컴퓨터를 제공하도록 설득했다. 이 컴퓨터는 프린스턴 인지과학연구소의 핵심이 되었다. 이러한 설비로 밀러는 해군 연구실의 수잔 치프먼을 설득하여 그들과 계약을 체결하고 WordNet 을 개발하도록 설득했다. 콜린포드와 밀러는 육군 연구소에서 어휘 의미의 계산 이론을 개발하는 계약을 받았다. 1986 년 3 월 제임스 S 맥도널드 재단은 프린스턴 대학에 인지과학 연구를 지원하기 위해 아낌없이 기부했다. Marie Bienkowski(Cullingford 대학원생) 와 숙련된 컴퓨터 전문가는 1985 부터 우리와 함께 일했고, 곧 그들은 우리가 필요로 하는 소프트웨어를 내놓았다. 이에 따라 WordNet 은 프린스턴에 새로 설립된 인지과학연구소의 몇 가지 연구 프로젝트 중 하나가 되어 실제로 운영되기 시작했다.
WordNet 을 만드는 데 사용되는 가장 중요한 프로그램은 이른바 Grinder 프로그램이다. Bienkowski 는 1986 년 LISP 언어로 Grinder 의 첫 번째 버전을 작성했습니다. 댄 테벨은 1987 에서 C 언어로 이 프로그램을 다시 썼다. 안토니오 로메로는 1989 에서 다시 한 번 다시 썼다. Randee Tengi 는 199 1 부터 이러한 모든 프로그램 버전을 관리합니다.
WordNet 의 단어는 다른 곳에서 온 것이다. 브라운 코퍼스, 로렌스 에든의' 동의어 및 반의어 사전' (1978), 에단이 개정된' 로데일 동의어 사전' (1978), 로버트 채프먼의'; 1986 하반기에 밀러는 해군연구개발센터의 Fred Chang 으로부터 용어집을 얻었다. Miller 는 Chang 의 어휘를 WordNet 의 기존 용어와 비교했습니다. 실망스러운 결과는 15% 의 겹치는 단어였기 때문에 Miller 는 Chang 의 어휘를 WordNet 에 추가했습니다. 1993 년 밀러는 뉴욕대 Ralph Grishman 과 그의 동료들의 39 143 단어의 용어집을 얻었고, 실제로 유명한 COMLEX 사전에 수록됐다. 이 비교 결과 WordNet 에는 COMLEX 의 단어 74% 만 포함되어 있습니다. 그래서 밀러는 이 단어를 WordNet 에 추가했다.
어휘량이 증가함에 따라 조직 업무에 대한 압력이 증가하기 시작했다. 첫 번째 단계는 구문 범주로 구별하는 것입니다. 명사, 동사, 형용사를 저장하기 위해 다른 파일을 만들었습니다 (부사는 1992 뒤에 추가됨). 그러나 각 구문 범주의 단어는 여전히 너무 많아서 더 이상 분류하지 않으면 파악하기 어렵다. 명사는 가장 심각한 문제이다, 왜냐하면 그것들은 개방된 어류이기 때문이다.
1987 년 봄 필립 N 존슨 라일드 (Philip N. Johnson-Laird) 가 영국 케임브리지 응용심리학연구소에서 프린스턴 대학을 방문했다. 그는 WordNet 이 형용사를 구별하여 다른 명사를 수식할 때 의미의 변화를 구분하는 수단이 부족하다는 것을 발견했다. 그는 266 쌍의 반의어 형용사 (당시 WordNet 에 포함) 를 사용하여 수식명사의 적합성에 따라 명사를 분류했다. 그 결과 총 25 개의 명사류가 얻어졌다. 이 작은 클래스들은 명사의 기본 분류를 구성한다. 또한 이러한 여러 하위 클래스의 명사는 서로 다른 개별 문서로 나뉘어 서로 다른 연구자들에게 개별적으로 처리되어 WordNet 의 엔지니어링 발전을 촉진했습니다.
1987 년 여름, Christiane Fellbaum 은 연구팀에 합류하여 동사의 하위 분류 작업을 맡았다.
설명적인 형용사, Kitty Miller 는 처음부터 하나의 큰 부류로, 하위 분류가 없고, 이 모든 형용사들도 하나의 거대한 문서에 보존되어 있다.
Wordnet 은 간단한 사전 브라우저에서 자체 통합 어휘 데이터베이스로 발전했으며, 주요 발전은 1989 로 시작되었습니다. 당시 SusanChipman 은 WordNet 이 단지 어휘 브라우저로만 만족하지 않아 연구팀에 도구 개발을 요구했다. 이 도구는 WordNet 기반 텍스트를 읽고 텍스트의 단어에 대한 다양한 정보를 보고합니다. 이 도구를 단어 필터라고 합니다. 소설 문서에서 생소한 글자나 필요 없는 글자를 걸러내고, 그 글자들을 좀 더 흔한 글자로 대체할 수 있다. (윌리엄 셰익스피어, 햄릿, 독서명언) 이 작품은 곧 우리가 형태형의 우여곡절 변화를 처리해야 한다는 것을 깨닫게 했다. 이것은 우리로 하여금 형태형에 관한 문제를 처리하게 한다. WordNet 에는 단어의 기본 형식만 포함되어 있습니다. 텍스트에 "ships" 가 나타나면 WordNet 은 이를 인식하지 못합니다. Richard Beckwith 와 Miceael Colon 은 텍스트에서 "ships" 라는 단어를 인식하는 Morphy 라는 프로그램을 작성했습니다. 1989 년 9 월까지 WordNet 은 텍스트의 어휘 변화를 처리하여 품사에서 해당 단어의 기본 형식을 찾을 수 있다.
이러한 작업은 텍스트에서 단어를 WordNet 의 해당 의미와 연관시키는 또 다른 중요한 진전을 이뤘습니다. Claudia leakock (1991년 1 1 월) 과 Brian Gustafson 이 Intel 을 개발했습니다 ) 및 WordNet 과 함께 대상 단어 (즉, 의미 마크업 대상 단어) 를 표시합니다. 1993 년 6 월, Shari Landes 는 주석 도구 세트 (레이블 세트 포함) 작성을 담당했습니다. 이러한 도구를 사용하면 가능한 한 명확한 텍스트를 출력할 수 있습니다. 텍스트의 의미 마크업은 단어 적용 범위 및 의미 적용 범위를 포함하여 WordNet 의 적용 범위를 크게 높입니다.
WordNet 의 또 다른 중요한 변화는 1989 년 봄에 발생했다. Antonio Romero 는 Grinder 프로그램을 수정하여 괄호 정의 (또는 "주석" 으로 해석됨) 를 동의어 세트의 일부로 사용할 수 있도록 했습니다. WordNet 의 단어 수가 증가함에 따라 동의어 세트의 순도를 유지하면서 가능한 한 명확하게 단어의 의미를 구분하기가 점점 어려워지고 있다. 즉, 동의어로 한 단어를 정의하는 것만으로는 충분하지 않다는 것이다. 처음에 WordNet 은 가능한 한 논평을 짧게 유지하려고 노력했다. 하지만 1 년 후, 논평은 점점 길어지기 시작했다. 주석의 수도 꾸준히 증가하기 시작했다. 1989 년 4 월, WordNet 은 주석 없이 37409 개의 동의어 세트를 가지고 있었습니다. 199 1 년 7 월까지 WordNet 에는 44983 개의 동의어와 13688 개의 주석 (30%) 이 포함되어 있었습니다. 6 월 1992 1 까지 WordNet 에는 4977 1 개의 동의어 세트와 19382 개의 주석 (39%) 이 포함되어 있습니다 1993 년 6 월까지 WordNet 에는 6 1023 개의 동의어 세트와 36880 개의 주석 (60%) 이 포함되어 있었습니다. 6 월 1994 1 까지 WordNet 에는 79542 개의 동의어 세트와 58705 개의 주석 (74%) 이 포함되어 있습니다. 6 월1995,65438+10 월까지 WordNet 에는 9 1050 개의 동의어 세트, 75389 개의 주석 (동의어 세트의 83 개) 이 포함되었습니다.
WordNet 의 연구원들은 항상 WordNet 을 하나의 제품이 아닌 하나의 실험으로 여겼다. 그래서 WordNet 에 충분한 단어가 있을 때, 그들은 학계에 무료로 WordNet 을 개방한다. Randee Tengi 는 WordNet 시리즈의 출시를 감독했습니다. Wordnet 버전 1.0 은 199 1 년 7 월에 발표되었습니다. 1..1버전은 199 1 의 8 월에 발표되었습니다. 1.2 버전은 1992 년 4 월에 발표되었습니다. 1.3 버전은 1992 년 2 월에 발표되었습니다. 1.4 버전은 1993 년 8 월에 발표되었습니다. 1.5 버전은 1995 년 3 월에 발표되었습니다. 현재 1000 명 이상의 개인과 조직이 WordNet 메일 목록에 가입했습니다. 많은 연구원들이 WordNet 을 다운로드하여 다른 방식으로 사용했다.
WordNet 은 해군연구실, 고급연구계획국, 제임스 S 맥도나 기금, 최근 언어데이터연맹의 지원을 받았다.
Word 의 주요 기능 및 기능
Word == > 의 주요 기능 및 기능 단어 시작 및 종료
--
Word 의 주요 기능 및 기능은 다음과 같이 요약 할 수 있습니다.
(1) 보이는 대로 얻은 것이다. 사용자는 Word 소프트웨어를 사용하여 문서를 배열하여 인쇄 효과가 화면에 선명하게 보이도록 합니다.
(2) 직관적인 조작 인터페이스인 Word 소프트웨어는 친숙한 인터페이스를 갖추고 있으며 다양한 도구를 제공합니다. 마우스로 선택, 조판 등을 완성할 수 있다.
(3) 멀티미디어 혼합 컴포지션은 Word 소프트웨어를 사용하여 텍스트, 그래픽, 이미지, 사운드, 애니메이션을 편집하거나 다른 소프트웨어로 만든 정보를 삽입할 수 있습니다. 또한 Word 소프트웨어가 제공하는 그리기 도구를 사용하여 그래픽을 만들고, 예술적인 문자와 수학 공식을 편집하여 다양한 문서 처리 요구를 충족할 수 있습니다.
(4) 강력한 표 기능 Word 소프트웨어는 자동 표뿐만 아니라 수동 표도 할 수 있는 강력한 표 기능을 제공합니다. Word 표 행은 자동으로 보호되고, 테이블의 데이터는 자동으로 계산되며, 표는 여러 가지 방법으로 수정할 수 있습니다. Word 소프트웨어에서는 스프레드시트를 직접 삽입할 수도 있습니다. Word 소프트웨어로 표를 만드는 것은 간단하고 아름답고 빠르고 편리하다.
(5) 자동 기능 단어 소프트웨어는 철자 및 문법 검사 기능을 제공하여 영어 문장 편집의 정확성을 향상시킵니다. 구문 오류나 맞춤법 오류가 발견되면 Word 소프트웨어는 수정 제안도 제공합니다. Word 소프트웨어를 사용하여 문서를 편집한 후 Word 는 사용자가 자동으로 요약을 작성하는 데 도움을 주어 사용자의 시간을 절약할 수 있습니다. 자동 고침 기능은 사용자가 동일한 문자를 입력하는 데 도움이 됩니다. 사용자가 직접 문자의 입력을 정의할 수 있습니다. 사용자가 같은 문자를 입력하고자 할 때, 특히 한자를 입력할 때 문자를 정의할 수 있습니다. 이 기능은 사용자의 입력 속도를 크게 향상시킵니다.
(6) 템플릿 및 마법사 기능인 Word 소프트웨어는 사용자가 특정 유형의 문서를 편집할 때 적절한 형식을 신속하게 설정할 수 있도록 다양한 템플릿을 제공합니다. 또한 Word 소프트웨어를 사용하면 사용자가 템플릿을 사용자 정의할 수 있으므로 특수한 요구 사항이 있는 문서를 빠르고 효율적으로 작성할 수 있습니다.
(7) 풍부한 도움말 기능 Word 소프트웨어의 도움말 기능은 상세하고 풍부하며, Word 소프트웨어는 사용자가 문제가 발생할 때 해결책을 찾을 수 있도록 이미지와 편리한 지원을 제공합니다. 사용자 자습에 편리함을 제공하다.
(8) 인터넷을 지원하는 네트워킹 도구는 오늘날 컴퓨터에서 가장 널리 사용되고 가장 인기 있는 분야 중 하나입니다. Word 소프트웨어는 네트워크 지원을 제공합니다. 사용자는 웹 마법사에 따라 웹 페이지 (일반적으로 웹 페이지라고 함) 를 빠르고 쉽게 만들 수 있으며, Word 소프트웨어의 웹 도구 모음을 사용하여 웹 페이지와 웹 문서를 포함한 다양한 문서를 빠르게 열거나 찾거나 탐색할 수 있습니다.
(9) 초호환성 Word 소프트웨어는 다양한 문서를 지원할 수 있으며, Word 편집 문서를 다른 형식으로 저장할 수 있어 Word 소프트웨어와 다른 소프트웨어의 정보 교환을 크게 용이하게 합니다. 이메일, 봉투, 메모, 보고서, 웹 페이지 등을 편집할 수 있습니다. 단어를 쓰다.
(10) 강력한 인쇄 기능 Word 소프트웨어는 프린터 매개 변수에 대한 강력한 지원과 구성을 제공하는 인쇄 미리 보기 기능을 제공합니다.