잡담은 적게 하고, 직접 웹사이트에 올라가세요.
Corpus.org/
교육부 언어응용연구소 전산언어학 연구실이 개발한' 온라인 코퍼스' 다. 이 사이트의 기능 중 하나는 단어 빈도 분석이다. 분석 텍스트' 아Q 정전' 을 예로 들어 이 사이트를 어떻게 사용하는지 소개하겠습니다.
AQ 정전 * * 의 통계 결과는 2948 자와 기호인데, 여기서' 발생 빈도' 단위는 퍼센트 (%) 이다.
첫 단어는' 의' 로 7 12 회 등장해 전문문의 4.4453% 를 차지했다. 그렇죠? 원래 단어를 확인해 봅시다.
Word 에서 우리는 747 개의' 의' 를 발견했고, 위의 통계 결과보다 35 개가 더 많았다. 왜요
그 이유는 간단합니다. 어떤' 득' 은' 상',' 기타',' 확실히' 와 같은 다른 단어로 잘려져 747 개, 적지 않다.
그러나이 도구에는 같은 단어가 반복되거나 잘못 잘린 것과 같은 불완전한 부분이 있으므로 사용할 때 excel 에서 필터링해야합니다.
위 그림과 같이 조,, 반복도 집에 나타났다. 단어를 검사한 결과, 단어 조가가 확실히 1 1 번 나타났다.
그러나 이런 불완전함은 사용을 방해하지 않는다. 결국 이 도구는 정확한 데이터를 excel 에서 자세히 계산해야 하는 확실한 단서를 제공할 수 있습니다.
아 Q 정전' 에서 순옹이 가장 좋아하는 단어를 봅시다.
단어:
이 20 개 단어 * * * 를 합치면 5 1 18 회, 전체 텍스트의 3 1.95% 를 차지한다!
어휘:
AQ 정전' 은 코퍼스 중의 한 단어가 아니기 때문에 삭감되지 않았다. 이 단어는 문장 중에 274 번 나왔으니 1 위를 차지해야 한다.
결과로 볼 때, 순옹은 여러분과 마찬가지로 구어화된 단어를 즐겨 사용한다. 만 자 이상의 문장 한 편에서 그는 45 번의' 원인' 과' 35 회' 를 사용했다! 그러나 순옹은 바로 순옹이다. 이런 평범한 글들이 그의 작품에서 넋을 잃고 문학 고전을 이루고 있다. (윌리엄 셰익스피어, 윈스턴, 독서명언)
관심이 있으시다면 이 도구를 사용해 보세요.