@@ -14,7 +14,7 @@ Free English to Chinese Dictionary Database.
1414
1515给数据库中每个单词标注:是否是各类考试大纲词汇?以及他们在 BNC 和其他语料库里的词频顺序。BNC 词频统计的是最近几百年的历史各类英文资料,而当代语料库只统计了最近 20 年的,为什么两者都要提供呢?
1616
17- 很简单,quay(码头)这个词在当代语料库里拍两万以外 ,你可能觉得是个没必要掌握的生僻词,而 BNC 里面却排在第 8906 名,基本算是一个高频词,为啥呢?可以想象过去航海还是一个重要的交通工具,所以以往的各类文字资料对这个词提的比较多,你要看懂 19 世纪即以前的各类名著,你会发现 BNC 的词频很管用。
17+ 很简单,quay(码头)这个词在当代语料库里排到两万以外 ,你可能觉得是个没必要掌握的生僻词,而 BNC 里面却排在第 8906 名,基本算是一个高频词,为啥呢?可以想象过去航海还是一个重要的交通工具,所以以往的各类文字资料对这个词提的比较多,你要看懂 19 世纪即以前的各类名著,你会发现 BNC 的词频很管用。
1818
1919而你要阅读各类现代杂志,当代语料库的作用就体现出来了,比如 Taliban(塔利班),在 BNC 词频里基本就没收录(没进前 20 万词汇),而在当代语料库里,它已经冒到 6089 号了,高频中的高频。
2020
@@ -127,7 +127,7 @@ d:perceived/p:perceived/3:perceives/i:perceiving
127127
128128fuse:pos =` n:46/v:54 `
129129
130- 代表 fuse 这个词有两个位置(词性),n(名词)占比 46%,v(动词)占比 54%,根据后面的比例,你可以直到该词语在语料库里各个 pos 所出现的频率。关于 pos 里各个字母的含义还可以看[ 这里] ( http://www.natcorp.ox.ac.uk/tools/xaira_search.xml?ID=POS ) 和[ 这里] ( http://www.natcorp.ox.ac.uk/docs/c5spec.html ) 。
130+ 代表 fuse 这个词有两个位置(词性),n(名词)占比 46%,v(动词)占比 54%,根据后面的比例,你可以知道该词语在语料库里各个 pos 所出现的频率。关于 pos 里各个字母的含义还可以看[ 这里] ( http://www.natcorp.ox.ac.uk/tools/xaira_search.xml?ID=POS ) 和[ 这里] ( http://www.natcorp.ox.ac.uk/docs/c5spec.html ) 。
131131
132132##词典使用
133133