AntConc小白教程(8) | 您所在的位置:网站首页 › infrequently同义词 › AntConc小白教程(8) |
今天我们迎来了AntConc系列的最终篇——关键词单。利用关键词单,可将加载的语料库与参照的语料库的词频做比对,生成对比后的高频或低频词。 1. 打开AntConc,加载语料库文件后,单击“Keyword List”选项卡,之后单击“Start”,会提示没有可用的参照语料库词表。因此,我们要先添加一个参照语料库。 2. 在菜单栏“Tool Preferences”中的“Keyword List”中,可以在“Reference Corpus”中加载参照语料库,可以加载未处理的语料库文件(Use raw files)或直接加载该参照语料库的词单(Use word lists)。这里我们以加载BROWN语料库为例,之后单击“Load”进行加载即可。通过交换功能(Swap with Target Files)可以调换目标语料库和参照语料库。 3. 之后我们再次单击“Start”,此时提示我们要想使用关键词单,会先去生成词单,单击“确定”即可。 4. 所有的单词默认按照词频来排序,包含序号(Rank)、词频(Freq)、关键性(Keyness)和关键词(Keyword)的统计信息。表格上方还可以看到该语料库自身的类符(Types Before Cut)和关键词单(Types After Cut)的类符数量。 5. 关键词单中单词的排序可以按照词频、关键性、关键词词头或词尾排序。选择“Sort by Freq/Keyness/Keyword/ Keyword End”后单击“Sort”即可,还可以勾选“Invert Order”可实现反向排序。 6. 单击具体单词,就可以跳转到该词KWIC模式的检索结果。 7. 在检索框中输入检索词可以对该词进行定位,检索时同样支持区分大小写、正则表达式等高级检索。也可以在高级检索中加载停用词表,过滤掉不需要的单词。利用Hit Location进行上翻和下翻。前面几期已经详细介绍过,这里就不过多赘述。 说到这,有小伙伴一定会问:关键性(Keyness)是如何计算出来的呢?这里我们打开菜单栏“Tool Preferences”中的“Keyword List”,可以看到关键性(Keyness)的计算方法:对数似然比(Log-Likelihood)和卡方检验(Chi Squared)。 简单来说,关键性(Keyness)就是某个词通过特定的计算方法来计算实际频率与在参照语料库(更大的库)中可能出现频率的相关性。 对数似然比(Log-Likelihood)是反映真实性的一种指标,一般数值越高,相关性越高。 卡方检验(Chi Squared)是用途非常广的一种假设检验方法,值越大,偏差越小,相关性越低。 阈值(Threshold Value)则是计算的临界值。 如果大家对具体的计算公式感兴趣,可以在维基百科中了解更多知识点哦。 8. 在“Tool Preferences”的“Keyword List”中,还可以对选择“显示负关键词”(Show Negative Keywords),与参照语料库相比目标语料库中不同寻常的低频词将显示出来。 AntConc的所有功能操作就介绍到这里,拿起手中的工具和语料去试试吧! 精彩推荐 AntConc小白教程(1)| AntConc介绍及索引工具 AntConc小白教程(2)| AntConc索引检索及索引定位 AntConc小白教程(3)| 文件查看 File View AntConc小白教程(4)| 词丛 Clusters AntConc小白教程(5)| N元模式 N-Grams AntConc小白教程(6)| 搭配 Collocates AntConc小白教程(7)| 词单 Word List ~关注Tmxmall官方微信,获取更多精彩资讯~ |
CopyRight 2018-2019 实验室设备网 版权所有 |