AntConc小白教程(8) 您所在的位置:网站首页 infrequently同义词 AntConc小白教程(8)

AntConc小白教程(8)

2023-12-13 23:46| 来源: 网络整理| 查看: 265

​​今天我们迎来了AntConc系列的最终篇——关键词单。利用关键词单,可将加载的语料库与参照的语料库的词频做比对,生成对比后的高频或低频词。​

1. 打开AntConc,加载语料库文件后,单击“Keyword List”选项卡,之后单击“Start”,会提示没有可用的参照语料库词表。因此,我们要先添加一个参照语料库。​​

2. 在菜单栏“Tool Preferences”中的“Keyword List”中,可以在“Reference Corpus”中加载参照语料库,可以加载未处理的语料库文件(Use raw files)或直接加载该参照语料库的词单(Use word lists)。这里我们以加载BROWN语料库为例,之后单击“Load”进行加载即可。通过交换功能(Swap with Target Files)可以调换目标语料库和参照语料库。

3. 之后我们再次单击“Start”,此时提示我们要想使用关键词单,会先去生成词单,单击“确定”即可。

4. 所有的单词默认按照词频来排序,包含序号(Rank)、词频(Freq)、关键性(Keyness)和关键词(Keyword)的统计信息。表格上方还可以看到该语料库自身的类符(Types Before Cut)和关键词单(Types After Cut)的类符数量。​

​5. 关键词单中单词的排序可以按照词频、关键性、关键词词头或词尾排序。选择“Sort by Freq/Keyness/Keyword/ Keyword End”后单击“Sort”即可,还可以勾选“Invert Order”可实现反向排序。

​6. 单击具体单词,就可以跳转到该词KWIC模式的检索结果。​​

7. 在检索框中输入检索词可以对该词进行定位,检索时同样支持区分大小写、正则表达式等高级检索。也可以在高级检索中加载停用词表,过滤掉不需要的单词。利用Hit Location进行上翻和下翻。前面几期已经详细介绍过,这里就不过多赘述。

说到这,有小伙伴一定会问:关键性(Keyness)是如何计算出来的呢?这里我们打开菜单栏“Tool Preferences”中的“Keyword List”,可以看到关键性(Keyness)的计算方法:对数似然比(Log-Likelihood)和卡方检验(Chi Squared)。

简单来说,关键性(Keyness)就是某个词通过特定的计算方法来计算实际频率与在参照语料库(更大的库)中可能出现频率的相关性。

对数似然比(Log-Likelihood)是反映真实性的一种指标,一般数值越高,相关性越高。

卡方检验(Chi Squared)是用途非常广的一种假设检验方法,值越大,偏差越小,相关性越低。

阈值(Threshold Value)则是计算的临界值。

如果大家对具体的计算公式感兴趣,可以在维基百科中了解更多知识点哦。​

8. 在“Tool Preferences”的“Keyword List”中,还可以对选择“显示负关键词”(Show Negative Keywords),与参照语料库相比目标语料库中不同寻常的低频词将显示出来。

AntConc的所有功能操作就介绍到这里,拿起手中的工具和语料去试试吧!

精彩推荐

AntConc小白教程(1)| AntConc介绍及索引工具

AntConc小白教程(2)| AntConc索引检索及索引定位

AntConc小白教程(3)| 文件查看 File View

AntConc小白教程(4)| 词丛 Clusters

AntConc小白教程(5)| N元模式 N-Grams

AntConc小白教程(6)| 搭配 Collocates

AntConc小白教程(7)| 词单 Word List

~关注Tmxmall官方微信,获取更多精彩资讯~

​​​​​



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有