6.30. WordNet¶
6.30.1. 什么是 WordNet?¶
本材料中表达的任何观点,发现,结论或建议均为 WordNet 的创建者,并不一定反映任何资助机构或普林斯顿大学的观点。
在撰写论文或制作基于 WordNet 的软件应用程序,工具或界面时,有必要正确引用来源。引文数字对 WordNet 资金至关重要。
6.30.2. 关于 WordNet¶
WordNet® 是一个庞大的英语词汇数据库。 名词,动词,形容词和副词被分组为认知同义词集(同义词集),每个表达一个不同的概念。 同义词通过概念 - 语义和词汇关系相互关联。 可以使用浏览器导航由此产生的有意义的相关单词和概念的网络。 WordNet 也可以免费和公开下载。 WordNet 的结构使其成为计算语言学和自然语言处理的有用工具。
WordNet 表面上看起来像一个词库,因为它根据词的含义将词汇组合在一起。 但是,有一些重要的区别。 首先,WordNet 不仅仅是单词形式 - 字母串 - 而是单词的特定意义。 结果,在网络中彼此非常接近的单词在语义上被消除歧义。 其次,WordNet 标记了单词之间的语义关系,而同义词库中单词的分组并不遵循除意义相似性之外的任何显式模式。
6.30.3. 结构体¶
WordNet 中单词之间的主要关系是同义词,如关闭和关闭或汽车和汽车之间的关系。 同义词 - 表示相同概念并且在许多上下文中可互换的词 - 被分组为无序集(同义词集)。 WordNet 的 117000 个同义词中的每一个都通过少量的“概念关系”链接到其他同义词集。另外,一个 synset 包含一个简短的定义(“光泽”),并且在大多数情况下,一个或多个简短的句子说明了使用 synset 成员。 具有若干不同含义的单词形式在尽可能多的不同同义词中表示。 因此,WordNet 中的每个形式 - 意义对都是唯一的。
6.30.4. 关系¶
synsets 中最常编码的关系是超从属关系(也称为 hyperonymy,hyponymy 或 ISA 关系)。 它将{furniture,piece_of_furniture}等更常见的同义词链接到{bed}和{bunkbed}等越来越具体的同义词。 因此,WordNet 声称类别家具包括床,而床又包括双层床;相反,床和双层床等概念构成了家具类。 所有名词层次结构最终都会上升到根节点{entity}。 Hyponymy 关系是传递性的:如果扶手椅是一种椅子,如果椅子是一种家具,那么扶手椅就是一种家具。 WordNet 区分了类型(常用名词)和实例(特定人,国家和地理实体)。 因此,扶手椅是一种椅子,巴拉克奥巴马是总统的一个例子。 实例始终是其层次结构中的叶(终端)节点。
Meronymy,整体关系在{chair}和{back,backrest},{seat}和{leg}等同义词之间保持不变。 零件是从他们的上级继承的:如果椅子有腿,那么扶手椅也有腿。 零件不是“向上”继承的,因为它们可能仅仅是特定种类的东西而不是整个类别的特征:椅子和椅子有腿,但不是所有类型的家具都有腿。
动词同义词也被排列成层次结构;树木底部的动词(troponyms)表达了一种特定事件的特征,如{communication} - {talk} - {whisper}。 表达的具体方式取决于语义场;音量(如上例所示)只是动词可以详细阐述的一个维度。 其他的是速度(移动慢跑)或情绪强度(喜欢爱情偶像)。 描述必然和单向相互关联的事件的动词链接在一起:{buy} - {pay},{succeed} - {try},
形容词按照反义词来组织。 形容词根据反义词组织。 这些极性形容词中的每一个又与许多“语义上相似”的形容词相关联:干燥与干燥,干旱,干燥和干燥以及潮湿到潮湿,涝渍等有关。 语义相似的形容词是对立极的控制成员的“间接反义词”。 关系形容词(“relatedyms”)指向它们所源自的名词(犯罪 - 犯罪)。 WordNet 中只有很少的副词(很少,大多数,真的等等),因为大多数英语副词都是通过形态上的词缀直接从形容词中衍生出来的(令人惊讶的是,奇怪的是,等等)
6.30.5. 跨 POS 关系¶
大多数 WordNet 的关系都连接来自同一词性(POS)的单词。 因此,WordNet 实际上由四个子网组成,每个子网用于名词,动词,形容词和副词,几乎没有交叉 POS 指针。 跨 POS 关系包括“形态语义”链接,这些链接在语义相似的单词之间保持共享具有相同含义的词干:观察(动词),观察(形容词)观察,天文学(名词)。 在许多名词 - 动词对中,已经指定了名词相对于动词的语义角色:{sleeper,sleeping_car}是{sleep}的 LOCATION,{painter}是{paint}的代理,而{painting} ,picture}是它的结果。
6.30.6. 更多信息¶
Fellbaum,Christiane(2005)。 WordNet 和 wordnets。 在:Brown,Keith 等人(编辑),Encyclopedia of Language and Linguistics,Second Edition,Oxford:Elsevier,665-670。