首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将IPTC分类转换为布尔表达式

将IPTC分类转换为布尔表达式
EN

Stack Overflow用户
提问于 2021-02-17 05:56:31
回答 1查看 35关注 0票数 0

可以将IPTC分类法更改为布尔表达式吗?为了简化新闻交换,国际新闻电信理事会开发了NewsML体系结构(NAR),作为该体系结构的一部分,使用特定的受控词汇(例如IPTC新闻代码)来对新闻项进行分类。主题代码是1300个术语的同义词词典,用于对每个新闻项目的主要主题(主题)进行分类。截至2021年,有1400多个术语。IPTC subjectCodes (自2012年)是具有3层的树状结构。我的假设是一组词汇定义了新闻的类别。我的问题是:能否将层次结构转换为这样的布尔表达式:“武装冲突”或“武装争端”或“内乱”或((“武装”或“武器”) AND (“右翼”或“左翼”或“极端分子”或“危险”或“对抗”)“)”?

EN

回答 1

Stack Overflow用户

发布于 2021-02-17 17:14:44

我们IPTC过去在谷歌新闻计划项目中构建了一个基于规则的分类引擎时,曾考虑过这个问题。它被称为IPTC EXTRA,它允许用户基于布尔逻辑创建规则,根据IPTC Media Topics控制的词汇表(或任何其他CV)中的术语对文档进行分类。

规则语言Extra Query language (EQL)比简单的布尔and/or/not运算符更具表现力。我们还研究了单词的接近性和其他一些特征:有关详细信息,请参阅EXTRA User Manual

你可以看到a set of test rules created for the EXTRA project on our GitHub repository。但请注意,这只是根据IPTC媒体主题词汇表对任何内容进行分类所需的规则的一小部分。目前,我们还不知道一套完整的分类所有媒体主题的规则。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66232749

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档