首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于特定主题集句子的主题标记/评分的Python库

用于特定主题集句子的主题标记/评分的Python库
EN

Stack Overflow用户
提问于 2016-12-02 03:22:34
回答 1查看 417关注 0票数 0

我正在寻找最好的python库来完成下面的NLP任务。

举一个例子,“他成为国王玛哈哇集拉隆功bodindradebayavarangkun chakri王朝的第10位君主,但也将被称为rama x我愿意接受,以实现他的国王的愿望,并为所有泰国人的利益”(摘自本文http://www.bbc.com/news/world-asia-38168912)

我想计算这个句子的主题分数。例如,如果我将“主题集”定义为{“政治”,“科技”,“商业”,“健康”,“娱乐”},

我希望输出如下:{“政治”:0.9,“科技”:0.1,“商业”:0.1,“健康”:0.05,“娱乐”:0.2}

我试图实现的关键事情是,我想定义我的主题集,并且只对该集中的主题进行评分。此外,句子会相对较短,我想计算以流方式出现的句子的输出。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2016-12-02 04:35:50

主题建模仍然是一个困难的问题,所以不要期望开箱即用就能得到完美的结果。如果没有来自目标领域的良好训练语料库)。

话虽如此,我还是很幸运地使用了gensim包,特别是我会看看他们的Latent Dirichlet Allocation模块。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40918766

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档