首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何比较使用度量的人名的相似性?

如何比较使用度量的人名的相似性?
EN

Stack Overflow用户
提问于 2016-12-09 04:49:21
回答 2查看 1.3K关注 0票数 6

我正在开发一个函数,允许人名的拼写错误和别名。我做了一些研究,发现字符串度量和语音库也有相当多的算法。

我尝试过一些,其中雅罗·温克勒给出了一些很好的结果如下。

代码语言:javascript
复制
compareStrings("elon musk","elon musk"))    --> 1.0 
compareStrings("elonmusk","elon musk"))     --> 0.98
compareStrings("elon mush","elon musk"))    --> 0.99
compareStrings("eln msuk","elon musk"))     --> 0.94
compareStrings("elon","elon musk"))         --> 0.89
compareStrings("musk","elon musk"))         --> 0.0  //This is bad, but can fix that.
compareStrings("mr elon musk","elon musk")) --> 0.81

以上是来自Apache .I的实现,它想知道是否有更好的更好的实现。任何帮助都是非常感谢的。

编辑:@newuserua_ext @Trasher,谢谢,非常感谢。我已经看过了所有与此相关的StackExchange问答。并把这个问题集中在人名上。

EN

回答 2

Stack Overflow用户

发布于 2016-12-09 07:12:37

考虑一下双元电话机。我们成功地使用它来找到名字的“声音一样”匹配。您可以在Apache中找到一个实现:

https://commons.apache.org/proper/commons-codec/apidocs/org/apache/commons/codec/language/DoubleMetaphone.html

票数 0
EN

Stack Overflow用户

发布于 2016-12-09 07:16:09

一种可能是Levenshtein距离,它测量给定特定允许操作的字符串的编辑距离。它可以或多或少地用动态规划进行有效的评估,但并不真正适合于确定语音相似性。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41053309

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档