在word2vec中,为什么似然函数的实现、查找相邻词的概率的乘法给出了一个词?我不明白为什么概率应该是multiplied.Is,这背后有一个原因/直觉?
发布于 2020-03-25 23:36:47
“给一个词找到一个相邻单词的可能性”
这里你指的是Skip体系结构,在这里,给出中心词,你可以预测周围的单词。
这些备注的摘录可能会澄清您的问题。请注意,通过假设条件独立,将总概率因子转化为乘积。
“和CBOW一样,我们需要生成一个客观函数来评估模型。这里的一个关键区别是,我们引用了朴素的贝叶斯假设来打破概率。如果你之前没有看到这一点,那么简单地说,这是一个强大(天真)的条件独立性假设。换句话说,给定中心词,所有输出词都是完全独立的。”
也许这个文章也能有所帮助,虽然它是关于负抽样的,它是一个非常清楚的阐述。
https://datascience.stackexchange.com/questions/70236
相似问题