首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TfidfVectorizer是否保持功能的顺序?

TfidfVectorizer是否保持功能的顺序?
EN

Stack Overflow用户
提问于 2016-01-05 00:50:40
回答 1查看 1K关注 0票数 0

我想知道TfidfVectorizer在使用scikit learn转换文档时是否保持了功能的顺序。下面是我正在做的事情:

代码语言:javascript
复制
from sklearn.feature_exteraction.text import TfidfVectorizer
corpus = ['this  movie is cool', 'I love this book']
vec = TfidfVectorizer()
X = vec.fit_tranform(corpus)
joblib.dump(vec, './vec') 
doc = 'What are the coolest movies in 2015' 
vec = joblib.load('./vec')
X_test = vec.transform([doc])

现在,我的问题是,X和X_test中的功能条目的顺序是相同的吗?

EN

回答 1

Stack Overflow用户

发布于 2016-01-05 01:50:23

是。当您调用fit()时,它会创建一个从文本字符串到列索引的词汇字典。它使用它来转换额外的数据集。这在任何序列化和反序列化中都会保留。

代码语言:javascript
复制
vec.vocabulary_
> {u'book': 0, u'cool': 1, u'is': 2, u'love': 3, u'movie': 4, u'this': 5}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34595905

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档