已经有许多论文(特别是图像标题)将CNN和LSTM架构联合用于预测和生成任务。然而,他们似乎都是独立于LSTM训练CNN的。我在浏览Torch和TensorFlow (用Keras),却找不到为什么不可能进行端到端的培训(至少从架构设计的角度来看),但似乎没有任何关于这种模型的文档。
那么,能做到吗?火炬或TensorFlow (甚至西亚诺斯或卡菲)是否支持联合训练端到端的CNN神经网络?如果是这样的话,是否就像将输出从CNN链接到LSTM并运行SGD一样简单?还是说它更复杂?
发布于 2017-08-08 19:54:21
CNN-LSTM模型可以使用tensorflow训练结束。
假设您有一个带有输入X的CNN模型X和一个LSTM模型LSTM。这可以是终端机训练。
# here CNN is used to extract meaning features from the input data
features = M(X)
# CNN features are used as input to LSTM
y = LSTM(features)
cost = cost_function(ground_truths, y)在imdb数据集上提供了一个用于句子分类的CNN模型的末端训练的综合示例,可在LSTM-端端上使用。
https://stackoverflow.com/questions/40094171
复制相似问题