解决文本多次出现的方法解决短句子的问题取概率最高的词组成句子:显然句子的平滑度不是很好下面才是最优的的结果n为任意。ex:如下,n取4相关模型Multi-Modal RNNTable Projection 为文字的编码形式右下角的Fully Connected为提取图片的特征值Show and TellShow Attend and Tell...
Multi-Modal RNN
Table Projection 为文字的编码形式
右下角的Fully Connected为提取图片的特征值 Show and Tell Show Attend and Tell 加入attention机制,让图像的不同位置生成不同的文字
缺点:lstm的学习量过载,要学习如何学习生成文本,又要去学习Attention机制 Top-Down Bottom-Up Attention
细化结构
所有评论(0)