5

我正在尝试按照本文中显示的说明实施 QA 系统。我已经正确导入了一些数据集,并使用 word2vec 方法转换了向量中的单词。在词嵌入之后,需要在 CNN 中插入问题和答案。考虑到每个问题/答案的长度不同,输入张量的大小应该是多少?(每个问题/答案都是一个向量数组)。

论文摘录:

在此处输入图像描述

q_emb是词嵌入之后的问题,r_w_k是长度为d的词向量。

应该使用哪个M(Q/A 的长度)的正确值?你能告诉我一些解决这个问题的方法或者只是给我一些帮助吗?谢谢

4

1 回答 1

3

确定最大问题/答案向量数组长度并使输入张量为 shape (num_samples, max_qa_length, word_embedding_size)。对于短于 的问题max_qa_length,在最后用零向量填充它们。

于 2018-08-23T17:15:58.247 回答