python - 使用深度学习技术的文本摘要

Question

我正在尝试总结属于法律领域的文本文档。

我指的是关于如何实现深度学习架构的网站 deeplearning.net。我已经阅读了很多关于文档摘要（单文档和多文档）的研究论文，但我无法弄清楚每个文档的摘要是如何生成的。

训练完成后，网络会在测试阶段稳定下来。因此，即使我知道在训练阶段学习的一组特征（我已经弄清楚了），在测试期间也很难找出每个特征的重要性（因为网络的权重向量是稳定的）我将尝试为每个文档生成摘要的阶段。

我试图弄清楚这一点很长时间，但它是徒劳的。

如果有人对此进行过研究或对此有任何想法，请给我一些指示。我真的很感谢你的帮助。谢谢你。

score 2 · Accepted Answer

我认为你需要更具体一点。当您说“我无法弄清楚每个文档的摘要是如何生成的”时，您的意思是您不知道如何解释学习到的特征，还是您不了解算法？此外，“深度学习技术”涵盖了非常广泛的模型——您实际尝试使用哪个模型？

在一般情况下，深度学习模型不会学习人类可解释的特征（尽管您当然可以尝试寻找给定输入与模型中相应激活之间的相关性）。所以，如果这就是你要问的，那真的没有好的答案。如果您在理解您使用的模型时遇到困难，我可能会帮助您:-) 让我知道。

score 0 · Accepted Answer

这是一个博客系列，从一开始就详细讨论文本摘要的工作原理，最近的研究使用基于 seq2seq 深度学习的模型，这个博客系列从解释这种架构开始，直到达到最新的研究方法

此外，这个repo收集了构建文本摘要模型的多种实现，它在 google colab 上运行这些模型，并将数据托管在 google drive 上，所以无论你的计算机有多强大，你都可以使用 google colab 这是一个免费的系统来训练你的深层模型

如果您想查看实际的文本摘要，可以使用这个免费的 api。

我真的希望这会有所帮助

2 回答 2