我的情况是,我正在使用抱脸变形金刚,并且对此有所了解。我正在使用 facebook/bart-large-cnn 模型为我的项目执行文本摘要,并且到目前为止我正在使用以下代码进行一些测试:
text = """
Justin Timberlake and Jessica Biel, welcome to parenthood.
The celebrity couple announced the arrival of their son, Silas Randall Timberlake, in
statements to People."""
from transformers import pipeline
smr_bart = pipeline(task="summarization", model="facebook/bart-large-cnn")
smbart = smr_bart(text, max_length=150)
print(smbart[0]['summary_text'])
一小段代码实际上给了我一个很好的文本总结。但我的问题是,如何在我的数据框列之上应用相同的预训练模型。我的数据框如下所示:
ID Lang Text
1 EN some long text here...
2 EN some long text here...
3 EN some long text here...
.... 等等 50K 行
现在我想将预训练的模型应用于 col Text 以从中生成一个新列 df['summary'] ,生成的数据框应如下所示:
ID Lang Text Summary
1 EN some long text here... Text summary goes here...
2 EN some long text here... Text summary goes here...
3 EN some long text here... Text summary goes here...
我怎样才能做到这一点?任何帮助将非常感激。