训练了Venelin Valkov的视频教程中给出的“T5-base” 。它运作良好。然后我尝试更改一些配置,例如层数(num_layers)并使用退出层数(dropout_rate)
config = T5Config(num_layers=8, dropout_rate=0.2)
然后将配置对象包含在
self.model = T5ForConditionalGeneration.from_pretrained("t5-base", config=config, return_dict = True)
如此处给出,但它没有用。它返回一个错误
TypeError:init()得到了一个意外的关键字参数'return_dict'
请帮忙。