python - 如何使用 tf.keras.Model 保存和恢复模式的权重 - TensorFlow 2.0 - 子类化 API

Question

在此处的示例中，它提到可以将类 tf.keras.Model 子类化，如下所示：

class MyModel(tf.keras.Model):

    def __init__(self):
    super(MyModel, self).__init__()
    self.dense1 = tf.keras.layers.Dense(4, activation=tf.nn.relu)
    self.dense2 = tf.keras.layers.Dense(5, activation=tf.nn.softmax)

但是，如果我想拥有可变数量的层和可变类型的层怎么办？如何将我的图层对象存储在我的类对象中？

据我了解，我在上面的示例中为属性（dense1，dense2）命名的名称很重要，因为在保存到检查点等时，它将用于引用这些层及其变量？那是对的吗？

我的问题基本上是：如果我不知道我有多少可用的图层，如何将我的图层存储在我的 tf.keras.Model 子类中？然后如何保存和恢复这些层的权重？

我的第一个想法是拥有图层对象的列表，但是对我来说如何保存和恢复这些图层权重并不明显，因为它们不会对应于不同的属性名称。

score 2 · Accepted Answer

简短的回答是：做你通常会做的事情，Tensorflow 会处理其余的事情。

答案隐藏在方法的文档字符串中（强调添加）：save_weightstf.keras.Model

以 TensorFlow 格式保存时，网络引用的所有对象都以与相同的格式保存tf.train.Checkpoint，包括任何Layer 实例或Optimizer分配给对象属性的实例。对于使用由输入和输出构建的网络，网络使用tf.keras.Model(inputs, outputs)的Layer实例会被自动跟踪/保存。对于继承自的用户定义类tf.keras.Model， Layer必须将实例分配给对象属性，通常在构造函数中。

实现目标的最简单方法是将图层分配给 Python 对象。在以下示例中，我使用字典来保留原始名称。

class MyModel(tf.keras.Model):

def __init__(self):
    super(MyModel, self).__init__()
    self.my_weight_dict = {}
    self.my_weight_dict["dense1"] = tf.keras.layers.Dense(6, activation=tf.nn.relu)
    self.my_weight_dict["dense2"] = tf.keras.layers.Dense(3, activation=tf.nn.softmax) # changed to fit the dataset

def call(self,inputs):
    x = self.my_weight_dict["dense1"](inputs)
    return self.my_weight_dict["dense2"](x)

这允许您以编程方式指定将更改模型属性的属性 - 例如，对于自动超参数调整很有用。

这是一个使用上面定义的类的完全可重现的示例：

import tensorflow as tf
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import normalize

# load the data and split it into train and test
iris_dataset = load_iris()
X = iris_dataset.data
y = iris_dataset.target
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3,stratify=y)

# normalize the features
X_train = normalize(X_train, axis=0,norm='max')
X_test = normalize(X_test, axis=0,norm='max')

# create, compile, and fit the model
model = MyModel()
model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.05, momentum=0.9),
              loss="sparse_categorical_crossentropy",  #tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
model.fit(X_train, y_train, epochs=50, verbose = 2, batch_size=128,
            validation_data = (X_test, y_test))

# just call the save_weights 
model.save_weights(filepath="path/to/your/weights/file")

# create a new model with the same structure
model_2 = MyModel()
model_2.load_weights("path/to/your/weights/file")
model_2.compile(optimizer=tf.keras.optimizers.SGD(lr=0.05, momentum=0.9),
              loss="sparse_categorical_crossentropy",  #tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])
model_2.evaluate(X_test,y_test)

python - 如何使用 tf.keras.Model 保存和恢复模式的权重 - TensorFlow 2.0 - 子类化 API

1 回答 1

Related

Reference