Tensorflow：使用tf.Variable替换/馈送图形的占位符？

2023年10月13日 225次阅读

我有一个模型M1,其数据输入是占位符M1.input,其权重是训练的.

我的目标是构建一个新的模型M2,它以输入w的形式计算M1(具有训练的权重)的输出o,其形式为tf.Variable(而不是将实际值提供给M1.input).换句话说,我使用训练的模型M1作为黑盒函数来构建新模型o = M1(w)(在我的新模型中,w将被学习并且M1的权重被固定为常数).问题是M1只接受输入M1.input作为输入,通过它我们需要提供实际值,而不是像w那样的tf.Variable.

作为构建M2的天真解决方案,我可以在M2内手动构建M1,然后使用预先训练的值初始化M1的权重,并使其不能在M2内训练.然而,在实践中,M1很复杂,我不想在M2内再次手动构建M1.我正在寻找一个更优雅的解决方案,类似于变通方法或直接解决方案,用tf.Variable w替换M1的输入占位符M1.input.

感谢您的时间.

最佳答案这个有可能.关于什么：

import tensorflow as tf


def M1(input, reuse=False):
    with tf.variable_scope('model_1', reuse=reuse):
        param = tf.get_variable('param', [1])
        o = input + param
        return o


w = tf.get_variable('some_w', [1])
plhdr = tf.placeholder_with_default(w, [1])

output_m1 = M1(plhdr)

with tf.Session() as sess:

    sess.run(tf.global_variables_initializer())

    sess.run(w.assign([42]))

    print(sess.run(output_m1, {plhdr: [0]}))  # direct from placeholder
    print(sess.run(output_m1))                # direct from variable

因此,当feed_dict具有占位符的值时,将使用此值.否则,使用变量“w”的回退选项处于活动状态.