我有一个模型M1,其数据输入是占位符M1.input,其权重是训练的.
我的目标是构建一个新的模型M2,它以输入w的形式计算M1(具有训练的权重)的输出o,其形式为tf.Variable(而不是将实际值提供给M1.input).换句话说,我使用训练的模型M1作为黑盒函数来构建新模型o = M1(w)(在我的新模型中,w将被学习并且M1的权重被固定为常数).问题是M1只接受输入M1.input作为输入,通过它我们需要提供实际值,而不是像w那样的tf.Variable.
作为构建M2的天真解决方案,我可以在M2内手动构建M1,然后使用预先训练的值初始化M1的权重,并使其不能在M2内训练.然而,在实践中,M1很复杂,我不想在M2内再次手动构建M1.我正在寻找一个更优雅的解决方案,类似于变通方法或直接解决方案,用tf.Variable w替换M1的输入占位符M1.input.
感谢您的时间.
最佳答案 这个有可能.关于什么:
import tensorflow as tf
def M1(input, reuse=False):
with tf.variable_scope('model_1', reuse=reuse):
param = tf.get_variable('param', [1])
o = input + param
return o
w = tf.get_variable('some_w', [1])
plhdr = tf.placeholder_with_default(w, [1])
output_m1 = M1(plhdr)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
sess.run(w.assign([42]))
print(sess.run(output_m1, {plhdr: [0]})) # direct from placeholder
print(sess.run(output_m1)) # direct from variable
因此,当feed_dict具有占位符的值时,将使用此值.否则,使用变量“w”的回退选项处于活动状态.