session是客户端与整个TensorFlow系统交互的接口;这次写下 session 的基础使用,主要从 session 的创建、session 的参数、session 的运行三个部分来讲:
创建一个 session
可以使用如下语句创建:
# 创建本地 session
with tf.Session() as sess:
# ...
# 创建远程 session
with tf.Session("grpc://example.org:2222"):
# ...
session 拥有和管理物理资源 CPU和GPU、网络连接的功能,它最典型的使用方式是作为上下文管理器使用,如以上代码所演示的。但是也可以独立创建一个 session,然后在其他地方显式的调用session.run来运行这个 session和 session.close 来关闭这个 session 。
更高级的 API 比如 tf.train.MonitoredTrainingSession 和 tf.estimator.Estimator 会自动为你创建和管理 session,不需要再像现在这样手动操纵 session,但是它们接受的参数和下面提到的 session 使用的参数含义是一样的。
session 的参数
session 使用的可选参数主要有三个:
- target 用来控制 session 使用的硬件设备, 如果使用空值,那么这个 session 就只会使用本地的设备,如果使用 grpc:// URL,那么就会使用这台服务器控制的所有设备。
- graph 用来控制该 session 运行哪个计算图,如果为空,那么该 session 就只会使用当前的默认 Graph,如果使用多个计算图,就可以在这里指定。
- config 用来 指定一个 tf.ConfigProto 格式的 session 运行配置,比如说它里面包含的 allow_soft_placement 如果指定为 TRUE,那么 session 就会自动把不适合在 GPU 上运行的 OP 全部放到 CPU 上运行;cluster_def 是分布式运行时候需要指定的配置;gpu_options.allow_growth 设置会使得程序在开始时候逐步的增长 GPU 显存使用量,而不是一开始就最大化的使用所有显存。第一个和第三个配置是经常用到的。
tf.Session.run 还能够接受 options 参数, run_metadata 参数获得更多的session 运行信息,如下所示:
y = tf.matmul([[37.0, -23.0], [1.0, 4.0]], tf.random_uniform([2, 2]))
with tf.Session() as sess:
# Define options for the `sess.run()` call.
options = tf.RunOptions()
options.output_partition_graphs = True
options.trace_level = tf.RunOptions.FULL_TRACE
# 定义一个容器来获取元数据
metadata = tf.RunMetadata()
# 把 options ,run_metadata 参数传入
sess.run(y, options=options, run_metadata=metadata)
# 打印每个设备上运行的计算 OP
print(metadata.partition_graphs)
# 打印每个 OP 的运行时间信息
print(metadata.step_stats)
session 的运行
tf.Session.run 是运行 OP 和获取 tensor 的值的主要方式,可以一次性传入多个 OP 和 tensor 给它,然后TensorFlow 会自动执行所有需要的 OP 来得到结果,我们通过以下代码可以看看在传入不同的获取需求时,TensorFlow 自动执行了哪些相关计算 OP:
x = tf.constant([[37.0, -23.0], [1.0, 4.0]])
w = tf.Variable(tf.random_uniform([2, 2]))
y = tf.matmul(x, w)
output = tf.nn.softmax(y)
init_op = w.initializer
with tf.Session() as sess:
# Run the initializer on `w`.
sess.run(init_op)
# 虽然只计算图了 output,但是所有相关的x,w,y 都会被执行,最后返回 NumPy 数组
print(sess.run(output))
# 这里既执行了 y,又执行了output,可能有人会问,y 是不是会被执行两次,实际并不是,
# y 只会执行一次,然后作为 output 的输入
y_val, output_val = sess.run([y, output])
tf.Session.run 还能接受字典形式的 feed 数据,字典形式的数据把源数据映射到 placeholder 占位符这样的数据,源数据可以是 Python 的标量,列表,NumPy数组等,如以下代码所示:
# Define a placeholder that expects a vector of three floating-point values,
# and a computation that depends on it.
x = tf.placeholder(tf.float32, shape=[3])
y = tf.square(x)
with tf.Session() as sess:
# 给 x feed 不同数据,得到不同的 y.
print(sess.run(y, {x: [1.0, 2.0, 3.0]}) # => "[1.0, 4.0, 9.0]"
print(sess.run(y, {x: [0.0, 0.0, 5.0]}) # => "[0.0, 0.0, 25.0]"
# 如果 x 没有 feed ,就会报错
sess.run(y)
# 报 `ValueError`, 因为 x 的形状不对
sess.run(y, {x: 37.0})