TensorFlow 的 session 使用

session是客户端与整个TensorFlow系统交互的接口;这次写下 session 的基础使用,主要从 session 的创建、session 的参数、session 的运行三个部分来讲:

创建一个 session

可以使用如下语句创建:

#  创建本地 session
with tf.Session() as sess:
  # ...

# 创建远程 session
with tf.Session("grpc://example.org:2222"):
  # ...

session 拥有和管理物理资源 CPU和GPU、网络连接的功能,它最典型的使用方式是作为上下文管理器使用,如以上代码所演示的。但是也可以独立创建一个 session,然后在其他地方显式的调用session.run来运行这个 session和 session.close 来关闭这个 session 。

更高级的 API 比如 tf.train.MonitoredTrainingSessiontf.estimator.Estimator 会自动为你创建和管理 session,不需要再像现在这样手动操纵 session,但是它们接受的参数和下面提到的 session 使用的参数含义是一样的。

session 的参数

session 使用的可选参数主要有三个:

  • target 用来控制 session 使用的硬件设备, 如果使用空值,那么这个 session 就只会使用本地的设备,如果使用 grpc:// URL,那么就会使用这台服务器控制的所有设备。
  • graph 用来控制该 session 运行哪个计算图,如果为空,那么该 session 就只会使用当前的默认 Graph,如果使用多个计算图,就可以在这里指定。
  • config 用来 指定一个 tf.ConfigProto 格式的 session 运行配置,比如说它里面包含的 allow_soft_placement 如果指定为 TRUE,那么 session 就会自动把不适合在 GPU 上运行的 OP 全部放到 CPU 上运行;cluster_def 是分布式运行时候需要指定的配置;gpu_options.allow_growth 设置会使得程序在开始时候逐步的增长 GPU 显存使用量,而不是一开始就最大化的使用所有显存。第一个和第三个配置是经常用到的。

tf.Session.run 还能够接受 options 参数, run_metadata 参数获得更多的session 运行信息,如下所示:

y = tf.matmul([[37.0, -23.0], [1.0, 4.0]], tf.random_uniform([2, 2]))

with tf.Session() as sess:
  # Define options for the `sess.run()` call.
  options = tf.RunOptions()
  options.output_partition_graphs = True
  options.trace_level = tf.RunOptions.FULL_TRACE

  # 定义一个容器来获取元数据
  metadata = tf.RunMetadata()

  # 把 options ,run_metadata 参数传入
  sess.run(y, options=options, run_metadata=metadata)

  # 打印每个设备上运行的计算 OP
  print(metadata.partition_graphs)

  #  打印每个 OP 的运行时间信息
  print(metadata.step_stats)

session 的运行

tf.Session.run 是运行 OP 和获取 tensor 的值的主要方式,可以一次性传入多个 OP 和 tensor 给它,然后TensorFlow 会自动执行所有需要的 OP 来得到结果,我们通过以下代码可以看看在传入不同的获取需求时,TensorFlow 自动执行了哪些相关计算 OP:

x = tf.constant([[37.0, -23.0], [1.0, 4.0]])
w = tf.Variable(tf.random_uniform([2, 2]))
y = tf.matmul(x, w)
output = tf.nn.softmax(y)
init_op = w.initializer

with tf.Session() as sess:
  # Run the initializer on `w`.
  sess.run(init_op)

  # 虽然只计算图了 output,但是所有相关的x,w,y 都会被执行,最后返回 NumPy 数组
  print(sess.run(output))

  # 这里既执行了 y,又执行了output,可能有人会问,y 是不是会被执行两次,实际并不是,
  # y 只会执行一次,然后作为 output 的输入
  y_val, output_val = sess.run([y, output])

tf.Session.run 还能接受字典形式的 feed 数据,字典形式的数据把源数据映射到 placeholder 占位符这样的数据,源数据可以是 Python 的标量,列表,NumPy数组等,如以下代码所示:

# Define a placeholder that expects a vector of three floating-point values,
# and a computation that depends on it.
x = tf.placeholder(tf.float32, shape=[3])
y = tf.square(x)

with tf.Session() as sess:
  # 给 x feed 不同数据,得到不同的 y.
  print(sess.run(y, {x: [1.0, 2.0, 3.0]})  # => "[1.0, 4.0, 9.0]"
  print(sess.run(y, {x: [0.0, 0.0, 5.0]})  # => "[0.0, 0.0, 25.0]"

  # 如果 x 没有 feed ,就会报错
  sess.run(y)

  # 报 `ValueError`, 因为 x 的形状不对
  sess.run(y, {x: 37.0})

参考资料: Graphs and Sessions | TensorFlow

    原文作者:lonlon ago
    原文地址: https://zhuanlan.zhihu.com/p/32869210
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞