一、Tensorflow基本概念
1、使用图(graphs)来表示计算任务,用于搭建神经网络的计算过程,但其只搭建网络,不计算
2、在被称之为会话(Session)的上下文(context)中执行图
3、使用张量(tensor)表示数据,用“阶”表示张量的维度。关于这一点需要展开一下
0阶张量称为标量,表示单独的一个数
1阶张量称为向量, 表示一个一维数组
2阶张量称为矩阵,表示一个二维数组
……
张量是几阶的可以通过张量右边的方括号数来判断。例如 t = [ [ [ ] ] ],显然这个为3阶。
4、通过变量(Variable)维护状态
5、使用feed和fetch可以为任意的操作赋值或者从其中获取数据
Tensorflow是一个编程系统,使用图(graphs)来表示计算任务,图(graphs)中的节点称之为op(operation),一个op获得0个或者多个Tensor,执行计算,产生0个或多个Tensor,Tensor看作是一个n维的数组或列表。图必须在会话(Session)里被启动。
二、tensorflow基本框架知识
1、会话
1 import tensorflow as tf # 简写方便一点 2 3 # 创建两个常量(constant) 4 m1=tf.constant([[3,3]]) #一行两列的矩阵,这里是矩阵乘法,所以是二维数组,注意书写格式以及矩阵乘法规则
5 m2=tf.constant([[2],[3]]) #两行一列的矩阵 6 7 # 创建一个矩阵乘法(matmul)的op 8 product=tf.matmul(m1,m2) 9 print(product)
运行会得到显示结果,其中MatMul为节点名,0代表第0个输出;shape是维度,(1,1)代表一行一列的张量,长度为1;dtype指数据类型为整型。
Tensor("MatMul:0", shape=(1, 1), dtype=int32)
结果并不是想象中的是一个具体数字,而是一个Tensor,这是因为之前提到过 图必须在会话中运行,现在我们并未使用会话,所以只能得到一个Tensor。
定义会话有两种方法,一般使用第二种。
1 # method 1 2 sess=tf.Session() # 将Session简写为sess 3 result=sess.run(product) # 调用run方法执行图,这个触发了三个op(操作),两个常量的建立,矩阵的乘法 4 print(result) 5 sess.close() # 关闭会话
1 # method 2 2 with tf.Session() as sess: # Session()后面的()因为代码提示里没有,所以很容易丢 3 result=sess.run(product) 4 print(result) # with as的这种结构会自动关闭会话
运行显示结果为
[[15]]
注意:Session() 经常会写错,大小写问题和括号问题,都是典型错误,多加练习
2、变量
上文常量使用tf.constant()表示,变量是用tf.Variable()表示
1 import tensorflow as tf 2 3 x=tf.Variable([1,2]) # 定义一个变量,这里是张量的加减法,所以一维数组即可 4 a=tf.constant([3,3]) # 定义一个常量 5 6 sub=tf.subtract(x,a) # 增加一个减法op 7 add=tf.add(x,sub) # 增加一个加法op 8 9 init=tf.global_variables_initializer() # 在tensorflow中使用变量要初始化,此条语句也可以初始化多个变量,这句代码提示没有(),多加练习 10 11 with tf.Session() as sess: 12 sess.run(init) # 变量初始化,也要放在会话中,才能执行 13 print(sess.run(sub)) 14 print(sess.run(add))
运行将得到结果
[-2 -1]
[-1 1]
上述代码展示了变量的定义和初始化,但还没有体现变量的本质,下面一段代码实现变量a进行5次+1的操作
值得一提的是,在打印常量和变量时,不能像python中的直接print(a),而是也需要放在sess.run()中。
1 a=tf.Variable(0,name='counter') # 创建一个变量初始化为0,并命名为counter。(此段代码中命名无作用) 2 new_value = tf.add(a,1) # 创建一个加法op,作用是使state加1 3 update=tf.assign(a,new_value) # 此句话是赋值op,在tensorflow中,赋值也需要对应的op 4 init=tf.global_variables_initializer() # 变量初始化 5 with tf.Session() as sess: 6 sess.run(init) 7 print(sess.run(a)) 8 for i in range(5): 9 sess.run(update) 10 print(sess.run(a))
运行,显示结果为
0
1
2
3
4
5
注意:初始化时,pycharm会代码提示 tf.global_variables_initializer,但往往会把括号漏掉,需注意
常用的op现在除了加减乘除,还多了个assign()的赋值op
3、Fetch
sess.run([fetch1,fetch2]) 进行多个op,注意格式
1 import tensorflow as tf 2 3 input1 = tf.constant(3.0) 4 input2 = tf.constant(2.0) 5 input3 = tf.constant(5.0) 6 7 add = tf.add(input2,input3) 8 mul = tf.multiply(input1,add) 9 10 with tf.Session() as sess: 11 result = sess.run([mul,add]) # 执行了两个op,要注意格式 12 print(result)
运行,结果显示为
[21.0, 7.0]
这里需要提一下tf.matmul()是用于矩阵乘法,tf.multiply是用于点乘。正如上面这段代码的multiply
4、placeholder占位
定义变量时可先不输入具体数值,先占位,在会话中调用op时,再输入具体值。
import tensorflow as tf input1 = tf.placeholder(tf.float32) # 使用placeholder()占位,需要提供类型 input2 = tf.placeholder(tf.float32) output = tf.multiply(input1,input2) with tf.Session() as sess: print(sess.run(output,feed_dict={input1:8.0,input2:2.0})) # 以字典形式输入feed_dict
运行,显示结果为
[ 16.]
占位多组数据以后再说在下一篇随笔会提到。
以上就是一些比较基本的tensorflow概念的描述和代码实现。
本人初学者,有错误欢迎指出。感谢。