Tensorflow机器学习代码结构

2019年5月7日 145次阅读来源: keyAda

Tensorflow代码写了一段时间，总结一下我比较习惯的代码结构。

机器学习的程序可以宏观上分为数据和模型两部分，在Tensorflow当中，这种思想尤为明确：尽管模型和数据联系密切，但是基于Tensorflow架构的机器学习程序，模型是由Tensor组成的图，犹如一个大楼的水电气管道；而数据会以Session为接口从模型输入输出，即犹如水、电、气进入管道，进行运算和处理。

1. Tensorflow基本模型

习惯上，先搭建Tensorflow的模型，以RNN为例，模型结构如下：

《Tensorflow机器学习代码结构》 Tensorflow basic model

在__init__()部分，通过参数config将相关模型参数导入，程序如下：

import tensorflow as tf
class RNNmodel(object):
  def __init__(self, config):
    '''
    config: basic configaration parameters
    return: none
    '''
    self.Config = config
    with tf.name_scope('Input'):
      self.batchX_placeholder = tf.placeholder(tf.float32, [self.Config.input_size, self.Config.look_back], name='Input_Placeholder')
      self.batchY_placeholder = tf.placeholder(tf.float32, [self.Config.output_size, self.Config.look_back], name='Output_Placeholder')
    with tf.name_scope('RNNVariable'):
    '  ''Related RNN variables declaration'''
    with tf.name_scope('DenseVariable'):
      self.W2 = tf.Variable(np.random.rand(self.Config.output_size,self.Config.state_size), dtype=tf.float32, name='Wd')
      self.b2 = tf.Variable(np.zeros((self.Config.output_size, 1)), dtype=tf.float32, name='bd')
    self.states_series = []
    # prediction series placeholder
    self._predictions_series = None
    # total_loss placeholder
    self._total_loss = None
    # train step placeholder
    self._train_step = None
    # saver for the model
    self.saver = tf.train.Saver()

  def forwardProp(self):
    '''Forward propagation'''

  @property
  def predictions_series(self):
    if self._predictions_series is None:

    return self._predictions_series

  @property
  def total_loss(self):
    if self._total_loss is None:
    
    return self._total_loss

  @property
  def train_step(self):
    if self._train_step is None:
   
    return self._train_step

2. 训练及预测模型

对Tensorflow模型的训练和预测，需要结合数据展开，该部分包含三个步骤：

Tensorflow基本Tensor模型的实例化
数据预处理（数据划分为训练、交叉检验、以及预测部分）
通过Session将数据输入到模型进行训练、交叉检验以及预测
在时间序列模型当中，我习惯将该部分写成一个class，__init__部分实现对基本模型的实例化、数据预处理，另外包含train_validate()以及test()，两个成员函数分别实现单次数据训练、交叉检验以及测试（预测）。

3. 其他

这里记录一些在书写代码时候的习惯，

Tensorflow的结构注明节点和节点域名称，便于理解和可视化结构
对于程序可能出现的bug，给定对应的try: except
不同的参数和函数声明时进行相关注释
避免内存溢出，可以考虑手动释放垃圾内存
class内部成员函数中的局部变量和self成员变量：减少不必要的self成员变量，节约内存消耗

    原文作者：keyAda
    原文地址: https://www.jianshu.com/p/13e00c44cc60
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。