一、概述
介绍TPU,需要使用XLA编译,否则没有做内部优化,无法达到加速的效果;
TPU相关的性能分析器:
二、新版本的输入库
之前TensorFlow的输入方式:
- feed_dict: 太过于低效
- Queue: python多线程,全局锁的问题;同样低效,而且对应其中错误的数据无法友好处理;
现在: input pipeline
相关函数:
Dataset.XX()
Dataset.XXX()
Dataset.XXXX()
三、learn2learn
功能: 由机器来设计神经网络
依据: 进化算法
解决性能问题工具:
1、timeline —- 通过chrome来对结果进行分析
2、nvprof
3、XXX
四、高层API:
- Estimators
- keras
- canned Estimators
只有Estimators支持分布式TensorFlow;
recommended:
使用高级api
Estimators
用tf.layer 或 tf.keras 来自定义模型
TF Serving:
用于将训练好的模型部署到生产环境中;
- C++ lib
- 模型保存、输出
- 通用核心架构
- Binaries
- 有一些自带的功能
- 支持docker等
五、TF Lite:
用于支撑小型设备,例如手机等嵌入式设备