深度学习 – 使用深度学习在回归中获得多个输出

2019年7月28日 336次阅读

给定手的RGB图像和手的关键点的3d位置作为数据集,我想将此作为DL中的回归问题.在这种情况下,输入将是RGB图像,并且输出应估计关键点的3d位置.

我已经看到了一些关于回归的信息,但大多数都试图估计一个单一值.是否可以同时估算多个值(或输出)？

现在我已经提到了这个code.这家伙正试图估计一个人在图像中的年龄.

最佳答案只要您很好地定义损失函数,来自神经网络的输出向量就可以表示任何内容.假设你要检测10个关键点的(x,y,z)坐标,那么就只有30个元素的长输出矢量说(x1,y1,z1,x2,y2,z2 ………. ….,x10,y10,z10),其中xi,yi,zi表示第i个关键点的坐标,基本上你可以使用任何你觉得方便的顺序.小心你的损失功能.假设您想要计算RMSE损失,您必须正确提取三角形,然后计算每个关键点的RMSE损失,或者如果您熟悉线性代数,只需将其重新整形为3×10矩阵,并将结果也设为3×10矩阵,然后只是使用

loss = tf.sqrt(tf.reduce_mean(tf.squared_difference(Y1, Y2)))

但是,一旦你制定了你的网,你将不得不坚持下去.