标签：machine-learning

机器学习 – Tensorflow Loss转向NaN

我正在使用tf.nn.sigmoid_cross_entropy_with_logits函数进行损失,它将进入NaN. 我已经在使用渐变剪辑,一个执行张量除法的地方,我添加了一个epsilon来防止除零,并且所有soft…

我正在使用Gensim来训练Word2Vec.我知道如果单词可以互相替换并且在句子中有意义,那么单词的相似性就会受到影响.但是,可以使用单词相似性来提取实体之间的关系吗？例：我有一堆面试文件,在每次采访中,受访者总是说…

我正在尝试基于流行的 slim implementation mobilenet_v2训练一个张量流模型,并观察行为我无法解释相关(我认为)批量规范化. 问题摘要推理模式中的模型性能最初得到改善,但在很长一段时间后开始…

我正在处理有限数量的大尺寸图像,每个图像可以有3072 * 3072像素.为了使用FCN或U-net训练语义分割模型,我构建了大量训练集样本,每个训练图像为128 * 128. 在预测阶段,我所做的是将大图像切割成小块,…

我有一个.tfrecords文件填充标记数据.我想将X％用于培训,使用(1-X)％进行评估/测试.显然不应该有任何重叠.这样做的最佳方式是什么？下面是我阅读tfrecords的小块代码.有什么办法可以让shuffle_…

我正在玩机器学习.特别是Q-Learning,你有一个状态和行动,并根据网络的运作情况给予奖励. 现在对于初学者来说,我为自己设定了一个简单的目标：训练一个网络,以便为井字游戏(与随机对手相比)发出有效的动作.我的问题是…

我试图创建一个卷积神经网络,用于识别具有这些物体组合的大型数据集中的动物,车辆,建筑物,树木,植物. 在培训时,我对网络的训练方式产生了疑问.我怀疑的是,我是否可以将整个动物的数据集作为单一属性训练网络或分别训练每只动物…

我正在使用Keras通过使用model.train_on_batch(x_batch,y_batch)开发在线学习应用程序.我试图逐步添加训练数据,并绘制测试和训练的损失.结果如下, My result 很高兴看到测试损…

嗨,我想进入tensorflow,感觉有点愚蠢. TF中的log_loss与sklearn的不一样吗？以下是我的代码中的一些行,我是如何计算的： from sklearn.metrics import log_loss…

我已经实现了基于矩阵分解技术的推荐系统.我想评估它. 我想使用All-but-one协议(https://ai2-s2-pdfs.s3.amazonaws.com/0fcc/45600283abca12ea2f422e3…

在一个完美的信息环境中,我们能够知道一个动作后的状态,比如下棋,是否有理由使用Q学习而不是TD(时间差异)学习？据我所知,TD学习将尝试学习V(状态)值,但Q学习将学习Q(状态动作值)值,这意味着Q学习学习较慢(因为状…

我想禁用caffe中某些卷积层的反向计算,我该怎么做？我使用了propagate_down设置,但是发现它适用于fc层但不适用于卷积层. 请帮忙〜第一次更新：我在test / pool_proj层设置了propaga…