机器学习 – 具有固定协方差的高斯核密度估计(使用python)

我可以通过简单的运行使用scipy库执行高斯核密度估计

from scipy import stats
kernel = stats.gaussian_kde(data)

但是我想将协方差修正为某个预定义值并用它来执行KDE.有没有一种简单的方法可以在没有明确编写优化过程的情况下在python的帮助下实现这一点(如果没有现有的库提供这样的功能,我将会这样做,但我希望避免它).

最佳答案 从我的评论:

通常,对于密度估计,所涉及的高斯函数用作“窗口”函数,并且该窗口的“协方差”(实际上是1-D情况下的带宽参数)仅用于控制窗口的响应如何作为被测点的距离函数.我不熟悉任何寻求使用特定的多元协方差结构来实现这种窗口衰减效应的KDE程序.

我还猜想在实践中最复杂的这种“协方差”将是一个对角矩阵,你只需要为数据的每个维度使用不同的带宽参数.也许(这可能是非常脆弱的)你可以对数据的主要方向进行某种PCA细分并将不同的带宽放在那里,但我认为除非数据方向有着截然不同的尺度,否则这种情况极不可能得到回报.在开始使用KDE之前,最好只对输入进行评分,并使用一个带宽.

如果您从scikits.learn及其KernelDensity class的文档中读取KDE examples,它们似乎(如SciPy)它们只是为您提供带宽功能(单个浮点数)来总结内核的repsonse应该脱落的方式.

对我而言,这表明对多变量带宽设置进行大量控制并不具有实际意义.最好的办法是执行一些评分或标准化来转换输入变量,使它们具有相同的比例(以便在相同比例的每个方向上平滑),然后使用KDE预测或分类值转换空间,如果要返回原始缩放空间,则对每个坐标应用逆转换.

点赞