在
python中使用matplotib,可以通过提供要绘制的项目列表以及权重列表来制作简单的直方图,使得每个项目对其所属的仓的贡献根据其权重来调整,例如,
import matplotlib.pyplot as plt
...
plt.hist(items, weights = weightsOfItems)
我试图绘制两个值相互对齐的六边形bin直方图,这可以使用
plt.hexbin(xValues, yValues)
和以前一样,我希望根据权重列表调整每对对其所属的bin的贡献.从hexbin
documentation开始,似乎我应该能够通过给出参数C的输入来做到这一点,即
plt.hexbin(xValues, yValues, C = weightsOfValues)
但是,这样做会产生完全不正确的图.目前我已经根据权重首先对xValues和yValues进行采样,以得到xSamples和ySamples.然而,这个过程非常耗时,也意味着我没有使用所有可用的数据,因为我摆脱了样本中未包含的xValues和yValues.
那么,有没有人知道一种生成六边形区间直方图的方法,其中根据给定的权重调整值对各自区间的贡献?
最佳答案 根据
documentation:
If
C
is specified, it specifies values at the coordinate (x[i]
,y[i]
). These values are accumulated for each hexagonal bin and then reduced according toreduce_C_function
, which defaults to numpy’s mean function (np.mean
). (IfC
is specified, it must also be a 1-D sequence of the same length asx
andy
.)
这意味着对于每个bin,存储相应的C值,然后将reduce_C_function应用于它们.由于默认函数是np.mean,因此结果不是您想要获得的结果而是平均值而不是总和.要实际获得所有权重的总和,应将其更改为np.sum,以便对bin中每个(x,y)的C值求和,而不是对它们求平均值.
此示例显示了与简单数据的区别:
N = 10**5
x = np.random.normal(size=N)
y = np.random.normal(size=N)
plt.figure(figsize=(12,4)); plt.subplot(131)
plt.hexbin(x,y); plt.colorbar()
plt.subplot(132)
plt.hexbin(x,y,C=np.ones(N)); plt.colorbar()
plt.subplot(133)
plt.hexbin(x,y,C=np.ones(N),reduce_C_function=np.sum)
plt.colorbar(); plt.tight_layout()
现在,对于所有值(从高斯分布生成),权重设置为1,因此加权直方图的正确算法应返回与未加权直方图相同的算法.输出如下:
左侧面板是未加权的图,显示2D高斯,中间面板是C的默认行为,平均每个bin的所有C值,因此,所有箱中的计数为1,右侧面板是np.sum,检索2D高斯.