使用python中的元素进行六边形绘制


python中使用matplotib,可以通过提供要绘制的项目列表以及权重列表来制作简单的直方图,使得每个项目对其所属的仓的贡献根据其权重来调整,例如,

import matplotlib.pyplot as plt

...

plt.hist(items, weights = weightsOfItems)

我试图绘制两个值相互对齐的六边形bin直方图,这可以使用

plt.hexbin(xValues, yValues)

和以前一样,我希望根据权重列表调整每对对其所属的bin的贡献.从hexbin documentation开始,似乎我应该能够通过给出参数C的输入来做到这一点,即

plt.hexbin(xValues, yValues, C = weightsOfValues)

但是,这样做会产生完全不正确的图.目前我已经根据权重首先对xValues和yValues进行采样,以得到xSamples和ySamples.然而,这个过程非常耗时,也意味着我没有使用所有可用的数据,因为我摆脱了样本中未包含的xValues和yValues.

那么,有没有人知道一种生成六边形区间直方图的方法,其中根据给定的权重调整值对各自区间的贡献?

最佳答案 根据
documentation

If C is specified, it specifies values at the coordinate (x[i],y[i]). These values are accumulated for each hexagonal bin and then reduced according to reduce_C_function, which defaults to numpy’s mean function (np.mean). (If C is specified, it must also be a 1-D sequence of the same length as x and y.)

这意味着对于每个bin,存储相应的C值,然后将reduce_C_function应用于它们.由于默认函数是np.mean,因此结果不是您想要获得的结果而是平均值而不是总和.要实际获得所有权重的总和,应将其更改为np.sum,以便对bin中每个(x,y)的C值求和,而不是对它们求平均值.

此示例显示了与简单数据的区别:

N = 10**5
x = np.random.normal(size=N)
y = np.random.normal(size=N)
plt.figure(figsize=(12,4)); plt.subplot(131)
plt.hexbin(x,y); plt.colorbar()
plt.subplot(132)
plt.hexbin(x,y,C=np.ones(N)); plt.colorbar()
plt.subplot(133)
plt.hexbin(x,y,C=np.ones(N),reduce_C_function=np.sum)
plt.colorbar(); plt.tight_layout()

现在,对于所有值(从高斯分布生成),权重设置为1,因此加权直方图的正确算法应返回与未加权直方图相同的算法.输出如下:

《使用python中的元素进行六边形绘制》

左侧面板是未加权的图,显示2D高斯,中间面板是C的默认行为,平均每个bin的所有C值,因此,所有箱中的计数为1,右侧面板是np.sum,检索2D高斯.

点赞