试图实施着名的橙/苹果金字塔混合(
cv2 Image Pyramids).
注意:两种图像形状均为307×307.
但是,由于结果图像由于cv2.subtract和cv2.add中的剪切值而模糊(如cv2 vs numpy Matrix Arithmetics中所述),我使用了numpy算术,而不是像StackOverflow: Reconstructed Image after Laplacian Pyramid Not the same as original image中所建议的那样.
我通过在一个图像上执行金字塔来测试这个,并且使用金字塔构造的结果图像具有相同的Max,Min,Average像素值,而不是使用cv2算术.
然而,在金字塔等级7上,结果图像获得红点的“噪声”,而在等级9上,结果图像获得许多绿色像素噪声. Images of levels 6, 7, 9 – Imgur Album.
有什么想法会发生这种情况吗?我想说的金字塔等级9绿色噪音是因为图像低于1×1的形状.但是7级金字塔上的红点怎么样?
>编辑:已添加代码
numberOfPyramids = 9
# generate Gaussian pyramids for A and B Images
GA = A.copy()
GB = B.copy()
gpA = [GA]
gpB = [GB]
for i in xrange(numberOfPyramids):
GA = cv2.pyrDown(GA)
GB = cv2.pyrDown(GB)
gpA.append(GA)
gpB.append(GB)
# generate Laplacian Pyramids for A and B Images
lpA = [gpA[numberOfPyramids - 1]]
lpB = [gpB[numberOfPyramids - 1]]
for i in xrange(numberOfPyramids - 1, 0, -1):
geA = cv2.pyrUp(gpA[i], dstsize = np.shape(gpA[i-1])[:2])
geB = cv2.pyrUp(gpB[i], dstsize = np.shape(gpB[i-1])[:2])
laplacianA = gpA[i - 1] - geA if i != 1 else cv2.subtract(gpA[i-1], geA)
laplacianB = gpB[i - 1] - geB if i != 1 else cv2.subtract(gpB[i-1], geB)
lpA.append(laplacianA)
lpB.append(laplacianB)
# Now add left and right halves of images in each level
LS = []
for la, lb in zip(lpA, lpB):
_, cols, _ = la.shape
ls = np.hstack((la[:, : cols / 2], lb[:, cols / 2 :]))
LS.append(ls)
# now reconstruct
ls_ = LS[0]
for i in xrange(1, numberOfPyramids):
ls_ = cv2.pyrUp(ls_, dstsize = np.shape(LS[i])[:2])
ls_ = ls_ + LS[i] if i != numberOfPyramids - 1 else cv2.add(ls_, LS[i])
cv2.imshow(namedWindowName, ls_)
cv2.waitKey()
最佳答案 在阅读了关于拉普拉斯金字塔的原始
article之后,我发现我误解了这种方法,我们可以完全重建原始图像而不模糊,因为我们使用了额外的像素信息.而裁剪值确实会导致模糊.那么现在我们又回到了开头:)
所以你发布的代码仍然是剪切值,我建议你使用int16来保存laplacian金字塔,而不是使用cv2.subtract.希望它有效.