大数乘法（快速傅立叶变换）上

2019年3月24日 218次阅读来源: 大整数乘法问题

在谈论大数乘法前，先来看看多项式乘法，假设

A = 7x^3 + 5x^2 + 3x + 4

B = 4x^2 + 6

C = A * B

那传统的做法就是这样：

7x^3 + 5x^2 + 3x + 4

4x^2 + 6

—————————————

+42x^3 + 30x^2 + 18x + 24

28x^5 + 20x^4 +12x^3 + 16x^2

———————————————————–

28x^5 + 20x^4 + 54x^3 + 46x^2 + 18x + 24

若A 和 B 都有 n 个系数，很明显这样做的时间复杂度为O(n^2)，当n很大时效果相当不理想

像 B = 4x^2 + 6 这样的式子叫系数表示法；如果我们把 B 一般化，即 B = b0 + b1x + b2x^2；则我们至少需要 3 对 (x, y) 值才能求出 b0, b1, b2。这里 b0 = 6, b1 = 0, b2 = 4；例如 B 在x0 = 1, x1 = 2, x2 = 3 的情况下的解分别为 y0 = 10, y1 = 22, y2 = 42。那我们也可以用 {(1, 10)，(2, 22)，(3, 42)}，即 {(x0, y0)，(x1, y1)，(x2, y2)} 来表示唯一的多项式B，即假如我们在不知道b0, b1, b2的情况下可以用{(1, 10)，(2, 22)，(3, 42)} 来唯一表示多项式B，即唯一确定b0, b1, b2。当然 x0, x1, x2 也可以取其他值，但对于这个例子一定要取够3个，因为有3个未知数 b0, b1, b2；对应的 y0, y1, y2 也会不同，这就叫点值表示法。

为什么要这样做？还是上面那个例子，我们用点值表示法算一遍C = A * B，（A 和 B 的xi要对应相同）还是假设取x0 = 1, x1 = 2, x2 = 3，我们发现 A 有4个未知数，所以要多一个x3，假设x3 = 4；为了方便计算，我们把 B 的 (x3, y3) 也算出来。

A = {(1, 19)，(2, 86)，(3, 247)，(4, 544)}

B = {(1, 10)，(2, 22)，(3, 42)，(4, 70)}

xi 不变，yi对应相乘得到 Ci = (xi, yai * ybi)

C = {(1, 190)，(2, 1892)，(3, 10374)，(4, 38080)}

到这里我们发现对于一般情况的等长度的两个多项式相乘，结果的长度会接近加倍，比如

A = a0 + a1x + a2x^2 + a3x^3

B = b0 + b1x + b2x^2 + b3x^3

C = A * B = c0 + c1x + c2x^2 + c3x^3 + c4x^4 + c5x^5 + c6x^6

因此有n个系数的两个多项式相乘（比如A * B）时仅用其n个点值相乘是不能正确表示结果的（比如C），所以我们要使用足够多的点值，比如这里 A 和 B 都应该至少使用7个点值。如下（数有点大，偷下懒。。。）

A = {(x0, y0)，(x1, y1)，(x2, y2)，(x3, y3)，(x4, y4)，(x5, y5)，(x6, y6)}

B = {(x0, y0′)，(x1, y1′)，(x2, y2′)，(x3, y3′)，(x4, y4′)，(x5, y5′)，(x6, y6′)}

C = {(x0, y0*y0′)，(x1, y1*y1′)，(x2, y2*y2′)，(x3, y3*y3′)，(x4, y4*y4′)，(x5, y5*y5′)，(x6, y6*y6′)}

这样C的点值才能表示唯一的6次多项式（7个未知系数有6次幂），最后，用某方法（重点下面讲）把C的点值表示法转换成系数表示法就达到了目的，这个过程叫插值

所以，先理下思路

1）分别计算A、B足够多的点值（也叫求值），使其能唯一表示C（如A、B的系数都有n个，则通常扩展到2n个点值）

2）点乘：即A、B点值对应相乘得到C

3）插值：把C的点值表示法转换为系数表示法

其中点乘的复杂度显然为O(n)，我们记N = 2n（记住了下面要用的~），所以我们如能找到一种方法能够快速对A、B进行求值，插值，那目的就达到了，事实上也的确有这样的方法，这也是多项式乘法的重点，不然都没法往下讲。。。

—————————————————————————————————————————————————-

先看求值，y = a0 + a1x + a2x^2 + … + anx^n 给出一个 x 要求 y 如果按正常顺序求需要做 (1 + n) * n / 2 次乘法和 n 次加法；这种方法肯定是不可取的，因为算一个值都要 O(n^2)，那算 N 个值就是 O(n^3) 了，比系数表示法直接乘还慢~

再来看另一种方法，国产方法，没错就是它，秦九韶算法（在国外也叫霍纳(Horner)法则）；为了理解方便，我们举个短的例子 y = a0 + a1x + a2x^2 + a3x^3；那它就可以化为 y = a0 + x(a1 + x(a2 + a3x))，这样对某个x求y就需要做 n 次乘法和 n 次加法，算 N 个值的复杂度为 O(n^2)。比上面的好了点，不过跟系数表示法相比并没有什么优势~

所以我们需要第三种方法，这种方法的特点其实是在 xi 的选取上很特殊；它选的 xi 不是从 x0 = 1, x1 = 2, … , xn = n 或者其他一些相异的整数或实数；它选的是复数！当然也不是乱选的，因此我们要先在这里停一下，吸口气，去打下复数的基础。。。

———————————————————————————————————————————————————

z = x + yi 这是常见的复数表示形式大家都知道，|z| = sqrt(x^2 + y^2) 表示复数的模

用建立了笛卡尔直角坐标系的平面表示复数的平面叫做复平面

下面必须盗图了（来自《复变函数与积分变换》）不难的，请坚持看完！

《大数乘法（快速傅立叶变换）上》

复数的指数式也称为欧拉公式，它更像是一种定义。欧拉公式是非常美妙的式子，为什么要引入它呢？主要是为了简化计算！因为 z = x + yi 可以表示成 z = r*(cosθ + i*sinθ)，r = |z|。看个例子：

《大数乘法（快速傅立叶变换）上》

所以用指数式表示复数是很简洁的，我们最后的求值与插值的方法也是用复数的指数式表示。

这里有一点要提一下，有人说 θ = 0 时，e^(θi) = e^(0*i) = 1；结果没有错，但不是这样算的。e^(θi) 不能理解为 e^(θ*i)；那个不是乘号，只是一种记号。正确解法应该把它展开算 e^(θi) = cosθ + isinθ = cos0 + isin0 = 1

设 z 为复数，n 为正整数，若存在复数 w 满足方程 w^n = z；

《大数乘法（快速傅立叶变换）上》

重要的事情说三遍：

在几何上 z^(1/n) 的 n 个值就是以原点为中心，r^(1/n) 为半径的圆的内接正 n 边形的 n 个顶点。

还有上面的公式 z = e^(iθ) != 0，wk = (r^(1/n)) * e^(i(θ+2*k*pi) / n)。θ 为 z 在复平面中向量表示的幅角。

做个题目理解下：

《大数乘法（快速傅立叶变换）上》

这里幅角为 0，因为 z = 1 = e^(0i)；这里也可以讲一下为什么解有三个，因为如果还有个解 w4 的话，那依据公式 w4 = e^(i(6*pi/3)) = e^(i(2*pi)) = cos(2*pi) + isin(2*pi) = 1；w4 = w0 有没有！依次类推：w5 = w1，w6 = w2 … 。这样就只有3个不同的解了。

在这里我们想想：e^(ia) * e^(ib) 会不会等于 e^(i(a + b)) 呢？动手算一下：
e^(ia) * e^(ib) = (cos(a) + isin(a)) * (cos(b) + isin(b))
= cos(a)cos(b) – sin(a)sin(b) + i(sin(a)cos(b) + cos(a)sin(b))
三角函数和角公式嘛，我们都懂~
e^(ia) * e^(ib) = cos(a + b) + isin(a + b)
= e^(i(a + b))

我们再来算下 w1* w2 = e^(i(2*pi/3)) * e^(i(4*pi/3)) = e^(i(6*pi/3)) = e^(i(2*pi)) = 1 = w0，不难推出 wj * wk = w((j+k)mod(n)) ，类似可以有 w(-1) = w(n-1)

根据3个 w 的指数式很容易画出它们在复平面上的位置：
《大数乘法（快速傅立叶变换）上》

再举个幅角不是0的例子，根据公式不难算的：

这个就不画了，想加深理解可以自己画一下~

——————————————————————————————————————————————————–

接下来才是高能部分：

我们前面讲了，在对 A = a0 + a1x + a2x^2 + … + a(N-1)x^(N-1) （我们假设A的系数有 N（前面讲过N = 2n）个，即a0 ~ a(N-1)）求值时我们选的 N 个 xi (0 <= i < N) 用的是复数，那现在告诉你这 N 个 xi 就是 w^N = 1 的 N 个解，w0 ~ wN 叫N 次单位复根。即 x0 ~ xN 分别等于 w0 ~ wN；

这里的 N 也就是一种记号，如果看不顺，理解成 n 也是没问题的~

再上一遍公式

《大数乘法（快速傅立叶变换）上》

对于 N 次单位复根的求解，θ 值为 0 ，r^(1/N) = 1。其中解 w1 = e^(i(2*pi/N)) 叫主单位复根；其实也就是把一个圆分成 N 份，w1 表示每份的大小，只不过是在复平面上表示。

下面我们要换下记号了

记 N 为 n

则 A = a0 + a1x + a2x^2 + … + a(n-1)x^(n-1)

也可记为《大数乘法（快速傅立叶变换）上》

原来的各个单位复根 w0, w1, … , w(n-1) 记为《大数乘法（快速傅立叶变换）上》，下标的 n 就是对单位复数 1 开 n 次方的意思，很简单大家都能明白。这样是因为下面的计算会改变下标。

那用《大数乘法（快速傅立叶变换）上》代入 xk 来求解 A(xk) 就可以表示为 (0 <= k <= n-1)

如果把 A 的系数用向量表示 a = {a0, a1, a2, …, a(n-1)}，把求出的所有 y 值也用向量表示 y = {y0, y1, y2, … , y(n-1)}，那我们可以称向量 y 为向量 a 的离散傅立叶变换（Discrete Fourier Transform, DFT）。我们的目的之一就是把向量 a 的离散傅立叶变换（即向量 y ）快速地算出来，我们使用的是一种叫快速傅立叶变换（FFT）的算法。这里我们可以猜到，FFT 算法起码要比系数表示法直接相乘的 O(n^2) 的复杂度更低才行，幸运的是，FFT 的时间复杂度是 O(n*logn)；下面讲的是 FFT 是怎样快速地计算向量 y 的。

在讲FFT之前需要讲清楚一件事，就是上面所讲的 n 到底是多大？

举个例子吧，比如：

A = 3 + 2X^2 + 4X^3 + 6x^4

B = 2x + X^2 + 5X^3

以 A 举例（B类似），它可以写成标准式：A = a0 + a1x + a2x^2 + a3x^3 + a4x^4；这里有 5 个系数，根据前面讲的为了能正确表示 A 与 B相乘的结果 C，我们把 A 放大到 A = a0 + a1x + … + a9x^9，使它变成10个系数（当然 a5 ~ a9 的值都是 0，B 类似），同时用 A 和 B 的 10 个点值计算C。不过对于 FFT 算法，这样扩大是不行的；根据算法要求（下面会讲清楚，现在不用管），我们要确保 n 为 2 的幂，所以 A 有 5 个系数，不是 2 的幂，我们应该把它先扩大到比5大且离 5 最近的那个 2 的幂，即 2^3 = 8。然后再把 8 扩大两倍变成 16；这才是 A B 两个多项式相乘的最终的 n。当然原来系数个数就是 2 的幂的话就只需要把它扩大两倍就行了。当系数个数为 513 的话，没错，要先把它扩大成1024个系数，然后再放大两倍变成 2048个系数；就是这么狠！想想这样有点耗空间~

所以最终的 A = a0 + a1x + a2x^2 + a3x^3 + … + a(n-1)x^(n-1) 中的系数个数，即 n 必须是 2 的幂，我们总能够通过添加 ai = 0 满足需要。

FFT 算法运用了分治策略，这下有点理解为什么 n 要是 2 的幂了吧~，什么是分治策略就不展开讲了，不懂的就搞清楚了再往下看。

《大数乘法（快速傅立叶变换）上》