一、 问题描述:
计算 (a^power) % m , 其中power 是非负的大整数, a, m 为大于1 的整数。
二、 问题分析:
很显然, 由于 power 是大整数,因此,必须考虑到幂计算的溢出问题。怎么避免溢出呢? 可以通过降低幂次、逐次取模来实现。一个自然的想法是,将power 分成两个整数之和, power = n1 + n2,则 a^power = (a^n1) * (a^n2) . 通常采用二分法, n1 = n2 或 |n1-n2| = 1 。这就涉及到 (a * b) % m 的计算 。
不难证明: (a * b) % m = ((a % m) * (b % m)) % m。
证明如下: 设 a = pm + r1, b = qm + r2 , 则 r1 = a % m, r2 = b % m ,
则 (a * b) % m = (r1 * r2) % m = ((a % m) * (b % m)) % m. 证毕。
特别地,当 a = b 时, (a^2) % m = ((a % m)^2) % m ; 这是一个简单却又关键性的结论。
三、 算法设计:
算法1: 分治策略:
(1)若power 为奇数: 令 power = 2k+1, k 为非负整数 , 则
a^(2k+1) = (a^k)^2 *a ; a^(2k+1) % m = ((a^k % m)^2 % m * a) % m
(2) 若power 为偶数: 令 power = 2k, k为非负整数, 则
a^(2k) = (a^k)^2 ; a^(2k) % m = (a^k % m)^2 % m
(3) 若power == 1 : 返回 a % m ; 若 power == 0: 返回 1 % m。
据以上(1)/(2)/(3) 条, 即可设计出相应的递归求解程序。时间复杂度为T(n) = T(n/2) + C = O(logn) ,空间复杂度为 O(1), 不足之处在于有一定的递归调用开销。
算法2: 整数的二进制分解
将大整数 power 按照二进制进行分解:
power = a[N] * 2^N + a[N-1] * 2^(N-1) + … + a[1] * 2 + a[0]
其中: a[i] 取值为 0 或 1 ( i=0,1,.., N),则
a^power = a^(a[N] * 2^N) * a^(a[N-1] * 2^(N-1)) * … * a^(a[1] * 2) * a^a[0]
很显然:
(1) 若 a[i] = 0, 则 a[i] * 2^i = 0 , a^(a[i]*2^i) = 1, 该乘积项可以消去;
(2) 若 a[i] = 1, 则 a[i] * 2^i = 2^i , a^(2^i) % m = (a^(2^(i-1)) % m)^2 % m.
令 temp = a^(2^(i-1)) % m , 则 a^(2^i) % m = (temp * temp) % m。
比如, power = 26 = 16 + 8 + 2 = (11010)2, 则 a^26 = a^(2^4 + 2^3 + 2^1);
计算 a^power 实际上是计算 power 的二进制表示中所有位为1对应的乘积项。
(a^26) % m = ((a^16 %m) * (a^8 %m) * (a^2 % m)) %m
而, a^8 % m = ((a^4 %m) × (a^4%m)) % m 是可以用动态规划法逐次求解的。 简单起见, 将 (a^i) % m 称为 “取模乘积项”。
算法描述:
令 temp = a^(2^i) % m , i 是 power 的当前二进制位所对应的位置,
temp 表示 power 的当前二进制位所对应的(取模)乘积项
STEP1: 初始化 temp 为 a % m , result = 1;
STEP2: 对 power 进 行二进制分解。 若 power >=1 , 则进行模2运算:否则转至 STEP3
[1] 若余数为1, 则该位置上的二进制为1, 乘积中需要加入此时的 temp 项 : result = (result * temp) % m;
下一个二进制位对应的乘积项为 temp = (temp * temp) % m
[2] 若余数为0, 则该位置上的二进制为0,乘积中不需要加入 temp 项, result 保持不变,
下一个二进制位对应的乘积项为 temp = (temp * temp) % m
STEP3: 所有的二进制位对应的乘积项都已计算,算法结束。
比如, result = (3^26) % 5 的计算过程如下:26 = (11010)2 ;
(1)初始化: temp = 3^1 % 5 = 3;, result = 1 ;
(2) 检测 26 的最低位二进制为0, 则 不加入乘积项,result = 1, temp =(3^2) % 5 = (temp * temp) % 5 = 4
(3) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 3 = 4 , temp = (3^4) % 5 = (4*4) % 5 = 1;
(4) 检测 26 的次低位二进制为0, 则 不加入乘积项, result = 4, temp = (3^8) % 5 = (1*1) % 5 = 1;
(5) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 5 = 4, temp = (3^16) % 5 = 1;
(6) 检测 26 的次低位二进制为1, 则 加入乘积项, result = (result * temp) % 5 = 4, temp = (3^32) % 5 = 1.
由于所有位都检测完毕, 故 3^26 % 5 = 4. 由上可知,
3^26 % 5 = ((3^16) % 5)) * ((3^8) % 5) * ((3^2) % 5) % 5. 其中 3^16 % 5, 3^8 % 5, 3^2 % 5 是通过动态规划法逐渐求得的。
完整的程序如下:
程序在 Ubuntu10.10 gcc4.4.5 环境下编译运行通过。
$ gcc -g -Wall bintmode.c runtime.c -o bintmode # 编译连接
$ bintmode or gdb bintmode # 运行
/*
* bintmode.c : 此程序计算 (a^power) % mod. power 是大整数
* 基本公式: (a*b) mod m = ((a mod m) * (b mod m)) mod m
*/
#include <stdio.h>
#include <assert.h>
int modMRec(int, int, int);
int modMDyn(int, int ,int);
void testModMRec(int);
void testModMDyn(int);
void testValid(int (*fun)(int a, int power, int mode));
void testInvalid(int (*fun)(int a, int power, int mode));
int main()
{
printf(" ******** 使用递归技术求解: ******** \n");
testValid(modMRec);
/* testInvalid(modMRec); */
defRuntime(testModMRec);
printf(" ******** 使用二进制分解技术求解: ******** \n");
testValid(modMDyn);
/* testInvalid(modMDyn); */
defRuntime(testModMDyn);
return 0;
}
/*
* modMRec: 递归求解 (a^power) % mod , power 是个大整数
*/
int modMRec(int a, int power, int mod)
{
assert(a>=1 && power >=0 && mod >=1);
if (power == 0) {
return 1 % mod;
}
if (power == 1) {
return a % mod;
}
if (power % 2 != 0) {
int temp = modMRec(a, power/2, mod);
return (temp * temp * a) % mod;
}
else {
int temp = modMRec(a, power/2, mod);
return (temp * temp) % mod;
}
}
/*
* modMDyn: 使用二进制分解技术求解 (a^power) % mod , power 是个大整数
*/
int modMDyn(int a, int power, int mod)
{
assert(a>=1 && power >=0 && mod >=1);
int result = 1;
int temp = a % mod;
while (power >= 1) {
if (power % 2 != 0) {
result = (result * temp) % mod;
}
temp = (temp * temp) % mod;
power /= 2;
}
return result;
}
void testValid(int (*fun)(int a, int power, int mode))
{
int base[5] = {2,3,5,7,11};
int i,k;
for (i=0; i < 5; i++) {
for (k = 0; k < 20; k++) {
printf("%d ^ %d mod %d = %d .\n", base[i], k, 10, (*fun)(base[i], k, 10));
}
}
}
void testInvalid(int (*fun)(int a, int power, int mode))
{
printf("0 ^ 3 mod 5");
(*fun)(0, 3, 5);
printf("3 ^ -1 mod 5");
(*fun)(3, -1, 5);
printf("3 ^ 5 mod 0");
(*fun)(3, 5, 0);
}
void testModMRec(int n)
{
modMRec(2, n, 10);
}
void testModMDyn(int n)
{
modMDyn(2, n , 10);
}
#include <stdio.h>
#include <time.h>
#define MAX_SCALE 10
long defScale[MAX_SCALE] = {1, 10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000, 1000000000};
/* runtime: 测量 fun 指向的函数的运行时间
* fun: 指向测试函数的指针 ;
* scale: 问题规模数组
*/
void runtime(void (*fun)(long scale), long* scale, int len);
void defRuntime(void (*fun)(long scale));
void runtime(void (*fun)(long scale), long *scale, int len)
{
int i;
clock_t start, end;
for (i = 0; i < len; i++) {
start = clock();
(*fun)(scale[i]);
end = clock();
printf("scale: %12ld\t run time: %8.4f (ms). \n", scale[i], ((double)(end-start)) * 1000 / CLOCKS_PER_SEC);
}
}
void defRuntime(void (*fun)(long scale))
{
runtime(fun, defScale, MAX_SCALE);
}
四、总结: 关于科学计算的算法
1. 往往要先查阅相关资料,了解相应的数学性质及结论,并对问题进行化简;例如本例中使用 (a*b)%m = ((a%m)*(b%m))%m 的模性质,避免了乘法溢出的问题。
2. 可以首选分治法和二进制分解法。分治法将所要求解的数值规模减半,而二进制分解则从数值的一个特别角度来寻求问题的解答。