浅谈将一个字符串转换为整数

       前一段时间刷到“把一个字符串转换为整数”这道题。据说是微软面试开发工程师最常用到的一个问题。写出了最终版本之后,竟然花费了大量的时间,这让我感到自己考虑问题还不是那么全面。所以,以此为例,一来想好好记住这个解题方法;二来是想要保持逻辑上这种解题思路。做以总结。

很多人拿到题都会迅速的写出如下代码:


 int transform(char* string){ 

   int num=0;
   while(*string++){ 
   num=num*10+num-'0';
 
 }
   
   return number;
}

       乍一看之下,可能会觉得逻辑实现没有什么问题,但是如果面试的时候你写出了这样的代码,那绝对是没有生还的希望。因为这样的代码是在是态Low了(灬ꈍ ꈍ灬)

       通常题目越是简单,面试官的期望就会越高。这道题,除了完成基本功能之外,我们还需要考虑到:
1.边界条件
2.错误处理
3.最大的正整数溢出和最小的负整数溢出
4.正负号
5.输入中有非数字字符

看看我们列出的这5点,你再想想自己是不是之前考虑的方面太少,代码是不是很挫?
ok,先拿出最终改良版的代码:

#include<iostream>
#include<windows.h>
using namespace std;


//1.把一个字符串转换为整数


	int string2int(char* string){ 
	
		if (*string=='\0'||string == NULL)
			return -1;

		int  flag = 1;
		int num = 0;
			
		char *_str = string;
		//考虑到正负号

		if (*_str == '+')               //解引用 高于 ==的优先级: 
		{ 
			flag == 1;
			++_str;
		}
		else if (*_str == '-')
		{ 
			++_str;
			flag = -1;
		}
		

		while (*_str){ 
		
			if (*_str > '0' && *_str < '9'){ 
                num = num * 10 + flag*(*_str - '0');
				//判断数据是否溢出
				if ((flag == 1 && num>0x7fffffff) 
				    || (flag == -1 && num < (int)0x80000000))
					return -2;   //溢出
 
			}
			else{ 
				//输入的字符串中不全是数字
				return -1;             //不合法
			}
		
			++_str;
		}

		return num;
	
	}


	void test1(){ 
		char* str = "-1234";
		int n = string2int(str);
		cout << n << endl;



	}



int main(){ 

	test1();

	system("pause");
	return 0;

}

其实最终版本的代码也并不复杂,也都可以分析明白。但是在这里,我还是有一个点要说一下。那就是在判断溢出的时候:

if ((flag == 1 && num>0x7fffffff) 
				    || (flag == -1 && num < (int)0x80000000))

在分析这块的时候,我有花费了一些时间研究负数溢出的判断条件为什么是这种写法。我们知道在计算机中的数字都是采用补码表示的。比如我们要想打印-1,

        int a =0xffffffff;
		cout << a << endl;
//打印结果: -1

       我们知道char类型的表示范围是-128~127。正数表示范围是0-127一共2的7次方128个数;那为什么负数可以表示-128呢?我们应该注意到-0的存在。

-0 :原码 1000 0000 的补码为 1 0000 0000 
由于 char 是 八位 ,所以取低八位 00000000。   

+0 :原码 0000 0000 ,补码为也为 0000 0000 
虽然补码 0 都是相同的,但是有两个 0 ,既然有两个 0 ,况且 0 既不是正数,也不是
负数, 用原码为 0000 0000 表示就行了。

       这样一来,有符号的 char,原码都用来表示 -127~127 之间的数了,唯独剩下原码 1000 0000 没有用,用排列组合也可以算出来,能表示 2^7 = 128 个数,刚好是 0~127。也能表示 128 个数,总共 signed char 有 256 个数,这与 -127~127 中间是两个 0 刚好吻合。

       现在再来探讨一下关于剩下的那个 1000 0000,既然 -127 ~ 0 ~ 127 都有相应的原码与其对应,那么 1000 0000 表示什么呢,当然是 -128 了,为什么是 -128 呢,网上有人说 -0 即 1000 0000 与 128 的补码相同,所以用 1000 0000 表示 -128,,这我实在是不敢苟同,或者说 -128 没有原码,只有补码 1000 0000,胡扯,既然没有原码何来补码,还有说 -128 的原码与 -0(1000 0000) 的原码相同,所以可以用 1000 0000 表示 -128,我只能说,回答得不要那么牵强, 原码 1000 0000 与 -128 的原码实际上是不同的。

       但为什么能用它表示 -128 进行运算,如果不要限制为 char 型(即不要限定是 8 位),再来看,-128 的原码:1 1000 0000 ,9位,最高位符号位,再算它的反码:1 0111 1111,进而,补码为:1 1000 0000,这是 -128 的补码,发现和原码一样,1 1000 0000 和 1000 0000 相同?如果说一样的人真是瞎了眼了,所以,-128 的原码和 -0(1000 000) 的原码是不同的,但是在 char 型中,是可以用 1000 000 表示 -128 的,关键在于char 是 8 位,它把 -128 的最高位符号位 1 丢弃了,截断后 -128 的原码为 1000 000 和 -0 的原码相同,

也就是说 1000 0000 和 -128 丢弃最高位后余下的 8 位相同,所以才可以用 -0 表示 -128,这样,当初剩余的 -0(1000 0000),被拿来表示截断后的 -128,因为即使截断后的 -128 和 char 型范围的其他 (-127~127) 运算也不会影响结果, 所以才敢这么表示 -128。

       

小笔记:

对于char类型,最大的正数表示:0x7f , 最大的 负数表示 :0x80;
对于int类型,最大的正数表示:0x7fffffff,最大的负数表示: 0x80000000;

    原文作者:拥抱@
    原文地址: https://blog.csdn.net/tonglin12138/article/details/91352612
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞