在处理用户提交的内容时,出现了这样的问题,用户提交上来的是经过实体化的内容,这样我们在进行内容过滤判断时就不好处理了,所以,需要将其转为正常的中文。 通常字符实体是用在编码转换方面,比如,人家用日文的编码浏览中文网站,如果网站不是UTF-8编码,那么就会乱码,这个时候怎么办呢,比如网站是GB2312的编码,我们可以使用如下代码把中文字符直接转换问HTML字符实体,这样就可以兼容各种编码了:
echo mb_convert_encoding ('大家好哈', 'HTML-ENTITIES', 'gb2312');
此时,浏览器输出“大家好哈”,但是查看源文件里的代码却是:
大家好哈
那想转回来怎么办呢?其实不用的,浏览器自己会转回来,如果非要问,怎么转回来,可以如下:
echo mb_convert_encoding ('大家好哈', 'gb2312', 'HTML-ENTITIES');
如果要转换整个页面,怎么办呢?不怕,只要在网页头部加上如下三句:
mb_internal_encoding('你网站的编码');
mb_http_output('HTML-ENTITIES');
ob_start('mb_output_handler');
原文地址: 中文字符转为HTML字符实体