中文字符转为HTML字符实体

在处理用户提交的内容时,出现了这样的问题,用户提交上来的是经过实体化的内容,这样我们在进行内容过滤判断时就不好处理了,所以,需要将其转为正常的中文。 通常字符实体是用在编码转换方面,比如,人家用日文的编码浏览中文网站,如果网站不是UTF-8编码,那么就会乱码,这个时候怎么办呢,比如网站是GB2312的编码,我们可以使用如下代码把中文字符直接转换问HTML字符实体,这样就可以兼容各种编码了:

echo mb_convert_encoding ('大家好哈', 'HTML-ENTITIES', 'gb2312');

此时,浏览器输出“大家好哈”,但是查看源文件里的代码却是:

大家好哈

那想转回来怎么办呢?其实不用的,浏览器自己会转回来,如果非要问,怎么转回来,可以如下:

echo mb_convert_encoding ('大家好哈', 'gb2312', 'HTML-ENTITIES'); 

如果要转换整个页面,怎么办呢?不怕,只要在网页头部加上如下三句:

mb_internal_encoding('你网站的编码'); 
mb_http_output('HTML-ENTITIES'); 
ob_start('mb_output_handler'); 

原文地址: 中文字符转为HTML字符实体

    原文作者:Corwien
    原文地址: https://segmentfault.com/a/1190000008817925
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞