emoji在浏览器中是如何传递给服务器的

做两个小测试

(a) utf8编码情况下,发送post请求,携带页面输入的emoji表情

<?php
header("Content-type:text/html;charset=utf-8");
$out = <<<HEREDOC
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    <style>
        div.emoji{
            font-size:20px;
        }
    </style>
</head>
<body>
<div>
emoji:&#9785;
</div>
<div class="emoji">
    
<div>
<form method="POST" action="test.php">
emoji:<input type="text" name="emoji"/>
<button>submit</button>
</form>
</body>
HEREDOC;
echo $out;die;
提交后,抓包结果

emoji => %E2%98%B9 urldecode解码后 :即为utf-8 的编码: 0xE298B9 对应的unicode 十进制:9785

gbk编码情况下,发送post请求,携带页面输入的emoji表情

<?php
header("Content-type:text/html;charset=gbk");
$out = <<<HEREDOC
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gbk">
    <style>
        div.emoji{
            font-size:20px;
        }
    </style>
</head>
<body>
<div>
emoji:&#9785;
</div>
<div class="emoji">
    
<div>
<form method="POST" action="test.php">
emoji:<input type="text" name="emoji"/>
<button>submit</button>
</form>
</body>
HEREDOC;
echo $out;die;
提交后,抓包结果

emoji => %26%239785%3B urldecode解码后 : 9785;(这里#和9我加了空格 不然就直接输出emoji了) 即为NCR的值 对应的unicode 十进制:9785

结论

  1. 当前编码环境为unicode下的某一种,比如utf-8,则页面内的emoji对应的unicode号码进行相应的编码后,发送到服务器
  2. 当前编码不是unicode下的,比如gbk,则页面内的emoji对应的NCR结果被发送至服务器
    原文作者:machenchi0207
    原文地址: https://segmentfault.com/a/1190000014723435
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞