我有这样的代码:
if(strlen($text)>=15)
$text=mb_substr($text, 0, 15, 'UTF-8');
它的工作原理应该如此,但事实是,当文本是拉丁文(例如英文)时,当它将其剥离时,它最终不会显示3个点.另一方面,当文本处于需要UTF-8编码的其他语言时,它最后会添加3个点.
例:
What are cells made of
被取代
What are cells
另一方面:
で作られた細胞は何ですか
被取代
で作られた細 …
我错过了什么?
最佳答案 这是因为
strlen()
以二进制形式返回字符串的长度,即八位字节的数量.
因为utf8以与例如相同的方式表示ASCII. iso-8859-1,字符数和八位字节数没有区别.但是,对于ASCII以外的字符,每个utf8字符最多可占用三个八位字节,例如亚洲字符.
因此,要正确确定字符数,您需要使用mb_strlen()
.