php截取中文字符串的substr()、mb_substr()、mb_strcut()函数

/ 0评 / 0

substr()函数可以用来分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut()这个函数,mb_substr() /mb_strcut()的用法与substr()相似,只是在mb_substr()/mb_strcut最后要加入多一个参数,来设定字符串的编码。

例:

<?php
echo mb_substr('我是中文不是英文我怕啥', 0, 7, 'utf-8');
?>
输出:我是中文不是英

<?php
echo mb_strcut('我是中文不是英文我怕啥', 0, 7,'utf-8');
?>
输出:我是

从上面的例子可以看出,mb_substr是按字来切分字符,而mb_strcut是按字节来切分字符,但是都不会产生半个字符的现象……
个人理解:
mb_substr()函数对英文或中文字符都表示一个单位。
mb_strcut()函数对中文字符是3个单位,英文是1个单位。

例如:
<?php
str = "这样abcd一来";
echo "mb_substr:".mb_substr(
str, 0, 5, 'utf-8');
echo "<br>";
echo "mb_strcut:".mb_strcut(str, 0, 8, 'utf-8');
?>
输出结果如下:
mb_substr: 这样abc
mb_strcut:  这样ab
附:

strlen 与 mb_strlen 的差别:
<?phpstr="中文a字1符";
echo strlen(str);
echo "<br />";
echo mb_strlen(
str,'UTF8');
?>
输出结果:
14
6

以上结果都是经测试得出。