substr()函数可以用来分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut()这个函数,mb_substr() /mb_strcut()的用法与substr()相似,只是在mb_substr()/mb_strcut最后要加入多一个参数,来设定字符串的编码。
例:
<?php
echo mb_substr('我是中文不是英文我怕啥', 0, 7, 'utf-8');
?>
输出:我是中文不是英
<?php
echo mb_strcut('我是中文不是英文我怕啥', 0, 7,'utf-8');
?>
输出:我是
从上面的例子可以看出,mb_substr是按字来切分字符,而mb_strcut是按字节来切分字符,但是都不会产生半个字符的现象……
个人理解:
mb_substr()函数对英文或中文字符都表示一个单位。
mb_strcut()函数对中文字符是3个单位,英文是1个单位。
例如:
<?php
str = "这样abcd一来";
echo "mb_substr:".mb_substr(str, 0, 5, 'utf-8');
echo "<br>";
echo "mb_strcut:".mb_strcut(str, 0, 8, 'utf-8');
?>
输出结果如下:
mb_substr: 这样abc
mb_strcut: 这样ab
附:
strlen 与 mb_strlen 的差别:
<?phpstr="中文a字1符";
echo strlen(str);
echo "<br />";
echo mb_strlen(str,'UTF8');
?>
输出结果:
14
6
以上结果都是经测试得出。