php截取中文字符串長度的mb_substr()、mb_strcut()函數

2014-04-09 09:48:57來源:oschina作者:

substr()函數可以用來分割文字,但要分割的文字如果包括中文字符往往會遇到問題,這時可以用mb_substr()/mb_strcut這個函數,mb_substr() /mb_strcut的用法與substr()相似,只是在mb_substr()/mb_strcut最后要加入多

substr()函數可以用來分割文字,但要分割的文字如果包括中文字符往往會遇到問題,這時可以用mb_substr()/mb_strcut這個函數,mb_substr() /mb_strcut的用法與substr()相似,只是在mb_substr()/mb_strcut最后要加入多一個參數,以設定字符串的編碼,但是 一般的服務器都沒打開php_mbstring.dll,需要在php.ini在把php_mbstring.dll打開。

舉個例子:

<?php
echo mb_substr(‘這樣一來我的字符串就不會有亂碼^_^’, 0, 7, ‘utf-8′);
?>

輸出:這樣一來我的字

<?php
echo mb_strcut(‘這樣一來我的字符串就不會有亂碼^_^’, 0, 7,’utf-8′);
?>

輸出:這樣

從上面的例子可以看出,mb_substr是按字來切分字符,而mb_strcut是按字節(jié)來切分字符,但是都不會產生半個字符的現象……

上面一段是摘抄網絡上的,結果都是經本人測試得出的。

個人理解:
mb_substr()函數對英文或中文字符都表示一個單位。
mb_strcut()函數對中文字符是3個單位,英文是1個單位。

例如:
<?php
$str = “這樣abcd一來”;
echo “mb_substr:”.mb_substr($str, 0, 5, ‘utf-8′);
echo “<br>”;
echo “mb_strcut:”.mb_strcut($str, 0, 8, ‘utf-8′);
?>

輸出結果如下:
mb_substr: 這樣abc
mb_strcut:  這樣ab

附:

strlen 與 mb_strlen 的差別:

<?php
$str=”中文a字1符”;
echo strlen($str);
echo “<br />”;
echo mb_strlen($str,’UTF8′);
?>

輸出結果:
14
6
 

關鍵詞:php字符串函數

贊助商鏈接: