| php中要正确切割字符串,使用mb_substr函数是最简单。但是需要编译时使用了  --enable-mbstring安装扩展。在不使用mb_substr怎么能正确切割呢?Discuz的global.func.php中有个解决这个问题的函数。注意: 函数是copy的,使用时请注意版权问题。另外这个函数是按字节切割字符,而不是按字符长度切割字符,就是说一个中文字在gbk的情况下是计算了2。要改为按字符切割做一些小修改就可以了。 
 使用方法复制代码function cutstr($string, $length, $dot = ' ...') 
{
global $charset;
if(strlen($string) <= $length) return $string;
$string = str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $string);
$strcut = '';
if(strtolower($charset) == 'utf-8')
{
$n = $tn = $noc = 0;
while($n < strlen($string))
{
$t = ord($string[$n]);
// 特别要注意这部分,utf-8是1--6位不定长表示的,这里就是如何
// 判断utf-8是1位2位还是3位还是4、5、6位,这对其他语言的编程也有用处
// 具体可以查看rfc3629或rfc2279
if($t == 9 || $t == 10 || (32 <= $t && $t <= 126))
{
$tn = 1; $n++; $noc++;
}
elseif(194 <= $t && $t <= 223)
{
$tn = 2; $n += 2; $noc += 2;
}
elseif(224 <= $t && $t < 239)
{
$tn = 3; $n += 3; $noc += 2;
}
elseif(240 <= $t && $t <= 247)
{
$tn = 4; $n += 4; $noc += 2;
}
elseif(248 <= $t && $t <= 251)
{
$tn = 5; $n += 5; $noc += 2;
}
elseif($t == 252 || $t == 253)
{
$tn = 6; $n += 6; $noc += 2;
}
else
{
$n++;
}
if($noc >= $length)
{
break;
}
}
if($noc > $length) $n -= $tn;
$strcut = substr($string, 0, $n);
}
else
{
for($i = 0; $i < $length; $i++)
{
$strcut .= ord($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i];
}
}
$strcut = str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $strcut);
return $strcut . $dot;
}
复制代码$testStr = "好好学习!(good good study)天天向上!(day day up)"; // ^_^! V
// 使用utf文档
echo cutstr($testStr, 10);
// 使用dos文档使用以下代码测试utf-8的效果
//$testStr = iconv('GBK', 'UTF-8', $testStr);
//echo iconv('UTF-8', 'GBK', cutstr($testStr, 10));
 |