如果ascii码大于0xa0就是半个汉字;了解substr()、mb_substr()、ord()。 现在常用的编码格式是utf8,gbk,gbk2312,big5。gbk是gbk2312的升级。现在我开发中遇到的基本都是utf8,gbk常用在论坛bbs上。今天自己写了下utf8的,测试下还说的过去,毕竟从网上拷下来的是可以用,但是如果有时间最好还是自己写一下,这样只有到自己手里的才是自己的。
最简的就是利用:例一
例二:
英文的话没有问题,但是中文就出问题了,下面我们使用mb_substr函数处理。
立即学习“PHP免费学习笔记(深入)”;
首先定义自己的函数:
$length) {
$str = "";
$len = $start + $length;
for ($i = $start; $i < $len; $i++) {
if (ord(substr($string, $i, 1)) > 0xa0) {
$str.= substr($string, $i, 2);
$i++;
} else {
$str.= substr($string, $i, 1);
}
}
return $str . '…';
} else {
return $string;
}
}
?>还有一个问题要注意,使用这种方法的时候,你的标签对里的charset只有设成中文的编码才可以,如GBK,GB2312。
下面自己常用的一个中英文字符截取函数,自定义截取中文字符串函数,基本上就是仿照mb_substr写个函数,直接调用罢了,以下为我找到的代码,其实很简单:
= 161)) //是汉语
{
$start_index+= 2;
} else
//是英文
{
$start_index+= 1;
}
}
$chr_index = $start_index;
//截取
for ($i = 0; $i < $len; $i++) {
$asc = ord($str_input{$chr_index});
if ($asc >= 161) {
$return_str{$i} = chr($asc);
$return_str{$i + 1} = chr(ord($str_input{$chr_index + 1}));
$len+= 1; //结束条件加1
$i++; //位置偏移量加1
$chr_index+= 2;
continue;
} else {
$return_str{$i} = chr($asc);
$chr_index+= 1;
}
}
return trim($return_str);
} //end of substr_cn
?>
本文地址:
转载随意,但请附上文章地址:-)











