php截取utf8或gbk编码的中英文字符串示例

PHP 2014-11-27 14:54:36 转载来源: 网络整理/侵权必删

本文为大家讲解的是php截取utf8或gbk编码的中英文字符串示例,感兴趣的同学参考下. 微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。 php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求

本文为大家讲解的是php 截取 utf8或gbk 编码的中英文字符串示例,感兴趣的同学参考下.

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。
php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。
mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。
google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$charset 只支持gbk与utf-8。

$a = "s＠@你好";

var_dump(strlen_weibo($a,'utf-8'));

结果输出为8，其中字母s计数为1，全角＠计数为2，半角@计数为1，两个中文计数为4。源码如下：

function strlen_weibo($string, $charset='utf-8')

{

    $n = $count = 0;

    $length = strlen($string);

    if (strtolower($charset) == 'utf-8')

    {

        while ($n < $length)

        {

            $currentByte = ord($string[$n]);

            if ($currentByte == 9 ||

                $currentByte == 10 ||

                (32 <= $currentByte && $currentByte <= 126))

            {

                $n++;

                $count++;

            } elseif (194 <= $currentByte && $currentByte <= 223)

            {

                $n += 2;

                $count += 2;

            } elseif (224 <= $currentByte && $currentByte <= 239)

            {

                $n += 3;

                $count += 2;

            } elseif (240 <= $currentByte && $currentByte <= 247)

            {

                $n += 4;

                $count += 2;

            } elseif (248 <= $currentByte && $currentByte <= 251)

            {

                $n += 5;

                $count += 2;

            } elseif ($currentByte == 252 || $currentByte == 253)

            {

                $n += 6;

                $count += 2;

            } else

            {

                $n++;

                $count++;

            }

            if ($count >= $length)

            {

                break;

            }

        }

        return $count;

    } else

    {

        for ($i = 0; $i < $length; $i++)

        {

            if (ord($string[$i]) > 127)

            {

                $i++;

                $count++;

            }

            $count++;

        }

        return $count;

    }

}

标签: php 截取 utf8 gbk 编码中英文字符串示例

声明：本文内容来源自网络，文字、图片等素材版权属于原作者，平台转载素材出于传递更多信息，文章内容仅供参考与学习，切勿作为商业目的使用。如果侵害了您的合法权益，请您及时与我们联系，我们会在第一时间进行处理！我们尊重版权，也致力于保护版权，站搜网感谢您的分享！

上一篇: 网上出售电影票将颠覆中国售票市场

上一篇: PHP中time(),date(),mktime()使用及区别介绍

娱乐休闲

工商与经济

电脑与网络

公司与企业

教育与培训

文学

艺术

体育与健身

新闻与媒体

卫生与健康

科学/文化

生活与服务

赛车/摩托车

软件

艺术爱好者

聊天/BBS

餐饮/菜谱

足球

经济院校

常用查询

金融/投资/保险

计算机学

政府机构

多媒体

php截取utf8或gbk编码的中英文字符串示例

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2025 All Rights Reserved.

Powered By 站长搜索

php截取utf8或gbk编码的中英文字符串示例

猜您喜欢

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2025 All Rights Reserved.

Powered By 站长搜索