在php中,可以利用strlen()函数来计算字符串的字节数。该函数是按字节来计算字符串长度的,可以统计字符串所占的字符长度(字节数),语法“strlen(字符串)”。在该函数的计算中,英文逗号、数字、英文字母、小数点等都只占一个字节;而一个GB2312编码的汉字占两个字节,一个UTF-8编码的汉字占三个字节。
本教程操作环境:windows7系统、PHP8.1版、DELL G3电脑
php中不同的编码格式下字符占用的字节是不同的:
-
ANSI编码格式下一个中文字符占2个字节,一个英文字符占1个字节;
-
UTF-8编码格式下一个中文字符占3个字节,一个英文字符占1个字节。
而php中,可以利用strlen()函数来计算字符串的字节数。
strlen()函数是按字节来计算字符串长度的。
strlen($string)
该函数只接受一个参数$string(要计算的字符串),如果该参数传递的值为空则返回 0。
strlen()函数中,(英文状态下)逗号、数字、英文字母、小数点.
、下划线、空格等都只占一个字符长度(字节)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello world!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
分析:上例的字符串中,有10个英文字母,一个空格、一个英文感叹号;合计:12个个字节。
strlen()函数中,一个 GB2312 编码的汉字占两个字符长度(字节),一个 UTF-8 编码的汉字占三个字符长度(字节)。
<?php header("Content-type:text/html;charset=utf-8"); $str = "!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,"!"是中文感叹号,因此占三个字节。
<?php header("Content-type:text/html;charset=utf-8"); $str = "欢迎"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,包含两个汉字,因此占6个字节。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello,欢迎来到这里!"; echo '字符串 “'.$str.'” 占:'.strlen($str).' 个字节<br>'; ?>
上例中,包含5个英文字符,6个汉字,一个中文感叹号和一个中文逗号;因此占5+(8*3)=29个字节。
说明:在计算字符串的字符个数时,strlen()函数只能处理英文字符串,对中文或中英混合字符串不友好。此时,就需要利用
mb_strlen()函数了,该函数可以按字符
来计算字符串长度的。
扩展知识:mb_strlen() 函数
mb_strlen() 函数同样可以返回字符串的长度,语法格式如下:
mb_strlen($str [, $encoding = mb_internal_encoding()])
-
$str 为需要计算长度的字符串
-
$encoding 是可选参数,为字符编码,如果省略则使用内部字符编码。
mb_strlen() 函数的返回值为具有 $encoding 编码的字符串 $str 所包含的字符数,如果 $encoding 无效则返回 false。
注意:与 strlen() 函数不同,在 mb_strlen() 函数中,无论是汉字,还是英文、数字、小数点、下划线和空格,都只占一个字符长度。
【示例】 使用 mb_strlen() 函数获取字符串长度。
<?php header("Content-type:text/html;charset=utf-8"); $str = "hello 你好!"; echo '字符串 “'.$str.'” 的长度为:'.mb_strlen($str,"utf-8").'<br>'; $str = "欢迎来到PHP中文网!"; echo '<br>字符串 “'.$str.'” 的长度为:'.mb_strlen($str,'utf-8').'<br>'; ?>
可以看出,我们可以通过设置对应的$encoding
参数,就能很好的处理中文字符串的长度问题。
推荐学习:《PHP视频教程》
前端(VUE)入门到精通:立即学习