rune是字符,byte是字节。Go中byte为uint8别名,用于ASCII字符或二进制数据;rune为int32别名,表示Unicode码点,处理中文、emoji等多字节字符需用rune,字符串遍历和字符计数应基于rune避免乱码。

在Go语言中,rune 和 byte 是处理字符与字节时最常遇到的两种类型,它们虽然都用于表示数据单元,但用途和底层含义完全不同。理解它们的区别对正确处理字符串、中文字符和其他多字节文本至关重要。
byte 在Go中其实是 uint8 类型的别名,用来表示一个8位的无符号整数,取值范围是 0 到 255。它通常用于处理原始的二进制数据或ASCII字符。
例如,英文字符 'A' 的ASCII码是65,可以用 byte 表示:
对于只包含ASCII字符的字符串,使用 len(str) 返回的字节数等于字符数。但一旦涉及非ASCII字符(如中文),情况就不同了。
立即学习“go语言免费学习笔记(深入)”;
rune 是 Go 中 int32 的别名,用来表示一个Unicode字符(即一个码点)。它可以表示包括中文、 emoji、拉丁扩展字符在内的所有Unicode字符。
Unicode编码支持多字节字符,比如:
Go中的字符串默认以UTF-8格式存储,因此一个字符可能由多个字节组成。使用 []rune(str) 可以将字符串正确拆分为字符序列。
看一个例子来理解差异:
str := "Hello, 世界"
fmt.Println("字节数:", len(str)) // 输出: 13("世"和"界"各占3字节)
fmt.Println("字符数:", len([]rune(str))) // 输出: 8(H,e,l,l,o,,, ,世,界)
for i, b := range []byte(str) {
fmt.Printf("%d: %d\n", i, b) // 遍历每一个字节
}
for i, r := range str {
fmt.Printf("%d: %c\n", i, r) // 遍历每一个字符(rune)
}
选择依据是你要处理的是字节流还是字符逻辑:
比如实现一个截取前N个字符的函数,必须基于 rune:
func substr(s string, n int) string {
runes := []rune(s)
if n >= len(runes) {
return s
}
return string(runes[:n])
}
基本上就这些。掌握 byte 和 rune 的本质区别,能避免在处理中文、emoji或多语言文本时出现乱码或截断错误。核心记住:byte 是字节,rune 是字符。
以上就是Golang中的rune与byte类型区别是什么_Golang字符与字节处理详解的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号