使用for range遍历rune是处理Go字符串的推荐方法,能正确解析UTF-8编码,避免多字节字符被拆分,适合包含中文、emoji的场景。

在Go语言中,遍历字符串中的字符需要注意字符串的底层编码。Go中的字符串是以UTF-8格式存储的,这意味着一个字符可能占用多个字节。直接按字节遍历可能会导致中文等多字节字符被错误拆分。正确的方式是使用rune类型来处理字符。
使用for range遍历rune
最推荐的方法是使用for range循环,它会自动解码UTF-8字符,每次迭代返回的是字符的索引和对应的rune值。
- range会正确解析UTF-8编码,避免乱码问题
- 适合处理包含中文、emoji等多字节字符的字符串
示例代码:
str := "Hello世界"
for i, r := range str {
fmt.Printf("索引: %d, 字符: %c, Unicode码点: %U\n", i, r, r)
}
转换为rune切片后遍历
如果需要多次操作或随机访问字符,可以先将字符串转换为[]rune切片。
立即学习“go语言免费学习笔记(深入)”;
- 转换后可通过索引访问每个rune
- 适用于需要频繁操作字符的场景
示例代码:
str := "Hello世界"
runes := []rune(str)
for i, r := range runes {
fmt.Printf("位置: %d, 字符: %c\n", i, r)
}
注意事项
避免使用传统的下标方式遍历字符串,因为这会逐字节访问,对多字节字符会产生错误结果。
- 不要用
for i := 0; i 方式处理含非ASCII字符的字符串 -
len(str)返回字节数,不是字符数 - 中文字符通常占3个字节,emoji可能占4个字节
for range是最安全通用的做法。










