JavaScript字符串长度length属性对多字节字符处理

冰川箭仙

发布时间：2026-03-15 12:15:11

593人浏览过

来源于php中文网

原创

JavaScript 的 length 属性返回 UTF-16 编码单元数而非 Unicode 字符数，故含代理对（如 emoji、增补汉字）时会高估；应使用 [...str].length 或 Array.from(str).length 获取真实字符数。

javascript字符串长度length属性对多字节字符处理

JavaScript 的 length 属性返回字符串的 UTF-16 编码单元（code unit）个数，不是 Unicode 字符（code point）个数。这意味着对含多字节 Unicode 字符（如 emoji、中文、某些生僻字）的字符串，length 可能与“人眼感知的字符数”不一致。

为什么 length 会“算错”中文和 emoji？

JavaScript 字符串内部使用 UTF-16 编码。大部分常用字符（如 ASCII 字母、常见汉字）用 1 个 UTF-16 单元表示（占 2 字节），length 值准确。但部分字符（如 U+1F600 ?、U+20000 ? 等）超出基本多文种平面（BMP），需用两个 UTF-16 单元（即代理对，surrogate pair）表示，此时 length 返回 2，而实际只对应 1 个 Unicode 字符。

"a".length → 1（ASCII，单单元）
"你好".length → 2（常用汉字，各占 1 单元）
"?‍?".length → 5（带 ZWJ 的组合 emoji，含多个代理对和连接符）
"?".length → 2（U+2070E，位于增补平面，需代理对）

如何获取真正的 Unicode 字符数？

用扩展运算符（[...str]）或 Array.from(str) 将字符串按 Unicode 字符（code point）拆分为数组，再取 length：

[..."?‍?"].length → 1
Array.from("?").length → 1
Array.from("a?中?‍?").length → 4（每个都是独立 Unicode 字符）

注意：此方法能正确处理代理对、组合字符（如带变音符号的字母）、ZJW 连接符等现代 Unicode 特性。

立即学习“Java免费学习笔记（深入）”；

Face++旷视

Face⁺⁺ AI开放平台

下载

截取、遍历字符串时的常见陷阱

直接用 str.substring(0, n) 或 for (let i = 0; i 可能切开代理对，导致乱码或异常字符：

"?".substring(0, 1) → ""（高代理单元孤立，显示为替换符）
错误遍历可能跳过字符或重复解析

安全做法：

截取用 Array.from(str).slice(0, n).join("")
遍历用 for (const char of str)（原生支持 code point 遍历）
或使用 String.prototype.codePointAt() + String.fromCodePoint() 手动处理

兼容旧环境的备选方案

若需支持不支持扩展运算符或 for...of 的老旧引擎（如 IE），可用正则匹配 Unicode 字符：

function trueLength(str) {
  return str.match(/[\s\S]/u)?.length || 0;
}
// 注意：需添加 u 标志启用 Unicode 模式

或使用第三方库如 grapheme-splitter 处理更复杂的字形簇（如带肤色修饰符的 emoji）。

JavaScript 中未完成的 Promise 是否会导致内存泄漏？

JavaScript中typeof操作符对各种数据类型的检测结果

JavaScript大整数BigInt在长数字运算中的应用规范

JavaScript脚本文件的字符编码UTF8配置注意事项

JavaScript字符串大小写转换toLowerCase方法规范

相关标签:

javascript String Array 运算符 for const 字符串 char Length prototype ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：实现多个可拖拽桌面图标的完整解决方案下一篇：暂无

作者最新文章

Windows服务管理中SVCHOST进程占用资源过高定位方法

2026-03-14 11:52

JavaScript变量提升Hoisting现象的发生原理与规避

2026-03-14 11:56

Python版本差异说明_Python2与3核心变化

2026-03-14 12:04

Adobe官网免费下载 Adobe官方试用版获取方法

2026-03-14 12:12

Linux系统通过DU与DF命令监控磁盘空间及文件大小异常

2026-03-14 12:39

Nginx利用非阻塞IO解决慢连接堆积导致的阻塞问题

2026-03-14 13:22

Apache中主备切换过程中请求丢失的预防与补偿方案

2026-03-14 13:24

Linux系统下LVM逻辑卷管理实现磁盘动态扩容的操作流程

2026-03-14 13:53

Linux环境下Ps命令常用组合参数及进程状态识别指南

2026-03-14 14:11

Linux系统定时任务未执行_cron排查

2026-03-14 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1570

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

241

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

170

2025.10.17

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

564

2023.09.20