使用REGEXREPLACE(A2,"1","")可精准提取汉字,或用SUBSTITUTE逐项剔除非汉字字符,亦可结合REGEXEXTRACT与JOIN处理多段汉字,复杂需求推荐Apps Script自定义函数EXTRACT_HAN。\p{Han} ↩

如果您在Google表格中处理混杂英文、数字、符号与汉字的文本,但需要单独提取其中的汉字部分,则需借助公式逻辑识别并筛选Unicode汉字区间。以下是实现该目标的多种方法:
一、使用REGEXREPLACE配合Unicode范围匹配
该方法利用正则表达式将所有非汉字字符(包括英文字母、数字、标点、空格等)替换为空,仅保留位于CJK统一汉字区间的字符。Google表格的REGEXREPLACE函数支持Unicode属性匹配,可精准定位汉字。
1、在目标单元格输入公式:=REGEXREPLACE(A2,"[^\p{Han}]","")
2、按 Enter 键确认,A2 中的全部汉字即被连续提取出来。
3、将公式向下拖拽填充至其他行,批量处理整列数据。
二、嵌套SUBSTITUTE逐项清除非汉字字符
该方法适用于不支持 \p{Han} 的旧版兼容场景或需显式控制剔除项的情况。通过多次 SUBSTITUTE 函数,依次将常见数字、大小写字母、常用符号替换成空字符串,最终剩余内容即为汉字。
1、在目标单元格输入以下公式(以A2为例):=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A2,"0",""),"1",""),"2",""),"3",""),"4",""),"5",""),"6",""),"7",""),"8",""),"9",""),"A",""),"B",""),"C",""),"D",""),"E",""),"F",""),"G",""),"H",""),"I",""),"J",""),"a","")
2、继续追加对剩余小写字母 k 至 z 的 SUBSTITUTE 替换,确保覆盖全部 26 个英文字母。
3、如需同时清除常见符号(如@、#、$、%、&、*、(、)、-、_、+、=、[、]、{、}、|、\、:、;、"、'、、,、.、?、/、~、`),在公式末尾继续嵌套对应 SUBSTITUTE。
三、结合SPLIT、FILTER与UNICODE编码判断(数组式逻辑)
此方法模拟Excel中TEXTJOIN+FILTER的思路,在Google表格中通过QUERY或REDUCE逻辑间接实现逐字判断。由于Google表格原生不支持SEQUENCE与FILTER数组行为,改用SPLIT+JOIN+REGEXMATCH组合构造等效效果。
1、在辅助列B2中生成单字拆分结果:输入公式 =JOIN("",ARRAYFORMULA(IF(ISNUMBER(FIND(UNICHAR(ROW(INDIRECT("19968:40869"))),A2)),UNICHAR(ROW(INDIRECT("19968:40869"))),"")))
2、该公式存在性能与长度限制,实际应用中推荐改用更稳定方式:先在B2输入 =REGEXEXTRACT(A2,"[\u4e00-\u9fff]+") 提取首个连续汉字段。
3、若需提取全部汉字(含中间断开的多个片段),使用:=JOIN("",REGEXEXTRACT(A2,REPT("([\u4e00-\u9fff])",LEN(A2)))) 并配合ARRAYFORMULA封装(注意:此式需配合QUERY或FLATTEN优化,否则可能报错)。
四、借助Google Apps Script自定义函数
当内置公式难以满足复杂需求(如保留汉字顺序但过滤叠字、排除部首或异体字)时,可编写轻量级脚本函数,直接调用JavaScript的Unicode正则能力进行高精度提取。
1、点击菜单栏【扩展程序】→【Apps Script】,新建脚本文件。
2、在代码编辑器中粘贴以下函数:
function EXTRACT_HAN(text) { if (!text) return ""; return text.replace(/[^\u4e00-\u9fff\u3400-\u4dbf\u20000-\u2a6df\u2a700-\u2b73f\u2b740-\u2b81f\u2b820-\u2ceaf]/g, ""); }
3、保存项目并命名为“ExtractHan”,关闭脚本编辑器返回表格。
4、在任意单元格输入公式:=EXTRACT_HAN(A2),即可调用该函数提取汉字。










