word提供四种ocr提取图片文字方法:一、“图片转文字”按钮直接识别;二、另存为pdf再插入触发ocr;三、截图后右键“复制文字”;四、vba宏批量处理。

如果您在Word中打开包含图片的文档,希望将图片中的文字提取为可编辑文本,则可以利用Word内置的OCR(光学字符识别)功能。以下是实现此目标的具体步骤:
一、使用Word 2021或Microsoft 365中的“图片转文字”功能
该功能直接集成于新版Word中,适用于插入到文档内的图片,系统会自动调用云端OCR服务识别图像中的文字,并生成可编辑文本框。
1、在Word文档中,点击“插入”选项卡,选择“图片”,将含文字的图片插入文档。
2、选中该图片后,点击“图片格式”选项卡,在右侧功能区找到并点击“图片转文字”按钮(图标为“A”叠加方框)。
3、等待识别完成,Word将在原图下方插入一个文本框,其中包含识别出的文字内容。
4、双击文本框进入编辑模式,可直接修改、复制或删除识别结果。
二、通过“另存为PDF+重新插入PDF”触发OCR识别
当原始图片未被正确识别,或Word版本不支持直接“图片转文字”按钮时,可借助PDF中间格式激活后台OCR引擎。
1、右键单击图片,选择“另存为图片”,保存为PNG或JPEG格式。
2、新建一个空白Word文档,点击“文件”→“打开”,在文件类型中选择“PDF”,导入刚才保存的图片文件(需先用系统画图等工具将图片另存为PDF,或使用打印至PDF方式生成)。
3、Word会自动运行OCR识别,完成后文档显示为可选中文本的PDF页面。
4、全选PDF页面内容(Ctrl+A),复制(Ctrl+C),粘贴(Ctrl+V)到新文档中即可获得纯文本。
三、利用“绘图笔”与“截图识别”组合操作
适用于未嵌入文档的屏幕截图或外部图片,通过Word的“插入→截图”流程调用系统级OCR能力。
1、确保Windows系统已开启“实时字幕”和“语音识别”相关语言包”(设置→时间和语言→语言→首选语言→选项→下载语言功能)。
2、在Word中点击“插入”→“截图”→“屏幕剪辑”,截取目标图片区域。
3、截图插入后,右键点击该图片,选择“复制文字”(若该选项灰显,请确认系统为Windows 10 21H2或更高版本且已启用OCR支持)。
4、在任意位置粘贴(Ctrl+V),即得识别后的文字内容。
四、启用开发者模式调用“对象识别”API接口
对具备VBA基础的用户,可通过启用开发工具并运行内置OCR脚本,绕过界面限制批量处理图片。
1、点击“文件”→“选项”→“自定义功能区”,勾选“开发工具”,点击确定。
2、切换至“开发工具”选项卡,点击“Visual Basic”打开VBA编辑器。
3、在左侧工程资源管理器中右键当前文档,选择“插入”→“模块”,粘贴以下代码片段:
Sub OCRFromPicture()
Dim shp As Shape
For Each shp In ActiveDocument.InlineShapes
If shp.Type = wdInlineShapePicture Then
shp.Range.TextRetrievalMode.IncludeHiddenText = False
shp.Range.TextRetrievalMode.IncludeFieldCodes = False
shp.OcrLanguage = wdEnglishUS
shp.OcrRecognize
End If
Next shp
End Sub
4、按F5运行宏,Word将对所有内联图片执行OCR识别,并在原位置替换为文本。










