clawdbot(moltbot)所有数据默认本地存储,导出方式依部署形态而异:一、桌面版通过界面按钮或output/目录手动复制;二、阿里云轻量服务器通过ssh进入/opt/moltbot/output/打包下载;三、ubuntu虚拟机从log_dir下json日志用jq提取并传输;四、启用百炼api时调用/export接口自动获取csv等格式文件。

如果您已成功部署并运行Clawdbot(现名Moltbot),但需要将处理后的合同OCR识别结果、双语对照文本或对话历史等数据持久化保存或迁移至其他系统,则需明确其本地化存储机制与导出路径。Clawdbot默认不上传任何数据至云端,所有输出均生成于本地文件系统或内存中,导出操作依赖具体部署方式与运行环境。以下是针对不同部署形态的多种导出方法:
一、从本地桌面版导出处理结果
本地桌面版Clawdbot采用离线架构,所有OCR识别与翻译结果默认以临时文件形式缓存在应用工作目录,用户可手动定位并复制结构化输出文件。
1、启动Clawdbot桌面应用,完成一张合同图片的上传与中英双语对照生成。
2、点击界面右上角「导出」按钮,若该按钮可见,则直接选择「导出为PDF」或「导出为Markdown」格式。
3、若无图形导出按钮,打开Clawdbot安装目录下的output/子文件夹,查找以当前时间戳命名的文件夹,内含original.txt、translated.md及bilingual.pdf三个标准输出文件。
4、将所需文件复制至外部存储设备或同步文件夹即可完成导出。
二、从阿里云轻量应用服务器导出数据
当Clawdbot以Moltbot镜像形式部署于阿里云轻量应用服务器时,所有处理结果默认写入实例的/opt/moltbot/output/路径,需通过SSH或文件管理工具访问并下载。
1、登录阿里云轻量应用服务器控制台,进入对应Moltbot实例的「连接管理」页面。
2、使用SSH工具(如PuTTY或Terminal)连接实例,执行命令:cd /opt/moltbot/output && ls -lt,确认最新生成的输出子目录。
3、进入该目录后,执行:tar -czf export_$(date +%Y%m%d_%H%M%S).tar.gz *.pdf *.md *.json,打包全部有效输出文件。
4、使用SCP命令或阿里云控制台提供的「文件下载」功能,将生成的.tar.gz包下载至本地计算机。
三、从Ubuntu虚拟机部署环境导出日志与结构化数据
在Ubuntu虚拟机中手动部署Clawdbot时,其后端服务由vLLM与PaddleOCR组成,原始识别文本与模型推理中间结果以JSON格式记录于日志路径,可用于程序化提取与二次处理。
1、登录Ubuntu虚拟机终端,切换至Clawdbot服务运行用户(通常为moltbot或ubuntu)。
2、执行命令查看服务日志路径:systemctl show -p FragmentPath moltbot.service | cut -d= -f2,确认配置文件所在位置。
3、根据配置文件中LOG_DIR变量值,进入对应目录,查找以ocr_result_或translation_batch_开头的JSON文件。
4、使用jq工具提取关键字段,例如执行:jq '.blocks[].bilingual_pair' latest_ocr_result.json > bilingual_export.json。
5、将生成的bilingual_export.json文件通过scp或rsync传输至目标机器。
四、通过API调用触发导出(适用于启用百炼模型服务的云部署)
当Clawdbot接入阿里云百炼平台并启用HTTP API服务时,可通过发送GET请求获取指定任务ID的结构化输出,实现自动化导出集成。
1、在Moltbot实例的「应用详情」页面中,确认已启用API服务且18789端口处于放通状态。
2、获取当前会话Token:在浏览器开发者工具Network标签页中,筛选/api/v1/task请求,复制其响应头中的X-Moltbot-Token值。
3、构造curl命令:curl -H "Authorization: Bearer YOUR_TOKEN" "http://YOUR_SERVER_IP:18789/api/v1/task/abc123/export?format=csv",其中abc123为实际任务ID。
4、将返回的CSV内容重定向保存为本地文件:curl [...] > contract_export.csv。










