Java图文稿件系统需分层解耦、状态机驱动、全链路审计:结构化存储Article/Content/Media/Version,富文本用CLOB+jsoup清洗,审核角色分离+驳回回退,敏感词用Aho-Corasick扫描,快照对比支持HTML diff。

Java开发图文内容稿件系统,核心在于分层解耦、流程可控、审核可溯。不是堆功能,而是围绕“采-编-审-发-存”链路设计稳定、可扩展、带审计能力的服务结构。
稿件模型与存储设计
避免用单一大字段(如JSON或HTML)硬存全部内容。应拆分为结构化实体:
- Article:基础元数据(ID、标题、作者、状态、创建/更新时间、栏目ID)
- ArticleContent:富文本正文(支持Markdown或标准HTML,存为CLOB,不存渲染结果)
- ArticleMedia:媒体资源关联表(图片/视频ID、位置序号、alt文本、是否主图)
- ArticleVersion:版本快照(每次保存/提交生成快照,含操作人、时间、diff摘要)
建议用JPA + PostgreSQL,对HTML字段加check (content ~ '^简单校验合法性;图片路径统一走CDN前缀,业务层不拼接URL。
稿件处理链路实现要点
链路不是线性if-else,而应基于状态机+事件驱动:
立即学习“Java免费学习笔记(深入)”;
- 用Spring State Machine或轻量级状态枚举(如
Draft → Submitted → Reviewed → Approved → Published)管理生命周期 - 每个状态变更触发
ApplicationEvent(如ArticleSubmittedEvent),由监听器执行对应动作:通知审核人、生成预览页、校验敏感词 -
异步任务(如缩略图生成、SEO摘要提取)走
@Async或RabbitMQ,不阻塞主流程
关键细节:状态变更必须校验前置条件(如“已提交”稿件不可再次提交),且所有变更写入ArticleAuditLog表,含操作人、IP、旧状态、新状态、备注。
多级审核机制落地方式
审核不是“一人点通过”,而是角色分离、留痕、可回退:
- 定义审核角色:初审(编辑)、复审(主编)、终审(法务/合规),每级可配置审批人列表或规则(如按栏目自动分配)
- 审核动作封装为
ReviewService.review(articleId, reviewer, decision, comment),内部做三件事:校验权限、更新状态、记录完整审核轨迹(含时间戳和决策依据字段) - 支持“驳回并退回指定环节”,退回时自动恢复上一版内容,并通知原操作人;驳回理由强制填写,前端展示历史驳回记录
敏感词检测建议集成ahocorasick算法库,离线加载词库,正文+标题+alt文本全字段扫描,命中项高亮标出供审核人确认。
安全与扩展提醒
容易被忽略但影响上线的关键点:
- 富文本提交前,后端必须二次清洗:移除
、内联onerror等XSS风险标签,推荐使用jsoup.safelist() - 图片上传限制格式(jpg/png/webp)、大小(≤5MB)、宽高比(可配规则),服务端校验不能只靠前端
- 审核流支持临时代理(如主编请假时自动转交副主编),代理关系存在独立表,非硬编码
- 提供“稿件快照对比”接口,输入两个version_id,返回HTML diff高亮结果,供复审时参考
基本上就这些。链路清晰比功能炫酷重要,审核留痕比流程快更重要。Java生态里,稳住事务边界、管好状态迁移、守住输入出口,系统就不容易翻车。










