clawdbot支持四项质性分析功能:主题建模、likert量表生成、跨编码者一致性校验及语义饱和度检测,分别对应无监督聚类、标签驱动题项生成、嵌入相似度评估与构念覆盖诊断。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一、使用Clawdbot进行访谈文本的主题建模
Clawdbot可基于预训练语言模型对开放式访谈转录文本执行无监督主题提取,识别潜在语义结构并聚类相似表述。该过程不依赖人工编码框架,适用于探索性研究阶段的概念发现。
1、将清洗后的访谈文本(UTF-8编码纯文本)导入Clawdbot的“Topic Modeling”模块。
2、设置主题数量K值为5–12,启用LDA+BERT混合算法选项。
3、运行分析后,在结果界面查看每个主题的关键词权重分布及代表性原始语句片段。
4、导出主题-文档矩阵CSV文件,用于后续与人口学变量做相关性检验。
二、借助Clawdbot自动生成Likert型量表题项
Clawdbot可根据已标注的情绪极性、认知维度或行为倾向标签,从访谈高频表达中抽提语义完整、语法规范的陈述句,并按心理测量学要求调整措辞难度与歧义度。
1、在“Scale Generation”面板中上传含情感标签的语句集(每行一句,末尾以【POS】/【NEG】标记)。
2、选择目标量表维度(如“自我效能感”“社会支持感知”),设定题项数量为10–20条。
3、点击生成按钮,系统输出初版题项列表,每条附带可读性得分(Flesch-Kincaid Grade Level)和歧义指数。
4、手动筛选保留Flesch-Kincaid值在6.0–8.5之间、歧义指数低于0.35的题项。
三、利用Clawdbot实施跨访谈者一致性校验
针对多名研究者独立完成的访谈文本编码,Clawdbot提供基于嵌入向量余弦相似度的自动一致性评估,替代传统Cohen’s Kappa计算中对离散类别标签的依赖。
1、将不同编码者标注的同一段访谈文本分别保存为独立文件,命名格式为“ID_编码者A.txt”“ID_编码者B.txt”。
2、在“Inter-rater Consistency”工具中批量导入全部文件,指定语义粒度为句子级。
3、运行比对后,系统生成两两编码者间的平均余弦相似度热力图。
4、导出相似度低于0.62的句子对清单,供研究者回溯讨论分歧根源。
四、通过Clawdbot执行量表题项的语义饱和度检测
Clawdbot可扫描已生成量表中各题项的上下文嵌入分布,识别是否存在语义重叠过高或覆盖盲区,辅助判断题项集合是否充分表征目标构念。
1、将量表所有题项逐行输入“Semantic Saturation Check”模块文本框。
2、选择参照语料库为APA PsycINFO近五年实证论文摘要集。
3、启用“Cluster-based Redundancy Alert”,设定阈值为0.78。
4、查看聚类报告中标记为“高冗余组”的题项编号,并比对它们在主成分载荷矩阵中的共同方差占比。










