0

0

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

花韻仙語

花韻仙語

发布时间:2025-12-19 08:57:17

|

444人浏览过

|

来源于php中文网

原创

在 transcription 领域,理解不同的 transcription 类型至关重要。Clean Verbatim 和 Full Verbatim 是两种常见的 transcription 方法,每种方法都有其独特的规则和应用场景。本文将深入探讨这两种 transcription 类型的区别,并提供实用的指南,帮助您在 transcription 工作中做出明智的选择。无论是新手还是经验丰富的 transcriptionist,本文都将为您提供宝贵的知识和技巧,提升您的 transcription 技能,更好地满足客户需求。 本文还将涉及 transcription 过程中需要注意的各个方面,包括 filler words 的处理、思考噪音的识别、以及如何正确使用 conjunctions。通过详细的示例和操作指南,本文旨在帮助您更好地理解 transcription 的核心原则,提高 transcription 的准确性和效率。此外,本文还会讨论作为自由职业 transcriptionist 的一些重要事项,确保您在 transcription 领域取得成功。

关键要点

Clean Verbatim transcription 旨在消除无关的语音细节,提供清晰简洁的文本。

Full Verbatim transcription 则力求捕捉每一个语音细节,包括 filler words、口头禅和重复。

Filler words 是无实际意义的词语,如 “嗯”、“啊”、“你知道” 等,在 Clean Verbatim 中通常会被省略。

思考噪音是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等,在 Clean Verbatim 中通常会被省略。

Conjunctions 的过度使用可能导致句子冗长,应根据需要进行调整,以提高文本的可读性。

识别无法辨认的词语并使用 “[Indiscernible]” 标记,确保 transcription 的完整性。

作为自由职业 transcriptionist,接受您有能力完成的 transcription 任务,并始终按时提交高质量的 transcription 结果。

Clean Verbatim vs Full Verbatim:Transcription 类型详解

Clean Verbatim:清晰简洁的 Transcription

clean verbatim transcription 是一种旨在消除无关的语音细节,提供清晰简洁的文本的 transcription 方法。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 Clean Verbatim transcription 中,false starts、verbal tics、stutters 以及其他与文本内容无关的语音或声音都会被省略。然而,需要注意的是,Clean Verbatim transcription 并不涉及 paraphrasing,即句子不能被改写,必须保持原文的意思。Clean Verbatim transcription 适用于需要清晰简洁文本的场景,如商务会议、讲座等。

核心特点:

  • 消除无关的语音细节
  • 保持原文意思
  • 适用于需要清晰简洁文本的场景

Full Verbatim:捕捉每一个语音细节的 Transcription

Full Verbatim transcription 是一种力求捕捉每一个语音细节的 transcription 方法。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 Full Verbatim transcription 中,false starts、verbal tics、stutters 以及所有utterances都会被保留。Full Verbatim transcription 适用于需要完整记录语音内容的场景,如法庭记录、研究访谈等。

核心特点:

  • 捕捉每一个语音细节
  • 完整记录语音内容
  • 适用于需要完整记录语音内容的场景

Filler Words 和 Verbal Tics:Transcription 中的干扰因素

Filler words 和 verbal tics 是指在说话过程中出现的无实际意义的词语,如 “嗯”、“啊”、“你知道” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

这些词语通常用于标记 pause 或 hesitation,但在 Clean Verbatim transcription 中通常会被省略。然而,需要注意的是,不能省略那些并非作为 fillers 使用,而是对于句子的完整性至关重要的词语。例如,在句子 “What was that like for you?” 中,“like” 一词并非 filler,不能省略。正确的 transcription 应该是 “What was that like for you?”,而不是 “What was that for you?”

常见的 Filler Words:

  • 嗯 (um)
  • 啊 (uh)
  • 你知道 (you know)
  • like
  • kind of

False Starts:Transcription 中的语音中断

False start 是指 speaker 说了一句话,然后又回去更改他所说的话的情况。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

为了使 speaker 的 message 更清晰,transcriptionist 不需要包含 actual start 之前的其他内容,尤其是那些与句子无关的内容。例如,如果 speaker 说了 “I do have -- I have a question about…”,那么正确的 transcription 应该是 “I have a question about…”,而不是 “I do have -- I have a question about…”。

Transcriber实用Transcription指南

Thinking Noises:Transcription 中的非语言声音

Thinking noises 是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

这些声音通常不是对 speaker 所说内容的直接反应,因此在 Clean Verbatim transcription 中通常会被省略。例如,在一段 interview 中,如果 interviewer 只是在 respondent 说话时发出 “Right” 或 “Yeah” 等声音,这些声音通常可以被省略。

区分 Thinking Noises 的关键:

  • 是否是对 speaker 所说内容的直接反应
  • 是否对理解 speaker 的 message 有帮助

示例:

错误示例:

拍我AI
拍我AI

AI视频生成平台PixVerse的国内版本

下载

Interviewer: How do you proceed with your inquiries?

Respondent: We try to narrow it down to --

Interviewer: Right. (thinking noise)

Respondent: -- a few questions.

Interviewer: Is the process already old, or is it still new?

Respondent: The process is still in its --

Interviewer: Yeah. (thinking noise)

Respondent: -- infancy.

正确示例:

Interviewer: How do you proceed with your inquiries?

Respondent: We try to narrow it down to a few questions.

Interviewer: Is the process already old, or is it still new?

Respondent: The process is still in its infancy。

但是,如果 “嗯哼” 是对 interviewer 问题的直接反应,则需要保留。例如:

Interviewer: You have been there, right?

Respondent: Uh-huh.

这个 “Uh-huh” 是 respondent 对 interviewer 问题的直接回答,因此不能省略。

Slang Words:Transcription 中的非正式用语

Slang words 是指在非正式场合使用的口语化词语,如 “gonna”、“wanna”、“gotta”、“alright”、“coz” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 transcription 中,通常不建议使用 slang words,而应使用正式用语。例如,“gonna” 应改为 “going to”,“wanna” 应改为 “want to”,“gotta” 应改为 “got to”,“alright” 应改为 “all right”,“coz” 应改为 “because”。

示例:

错误示例:

I'm gonna go to the store.

正确示例:

I'm going to go to the store。

Conjunctions 的使用:避免句子冗长

Conjunctions,如 “and”,在说话中经常被过度使用,这可能导致句子冗长,影响文本的可读性。 因此,在 transcription 中,可以根据需要将长句子分成短句子,并删除不必要的 conjunctions。当然,在处理冗长的句子时,清晰度和可读性仍然是关键,

示例:

原始文本:

I painted this in Photoshop myself and it was the most spectacular vision I've ever seen in my life and I cannot forget it and it was the first time I have ever seen anything like it and my whole body went electric and when it went electric, I was in that pulsating, throbbing, vibrating state.

修改后的文本:

I painted this in Photoshop myself. It was the most spectacular vision I've ever seen in my life, and I cannot forget it. It was the first time I have ever seen anything like it. My whole body went electric. When it went electric, I was in that pulsating, throbbing, vibrating state.

无法辨认的词语:Transcription 中的未知领域

在 transcription 过程中,有时会遇到无法辨认的词语。在这种情况下,可以使用 “[Indiscernible]”、“[Inaudible]” 或 “[Unintelligible]” 等标记来表示这些词语。 这些标记可以帮助客户了解 transcription 的完整性,并知道哪些部分需要进一步澄清。

  • [Indiscernible]:用于表示无法辨认的词语
  • [Inaudible]:用于表示无法听清的词语
  • [Unintelligible]:用于表示无法理解的词语

此外,还可以添加 timestamps,以便客户可以回到 audio 的相应部分重新收听。

Speaker Tokens:Transcription 中的 speaker 识别

在 transcription 中,需要清楚地识别出 speaker。 通常情况下,可以使用 speaker 的 first name 来识别 speaker。但是,如果 speaker 的 name 无法识别,可以使用 “Interviewer” 和 “Respondent” 等标记来区分 speaker。

示例:

John: How are you doing today?

Mary: I'm doing well, thank you.

Interviewer: How are you doing today?

Respondent: I'm doing well, thank you。

其他需要注意的事项:

  • 保持 paragraphs 短小精悍,增加 whitespace,提高 transcription 的可读性。
  • 作为 freelance transcriptionist,您可以自由选择接受或拒绝 transcription 任务。
  • 只接受您有能力完成的任务,确保提供高质量的 transcription 结果。
  • 按时提交 transcription 结果,如果需要更多时间,请提前与客户沟通。

Transcription 实用技巧

准备工作

  1. 选择合适的 transcription 软件和硬件:选择一款功能强大、操作简便的 transcription 软件,并配备高质量的耳机和麦克风,以提高 transcription 的效率和准确性。

  2. 熟悉不同的 transcription 类型:了解 Clean Verbatim 和 Full Verbatim 等不同 transcription 类型的区别,并根据客户的需求选择合适的 transcription 类型。

  3. 了解 transcription 领域的专业术语:熟悉 transcription 领域的专业术语,如 filler words、thinking noises、false starts 等,以便更好地理解和处理 transcription 任务。

Transcription 过程

  1. 仔细倾听 audio:在 transcription 过程中,仔细倾听 audio,并尽可能多地了解 speaker 的语速、口音和表达方式。

  2. 准确记录语音内容:准确记录语音内容,包括 speaker 所说的每一个词语、每一个句子和每一个段落。

  3. 使用正确的 transcription 规则:根据客户的需求,使用正确的 transcription 规则,如是否需要省略 filler words、是否需要保留 thinking noises 等。

  4. 识别无法辨认的词语:在 transcription 过程中,如果遇到无法辨认的词语,可以使用 “[Indiscernible]”、“[Inaudible]” 或 “[Unintelligible]” 等标记来表示这些词语。

  5. 校对和编辑:在完成 transcription 后,仔细校对和编辑文本,确保 transcription 的准确性和可读性。

提交 Transcription 结果

  1. 按时提交:按时提交 transcription 结果,如果需要更多时间,请提前与客户沟通。

  2. 提供高质量的 transcription 结果:提供高质量的 transcription 结果,包括准确的语音内容、正确的 transcription 规则和清晰可读的文本。

  3. 与客户保持良好的沟通:与客户保持良好的沟通,及时回复客户的问题和需求。

Transcription 服务定价

影响 Transcription 服务定价的因素

Transcription 服务的定价受多种因素影响,包括 audio 的长度、难度、所需 transcription 类型、以及 transcriptionist 的经验和技能。一般来说,audio 难度越高、所需 transcription 类型越复杂、transcriptionist 的经验和技能越丰富,transcription 服务的定价就越高。

常见的定价方式:

  • 按 audio 小时数定价:这是一种常见的定价方式,通常适用于难度较低的 transcription 任务。
  • 按 transcription 字数定价:这是一种较为灵活的定价方式,适用于不同难度的 transcription 任务。
  • 按项目定价:这是一种适用于大型 transcription 任务的定价方式,通常需要与客户进行详细的沟通和协商。

如何选择合适的 Transcription 服务

在选择 transcription 服务时,需要综合考虑多种因素,包括 audio 的难度、所需 transcription 类型、预算、以及 transcriptionist 的经验和技能。建议您在选择 transcription 服务之前,先与 transcriptionist 进行详细的沟通,了解他们的经验和技能,并明确您的需求和预算。

选择合适的 transcription 服务的步骤:

  1. 明确您的需求和预算。
  2. 寻找合适的 transcriptionist。
  3. 与 transcriptionist 进行详细的沟通。
  4. 确定 transcription 服务的定价方式。
  5. 签订 transcription 服务协议。

Transcription 服务的优缺点

? Pros

节省时间和精力

提高效率

方便共享

提高可访问性

便于存储

? Cons

需要一定的成本

需要选择合适的 transcriptionist

需要与 transcriptionist 保持良好的沟通

高质量 Transcription 服务的核心特点

精准性

高质量的 transcription 服务应具备精准性,能够准确记录 audio 中的每一个词语、每一个句子和每一个段落。为了保证精准性,transcriptionist 需要具备良好的听力能力、丰富的词汇量和专业的 transcription 技能。

可靠性

高质量的 transcription 服务应具备可靠性,能够按时提交 transcription 结果,并与客户保持良好的沟通。为了保证可靠性,transcriptionist 需要具备良好的时间管理能力和沟通能力。

高性价比

高质量的 transcription 服务应具备高性价比,能够在合理的预算范围内提供高质量的 transcription 结果。为了保证高性价比,transcriptionist 需要具备丰富的经验和技能,并能够根据客户的需求选择合适的 transcription 类型和定价方式。

Transcription 服务的应用场景

商务会议

Transcription 服务可用于记录商务会议的内容,方便参会人员回顾和总结会议要点。同时,Transcription 服务还可以用于生成会议纪要,方便参会人员了解会议决议和行动计划。

讲座

Transcription 服务可用于记录讲座的内容,方便听众回顾和学习讲座知识。同时,Transcription 服务还可以用于生成讲座笔记,方便听众了解讲座要点和关键概念。

法庭记录

Transcription 服务可用于记录法庭审理的内容,为法官、律师和当事人提供准确的法庭记录。同时,Transcription 服务还可以用于生成法庭笔录,为法官、律师和当事人提供详细的法庭记录。

研究访谈

Transcription 服务可用于记录研究访谈的内容,为研究人员提供准确的访谈记录。同时,Transcription 服务还可以用于生成访谈报告,为研究人员提供详细的访谈记录。

其他

此外,Transcription 服务还可以应用于其他场景,如电话会议记录、视频会议记录、语音邮件记录、以及其他需要记录语音内容的场景。

常见问题解答

什么是 Clean Verbatim transcription?

Clean Verbatim transcription 是一种旨在消除无关的语音细节,提供清晰简洁的文本的 transcription 方法。 在 Clean Verbatim transcription 中,false starts、verbal tics、stutters 以及其他与文本内容无关的语音或声音都会被省略。然而,需要注意的是,Clean Verbatim transcription 并不涉及 paraphrasing,即句子不能被改写,必须保持原文的意思。Clean Verbatim transcription 适用于需要清晰简洁文本的场景,如商务会议、讲座等。

什么是 Full Verbatim transcription?

Full Verbatim transcription 是一种力求捕捉每一个语音细节的 transcription 方法。 在 Full Verbatim transcription 中,false starts、verbal tics、stutters 以及所有utterances都会被保留。Full Verbatim transcription 适用于需要完整记录语音内容的场景,如法庭记录、研究访谈等。

什么是 filler words?

Filler words 是指在说话过程中出现的无实际意义的词语,如 “嗯”、“啊”、“你知道” 等。 这些词语通常用于标记 pause 或 hesitation,但在 Clean Verbatim transcription 中通常会被省略。

什么是 thinking noises?

Thinking noises 是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等。 这些声音通常不是对 speaker 所说内容的直接反应,因此在 Clean Verbatim transcription 中通常会被省略。

什么是 slang words?

Slang words 是指在非正式场合使用的口语化词语,如 “gonna”、“wanna”、“gotta”、“alright”、“coz” 等。 在 transcription 中,通常不建议使用 slang words,而应使用正式用语。

相关问题

Transcription 服务有哪些优势?

Transcription 服务有很多优势,包括: 节省时间和精力:Transcription 服务可以帮助您节省时间和精力,让您专注于更重要的事情。 提高效率:Transcription 服务可以帮助您提高效率,让您更快地获取语音内容。 方便共享:Transcription 服务可以帮助您方便地共享语音内容,方便更多人了解和学习。 提高可访问性:Transcription 服务可以帮助您提高语音内容的可访问性,方便听力障碍人士了解和学习。 便于存储:Transcription 服务可以帮助您便于存储语音内容,方便您随时回顾和查看。 总之,Transcription 服务是一种非常有价值的服务,可以应用于各种场景,帮助您更好地利用语音内容。

如何选择合适的 transcriptionist?

在选择 transcriptionist 时,需要综合考虑多种因素,包括: 经验:选择具有丰富经验的 transcriptionist,他们能够更好地理解您的需求,并提供高质量的 transcription 结果。 技能:选择具备专业技能的 transcriptionist,他们能够准确记录语音内容,并使用正确的 transcription 规则。 价格:选择价格合理的 transcriptionist,在预算范围内提供高质量的 transcription 结果。 沟通:选择沟通顺畅的 transcriptionist,他们能够及时回复您的问题和需求,并与您保持良好的沟通。 口碑:选择口碑良好的 transcriptionist,他们的客户评价可以反映他们的服务质量和信誉。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

44

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

37

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

22

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

19

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

3

2026.02.27

漫蛙app官网链接入口
漫蛙app官网链接入口

漫蛙App官网提供多条稳定入口,包括 https://manwa.me、https

268

2026.02.27

deepseek在线提问
deepseek在线提问

本合集汇总了DeepSeek在线提问技巧与免登录使用入口,助你快速上手AI对话、写作、分析等功能。阅读专题下面的文章了解更多详细内容。

51

2026.02.27

AO3官网直接进入
AO3官网直接进入

AO3官网最新入口合集,汇总2026年可用官方及镜像链接,助你快速稳定访问Archive of Our Own平台。阅读专题下面的文章了解更多详细内容。

430

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 5.8万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号