如何正确使用 librosa.resample 进行音频重采样

聖光之護

发布时间：2025-12-29 14:37:36

681人浏览过

来源于php中文网

原创

如何正确使用 librosa.resample 进行音频重采样

本文详解 librosa 0.10.1+ 版本中 `librosa.resample` 的调用规范，重点解决因参数传递方式错误（如误用位置参数）导致的 “takes 1 positional argument but 3 were given” 报错，并提供完整、健壮的多通道音频重采样实践代码。

在使用 librosa 对音频进行重采样（如将原始采样率统一为 16 kHz 以适配 wav2vec2 模型输入）时，一个常见且易被忽视的陷阱是：新版 librosa（≥0.8.0，尤其 0.10.1+）已将 resample 函数改为仅接受关键字参数（keyword-only arguments）。这意味着 orig_sr 和 target_sr 必须显式以命名参数形式传入，而不能再像旧版那样作为位置参数顺序传递。

你遇到的报错：

resample() takes 1 positional argument but 3 were given

正是源于以下错误写法：

librosa.resample(audio_signal, original_sr, 16000)  # ❌ 错误：后两个参数被当作位置参数

而正确调用方式必须严格遵循函数签名（注意 * 分隔符）：

Lexica

一个搜索 AI 生成图片的网站，可以上传图片或prompts搜索图片。

下载

librosa.resample(y=audio_signal, orig_sr=original_sr, target_sr=16000)  # ✅ 正确
# 或简写（y 是第一个参数，可省略名称；但 orig_sr/target_sr 必须带名）
librosa.resample(audio_signal, orig_sr=original_sr, target_sr=16000)  # ✅ 推荐

以下是修复后的完整、生产就绪的重采样代码（兼容单/双通道，含异常处理与类型安全）：

import librosa
import numpy as np

# 假设 database['audio'] 是 list of np.ndarray（每个元素为 waveform），database['psr'] 是原始采样率列表
new_sr = []
resampled_audios = []

for i, (audio_signal, original_sr) in enumerate(zip(database['audio'], database['psr'])):
    try:
        # 确保输入为 numpy 数组且为浮点型（librosa.resample 要求）
        audio_signal = np.asarray(audio_signal, dtype=np.float64)

        # 处理多通道：逐通道重采样并堆叠
        if audio_signal.ndim > 1:
            resampled_channels = []
            for ch in audio_signal:
                ch_res = librosa.resample(ch, orig_sr=original_sr, target_sr=16000)
                resampled_channels.append(ch_res)
            resampled_audio = np.stack(resampled_channels, axis=0)
        else:
            # 单通道直接重采样
            resampled_audio = librosa.resample(audio_signal, orig_sr=original_sr, target_sr=16000)

        resampled_audios.append(resampled_audio)
        new_sr.append(16000)

    except Exception as e:
        print(f"⚠️  索引 {i} 音频重采样失败（原始采样率 {original_sr} Hz）: {e}")
        # 可选：保留原音频或跳过，此处设为 None 便于后续排查
        resampled_audios.append(None)
        new_sr.append(None)

# 更新数据库
database['audio'] = resampled_audios
database['newsr'] = new_sr

✅ 关键注意事项：

永远显式指定 orig_sr= 和 target_sr= —— 这是避免报错的核心；
librosa.resample 默认使用高质量重采样器（soxr_hq），无需额外配置即可满足 ASR 模型训练需求；
若原始音频为整型（如 int16），务必先转为 float32/float64，否则可能引发数值溢出或静音；
对于立体声等多通道音频，不可直接对整个二维数组调用 resample（它不支持 batch 维度），必须按通道循环处理；
如需更高性能批量处理，建议改用 torchaudio.transforms.Resample（PyTorch 原生，GPU 加速支持）替代。

掌握这一参数规范，不仅能解决当前报错，更是安全集成 librosa 到语音预处理流水线的重要基础。

Python-docx 中设置页面宽度和高度的正确方法

Python自动化办公教程_ExcelWordPDF批量处理

如何用Python高效提取CSV数据并自动导入Word表格

如何高效地从CSV提取数据并自动导入Word生成表格

如何在Python中高效提取CSV数据并自动导入Word文档生成表格

相关专题

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

461

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

AI安装教程大全

2026最全AI工具安装教程专题：包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好，附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新，收藏这一篇就够了，让AI安装不再报错！

2026.03.04

Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践，系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例，帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

2026.03.03

C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开，深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例，帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

2026.03.03

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

Golang 工程化架构设计：可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则，涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术，帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

2026.02.28

Golang 性能分析与运行时机制：构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面，深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略，并结合实际案例剖析 Go 程序的运行时行为，帮助开发者掌握构建高性能应用的关键技能。

2026.02.28