
本文介绍如何使用PyAudio库实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。通过修改原始代码中的循环结构和停止音频流的方式,实现对声音播放的精确控制,避免了预先定义音频时长的限制,并提供了代码示例和注意事项,帮助开发者更好地理解和应用该技术。
实现无限时长声音播放与停止
原始代码中存在一个关键问题:音频流的播放被限制在一个内部的while循环中,并且循环只执行一次。这导致声音只能播放很短的时间。要实现按下按钮开始播放声音,松开按钮停止声音的效果,需要对代码结构进行调整。
核心思路:
- 移除时长限制: 不再预先定义音频的时长,而是持续生成音频数据并播放,直到接收到停止信号。
- 外部循环控制: 使用外部循环来监听MIDI输入,根据按键状态控制音频流的启动和停止。
- 实时音频流控制: 在接收到停止信号时,立即停止音频流。
修改后的代码:
import time
from rtmidi.midiutil import open_midiinput
import numpy as np
import pyaudio
p = pyaudio.PyAudio()
# play = True # Removed this line
volume = 0.5 # range [0.0, 1.0]
fs = 44100 # sampling rate, Hz, must be integer
# duration = 5.0 # in seconds, may be float # Removed duration
fA = 440.0 # sine frequency, Hz, may be float
fB = 493.88
fC = 523.25
fD = 587.33
frekvence = 440
frekvence_seznam = {
(144, 32): fA,
(144, 33): fB,
(144, 34): fC,
(144, 35): fD,
}
port = 0
midiin, port_name = open_midiinput(port)
stream = None # Initialize stream outside the loop
try:
while True:
msg = midiin.get_message()
if msg:
message = msg
klic = message[0]
lepsi_klic = tuple(klic[:2])
print(message[0])
if lepsi_klic in frekvence_seznam:
print("je to tam")
frekvence = frekvence_seznam[lepsi_klic]
period = 2 * np.pi
# Removed duration from np.arange
x = period * np.arange(fs * 0.1) * frekvence / fs # Use a small chunk size
sinus = np.sin(x)
square = np.sign(sinus)
triangle = 2/np.pi * np.arcsin(np.sin(x))
saw = abs((x % period) - 1)
curvy_triangle = (abs((x % period) - 1)) ** 2
samples = (triangle).astype(np.float32)
# for paFloat32 sample values must be in range [-1.0, 1.0]
if stream is None or not stream.is_active(): # Check if stream is active
stream = p.open(format=pyaudio.paFloat32,
channels=1,
rate=fs,
output=True)
vysledek = volume * samples
# spusteni zvuku
stream.write(vysledek) #Removed while Loop and just write one chunk
elif lepsi_klic == (128, 32) or lepsi_klic == (128, 33) or lepsi_klic == (128, 34) or lepsi_klic == (128, 35): # Key released
print("Key Released")
if stream is not None and stream.is_active():
stream.stop_stream()
elif lepsi_klic == (144, 81):
break # Exit the main loop
finally:
if stream is not None and stream.is_active():
stream.stop_stream()
if stream is not None:
stream.close()
p.terminate()
print("Program terminated.")代码解释:
本文档主要讲述的是android rtsp流媒体播放介绍;实时流协议(RTSP)是应用级协议,控制实时数据的发送。RTSP提供了一个可扩展框架,使实时数据,如音频与视频,的受控、点播成为可能。数据源包括现场数据与存储在剪辑中数据。该协议目的在于控制多个数据发送连接,为选择发送通道,如UDP、组播UDP与TCP,提供途径,并为选择基于RTP上发送机制提供方法。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
- 移除duration: 不再预先定义音频时长。
- 移除内部while循环: 去掉了while play == True循环,直接在if语句块中写入音频数据。
- 使用小chunk size: 使用小的chunk size,例如fs * 0.1,使得音频可以更快的响应按键释放。
- 按键释放检测: 增加了对按键释放事件的检测(例如,MIDI消息(128, 32)),当检测到按键释放时,停止音频流。
- 流的初始化和判断: 在循环外部初始化 stream = None,并在每次播放前检查 stream 是否已经创建和激活,避免重复创建。
- 异常处理: 使用try...finally块确保程序退出时能够正确关闭音频流和PyAudio实例。
注意事项:
- MIDI消息: MIDI消息的具体数值取决于MIDI键盘的设置。请根据实际情况调整代码中的MIDI消息值。
- 性能优化: 持续生成和播放音频数据可能会消耗一定的CPU资源。如果需要处理复杂的音频效果,可以考虑使用更高效的音频处理库,例如librosa或sounddevice。
- 音频流控制: 确保在程序退出前正确关闭音频流,释放资源。
- chunk size: 调整np.arange(fs * 0.1)中的0.1可以调整每次写入音频流的数据量,影响响应速度和CPU占用。
总结:
通过修改原始代码的循环结构和音频流控制方式,可以实现按下按钮开始播放声音,松开按钮停止声音的实时音频控制。这种方法避免了预先定义音频时长的限制,提供了更大的灵活性。在实际应用中,可以根据需要调整代码,实现更复杂的音频效果。









