【Python】怎样表达一段语音的强度(响度)?

我希望通过一段语音分析语音的强度(响度)。

因为是工科狗而非理科狗,且对于音频信号分析是外行,只简单看了下FFT,所以对于自己分析语音强度的方法没有安全感。希望这方面的高手能够指导下。非常感谢!!!

以下是我获取语音信号数据的过程。123.wav语音文件来自于百度合成的mp3转码,所以这段语音就算存在噪音也应该是微量的,这里不用再滤波了(就算滤波也不知道滤波器系数该用什么)。我猜想到此应该是没有问题的?

# -*- coding: utf-8 -*-

import numpy as np

import pylab as pl

import wave

f = wave.open("/home/dyan/123.wav", "rb")

# 读取格式信息

# (nchannels, sampwidth, framerate, nframes, comptype, compname)

params = f.getparams()

nchannels, sampwidth, framerate, nframes = params[:4]

# 读取波形数据

str_data = f.readframes(nframes)

f.close()

wave_data = np.fromstring(str_data, dtype=np.short)

# 在时间轴上画波形图

# 以上nchannels=1, sampwidth=2, framerate=16000

lenth=len(wave_data)

ti=lenth/16000.0

t = np.arange(0, ti, ti/lenth)

pl.plot(t,wave_data)

pl.show()

波形图(时间长度大约1.8s)【Python】怎样表达一段语音的强度(响度)?
我希望在播放这段语音的时候,通知语音的强度,但是显然频率太快了,并不要这么快,比如0.2s一次统计也许是比较合适的。
我有2个想法,但是不确定,没有安全感:

1、每0.2s求振幅绝对值平均值。

2、每0.2s取振幅绝对值最大值。

不了解音频信号处理,所以完全不知道这两种方案中的一种能不能代表语音强度。或者应该用其他的方式。

综上所述,2个问题:

1、这样获取波形数据wav_data是否正确?

2、怎样表达这段语音的强度(响度)?

回答

声音就是机械振动波

它的强度就是振幅大小

高音和低音是 频率

以上是 【Python】怎样表达一段语音的强度(响度)? 的全部内容, 来源链接: utcz.com/a/78604.html

回到顶部