架构图
关于人声时长计算
* 通过频域分量信号转成分贝数据,从而实现人声时间统计的。(建议设置为:20-60分贝左右的参数)
*
1分贝是人类耳朵刚刚能听到的声音,20分贝以下的声音,一般来说,我们认为它是安静的。20-40分贝大约是细声。40-60分贝属于我们正常的交谈声音。60分贝以上就属于吵闹范围了,70分贝我们就可以认为它是很吵的,而且开始损害听力神经,90分贝以上就会使听力受损
http接口参数
* 音频文件接口
chnel:(mon, left, right) { "name":xxx.mp3 "chnel":mon "url":xxx.oss.ali.com
/xxx.mp3 }
* 人声时长数据接口
chnel:(right, left) { "name":xxx.mp3 "chnel":mon "url":xxx.oss.ali.com/xxx.mp
3 }
说明
*
利用serverless技术能够对音频进行实时转换,调用次数按量计费。并发量不限制。
*
每种转换使用不同的函数,可以进行并行计算
* 每当上传音频文件到OSS中,会自动进行转码工作
新建函数计算服务
* 选择已有的角色
添加触发器
* 设置触发器类型:对象存储触发器
* 在阿里云创建函数计算,绑定OSS的上传音频的bucket
基础管理配置
* 命名函数名称(随意)
* 运行环境为python2.7
* 使用代码打包的方式上传(把代码上传到上面就行了)
* 添加环境变量
* 超时时间设置为600秒,否者转码可能会失败。
角色授权设置
* 选择已有的角色
环境变量参数说明
* AUDIO_CONVERT_ARG : 音频编码参数
* OSS_PUT_ADDR:转码完成的文件放置的OSS地址
* OSS_PUT_BUCKET: 转码完成的文件放置的BUCKET
* OSS_WATCH_ADDR:监视新音频文件上传的地址
* OSS_WATCH_BUCKET:监视的新音频文件的BUCKET
频谱分析参数
* OSS_MIN_dB:(最小分贝)
* OSS_MAX_dB:(最大分贝)
热门工具 换一换