千万级实时音视频转码架构设计方案 - 好文

架构图

关于人声时长计算

* 通过频域分量信号转成分贝数据，从而实现人声时间统计的。(建议设置为：20-60分贝左右的参数)
*
1分贝是人类耳朵刚刚能听到的声音，20分贝以下的声音，一般来说，我们认为它是安静的。20-40分贝大约是细声。40-60分贝属于我们正常的交谈声音。60分贝以上就属于吵闹范围了，70分贝我们就可以认为它是很吵的，而且开始损害听力神经，90分贝以上就会使听力受损
http接口参数

* 音频文件接口
chnel:(mon, left, right) { "name":xxx.mp3 "chnel":mon "url":xxx.oss.ali.com
/xxx.mp3 }
* 人声时长数据接口
chnel:(right, left) { "name":xxx.mp3 "chnel":mon "url":xxx.oss.ali.com/xxx.mp
3 }
说明

*
利用serverless技术能够对音频进行实时转换，调用次数按量计费。并发量不限制。

*
每种转换使用不同的函数，可以进行并行计算

* 每当上传音频文件到OSS中，会自动进行转码工作
新建函数计算服务

* 选择已有的角色
添加触发器

* 设置触发器类型：对象存储触发器
* 在阿里云创建函数计算，绑定OSS的上传音频的bucket
基础管理配置

* 命名函数名称（随意）
* 运行环境为python2.7
* 使用代码打包的方式上传(把代码上传到上面就行了)
* 添加环境变量
* 超时时间设置为600秒，否者转码可能会失败。
角色授权设置

* 选择已有的角色
环境变量参数说明

* AUDIO_CONVERT_ARG ：音频编码参数
* OSS_PUT_ADDR：转码完成的文件放置的OSS地址
* OSS_PUT_BUCKET: 转码完成的文件放置的BUCKET
* OSS_WATCH_ADDR:监视新音频文件上传的地址
* OSS_WATCH_BUCKET：监视的新音频文件的BUCKET
频谱分析参数

* OSS_MIN_dB：（最小分贝）
* OSS_MAX_dB：（最大分贝）

热门工具换一换