本文源自:金融界
金融界2024年12月5日消息,国家知识产权局信息显示,中电智恒信息科技服务有限公司申请一项名为“一种声音事件检测方法及存储介质”的专利,公开号CN 119068911 A,申请日期为2024年8月。
专利摘要显示,本发明提供了一种声音事件检测方法,包括:获取待检测音频的对数梅尔频谱特征;将所述对数梅尔频谱特征输入已训练的声音事件检测模型,通过模型中的特征提取模块对所述数梅尔频谱特征进行多尺度特征提取,获得多尺度线性特征;通过模型中的时间定位模块提取所述多尺度线性特征在时间维度上的信息特征;通过模型中的事件决策模块对所述多尺度线性特征在时间维度上的信息特征,进行分类,获得待检测音频对应的检测标签。其中,所述特征提取模块中的MSSC残差卷积块使用多个分别包含两个深度条带卷积的通道结构辨识待检测音频数据不同尺度的信息,使得本发明在短时声音事件检测方面展现出了显著的优势,整体性能得到了有效的提升。
版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
发表评论