人工智能与大数据安全研究所第十次研讨会
时间:2023年11月28日 下午14:00-17:00
地点:广州大学 (大学城校区) 理科南314#
报告1:
报告人: 毛忌(硕士生) 指导老师:杨柳
报告题目:Monaural Speech Enhancement Based on Phase and Time-Frequency Distribution Optimization
在本次报告中,毛忌同学深入探讨了单声道语音增强领域的相关研究。报告一开始介绍了语音处理领域的基本概念,同时针对目前单声道语音增强技术存在的瓶颈进行了剖析。接着,毛忌同学详细阐述了其提出的基于相位与时频分布优化的双分支时频域单声道语音增强方法,并且在这一模型中引入了差分平方相位和分解时频注意力机制,成功地改善了单声道语音增强模型对音频信号的处理能力,实现了更精准的时频分布信息提取和相位信息重建,从而提高了增强后语音的质量和清晰度。最后,毛忌同学对报告进行了总结,参会老师和同学们就该研究工作的优势和不足之处展开了深入的讨论,对该研究工作提出了一系列有益的建议,为其后续研究工作指明了方向。
报告2:
报告人: 吕恩旭 (硕士生) 指导老师:谭恒良
报告题目: Learning Submanifold-Specific Normalization and Attention with SPD Matrices for Visual Classification
在本次报告中,吕恩旭同学介绍了深度多尺度子流形网络的子流形的归一化和注意力学习的相关研究。报告首先阐述了协方差矩阵和黎曼流形的相关概念,以及子流形网络的子流形缺少进一步的特征提取。随后,吕恩旭同学详细介绍了在子流形上引入子流形归一化的方法,通过将子流形组通过平行传输从各自组重心位置移动到中点,又通过平行传输从中点移动到一个另一个可学习的位置,同时对子流形使用了注意力机制,对不同的子流形分配不同的权重,提升了模型在图像集分类上的性能。最后,吕恩旭同学对此报告进行了总结和对模型缺陷进行了阐述,并与老师、同学展开了激烈的讨论。参会老师们对研究工作进行了专业的点评,并给出了许多重要的建议。