人工智能与大数据安全研究所第十二次研讨会
时间:2024年1月9日 下午14:00-17:00
地点:广州大学 (大学城校区) 理科南 314#
报告1:
报告人:王陈阳(硕士生) 指导老师:黄华锟
报告题目:基于非线性字典学习方法的室内无线感知定位
在此次报告中,王陈阳同学首先介绍了室内无线感知定位的背景及原理。室内感知定位拥有广泛的应用空间,其可被应用于安防、监护等场景。目前室内感知定位的实现主要依靠传感器,其缺点是部署成本较高,且可能包含用户的隐私泄露问题。为了解决上述问题,人们提出使用WiFi无线信号代替传感器实现室内感知定位任务。有许多基于深度学习的方法被用来解决室内无线感知定位任务,但是基于深度学习的方法虽然有高效率,但容易被输入数据的噪声干扰,且其得到的结果可解释性较差。字典学习具有较好的抗噪性能且得到的结果可解释性好,但是学习效率差。因此,王陈阳同学将深度学习和字典学习的优势融合,提出了一种结合了深度学习的有监督字典学习(Deep Supervised Dictionary Learning)方法来解决室内无线感知定位任务,同时考虑到呈非线性分布的输入数据可能导致原先方法无法较好拟合的问题,王陈阳同学还引入了非线性字典学习来验证效果。该方法的目标是通过对输入的无线信号进行稀疏编码后,用户可以使用该稀疏编码,利用学习出的字典得到该无线信号表示的位置信息。这个新方法在字典学习中的字典后添加了一个分类矩阵,并将二者视为一个整体的字典,当作神经网络中的参数进行更新。由于字典的学习过程由深度学习控制,且在学习的同时也完成了分类器的训练,因此提高了字典的整体学习效率。实验分别使用CSI信号的幅值和相位来对比引入非线性字典前后DSDL的表现。结果显示,对于CSI幅值,引入非线性字典学习前后DSDL表现都十分良好;对于呈非线性分布的CSI相位后,引入非线性字典学习后DSDL表现会更好。因此初步验证,引入非线性字典学习后,会在处理呈非线性分布的数据上有所进步。最后,在场老师们也提出了一些建设性意见,比如最后实验对比环节不是很严谨,应当选择相同领域中的baseline进行比较,来体现非线性字典学习的优势;可以尝试使用数学推导来确认引入非线性字典学习后,是否对方法有实际推动作用。
报告2:
报告人:张方园(硕士生) 指导老师:汤茂斌、谢延昭、汪洋涛
报告题目:Cross-Coupled Prompt Learning for Few-Shot Image Recognition
在这次的报告中,张方园同学首先介绍了多模态视觉语言大模型的发展背景、研究意义及预训练-微调训练,在此基础上引入提示学习方法。接下来,介绍了提示学习在多模态视觉语言中应用的几种模型,包括相关的工作原理以及存在的问题,如CoOp、CoCoOp、VPT、UPT、MAPLE、DCP。最后,介绍了提出的CCPL模型的工作原理以及各个模块的内容、作用以及相关实验结果并做出总结。参会的老师们对该项研究工作进行了专业的点评,并给出了许多重要建议,为进一步更深入的研究提供了有价值的参考作用。