基于视觉语言融合的可见光行人重识别-文献-中国学术期刊网

刊名	科技新时代
作者	郭蕊	单位	青岛幼儿师范高等专科学校山东胶州 266318	年，卷(期)	2025年,第6期
主办单位	北京卓众出版有限公司	国内刊号	CN11-3750/N	国际刊号	ISSN1006-981X
入库时间	2025-07-16

基于视觉语言融合的可见光行人重识别

作者：郭蕊时间：2025-07-16 阅读：3386

收录报告下载 截图下载

摘要：本文针对可见光行人重识别任务中复杂场景下行人特征表征不足的问题，提出一种基于视觉语言融合的行人重识别方法。该方法将Vision Transformer（ViT）[1]与大语言模型（LLMs）相结合，通过图像分块、线性投影与位置编码经ViT 网络提取图像特征；同时利用大语言模型生成行人的简要与详细两种文本描述，通过交叉注意力机制，依次融合简要描述与详细描述的语义信息增强图像特征。实验表明，该方法在多个公开数据集上显著优于传统方法，有效提升了行人特征的判别力与泛化能力。

阅读全文

上一篇：健康中国2030背景下运动健身的重要意义和发展前景

下一篇：儿童福利机构中社会工作者的角色定位与专业能力提升

基于视觉语言融合的可见光行人重识别

关于我们

期刊