摘要:针对恶劣环境下振动信号复杂、噪声难以去除的问题,文中将改进的自适应噪声完备集合经验模态分解、模糊熵(FE)特征提取与改进的小波阈值相结合,提出一种ICEEMDAN-FE联合改进小波阈值的振动信号去噪算法。首先,将测得的振动信号经过ICEEMDAN分解为多个固有模态函数(IMF)与具有相对平滑的变化趋势的残余项(Res);其次,通过模糊熵(FE)特征提取算法计算各IMF模糊熵特征值,通过设定的IMF阈值条件对信息主导部分的IMF进行保留;然后,采用改进小波阈值对仅保留的信息主导分量的各IMF进行相应去噪处理;最后,将残余项与改进小波阈值去噪处理后的IMF进行信号重构,得到最终信号。通过建立仿真信号对滤波效果进行评估,实验结果表明,与ICEEMDAN去噪、小波阈值去噪以及ICEEMDAN-小波阈值去噪相比,所提算法信噪比(SNR)分别提高了3.2335dB、1.1811dB、1.0663dB,归一化互相关(NCC)分别提高了0.03342、0.00939、0.0084,均方根误差(RMSE)分别降低了 52.5%,23.81%,21.77% 。导入实测振动信号后的去噪结果也表明,所提算法在进行去噪后有效信号更加完整,信号更为平滑,去噪效果较为理想。
摘要:针对同步定位与地图构建中前端特征提取与匹配鲁棒性不足的问题,提出一种基于量化神经网络的SLAM增强型点特征匹配方法。通过构建适应度函数并采用柯西变异策略优化卷积核权重,同时应用CLAHE算法均衡图像亮度分量,从而提升图像质量;在特征提取阶段,通过增加额外的卷积层,并设计含有跳跃连接结构的注意力机制,进一步提升ZippyPoint网络的性能;最终,通过计算欧氏距离的平方差构建距离矩阵,结合反向匹配结果批量提取匹配点,并通过张量操作验证双向一致性,从而实现精确的特征点匹配。实验结果表明,增强后的图像亮度适中,灰度分布均匀,且在复杂场景中的平均匹配精度达到 70.87% ,匹配时间为 0.243s ,两项指标分别较 ORB+BF 算法提高 52.07% 和 60.94% ,具有较高的应用价值。
摘要:传统的脑电时频信号分类方法仅关注脑电信号的局部特性,没有充分探究不同脑区之间的关联特征,无法全面捕捉大脑活动的前后时间关联,存在对大脑理解不够全面、分类准确率不高等问题。文中基于加州大学尔湾分校提供的酗酒脑电数据集,运用相位锁定值(PLV)构建功能脑网络,研究了 α,β,γ,θ 四个子频段和全频段的EEG脑网络拓扑特征,探究了酗酒者与健康对照者EEG脑网络的拓扑属性差异。同时,提出一种基于Fisher特征筛选和改良麻雀算法优化的BiLSTM分类算法(Fisher-ISSA-BiLSTM),运用Fisher准则进一步筛选了脑网络特征,通过双向长短时记忆网络充分分析了脑电信号前后时序的关联性,运用改良的麻雀搜索算法(ISSA)优化BiLSTM的超参数。在原麻雀算法的基础上,引入Sobol映射的初始化方式,提升了麻雀种群的分布质量;加入搜索因子,避免算法过早地陷入局部最优;引入自适应方向因子 di,jt, 优化了麻雀跟随者位置的更新方向。相比其他超参数优化算法,文中算法分类所需时间减少了约 4%~5% ,分类准确率达 92.6% ,相比传统的LSTM分类算法提升了约20% ,对于运用脑电信号识别酗酒患者具有一定的实际意义。
摘要:针对传统红外热成像甲烷气体泄漏检测中需要先验背景、易受特征相似干扰物影响,以及受实时环境因素影响特征变化较大的问题,文中提出一种基于YOLOv5s与红外热成像的甲烷气体泄露检测方法(GAS-YOLOv5s)。首先,使用K-means算法对YOLOv5模型的锚框进行预分类优化,根据泄漏点距离和泄漏程度确定锚框大小;其次,引入坐标注意力(CA)机制,提高算法对泄漏点位置附近气体特征提取的效率。实验结果表明,改进的YOLOv5s模型相较于原始模型,精确率 (P) 、召回率(R)、 mAP@0.5 和 mAP@0.5:0.95 分别提高了 6.5%,1.9%,4.8%,1.6% ,在视频检测集上达到263f/s的检测速度,满足实时检测要求。证明改进的YOLOv5s算法提升了使用红外热成像甲烷气体泄漏检测的准确率,实现了甲烷气体实时多级分类检测,可以部署到各类检测终端。
摘要:针对路面裂缝图像背景噪声复杂、裂缝形态复杂和误分割严重的问题,文中提出一种基于U型网络改进的路面裂缝分割算法(DCM-Net)。DCM-Net采用双编码器设计,新增加的支路减轻了由于一条支路简单堆叠卷积池化造成的信息丢失;在原有的跳跃连接中增加CoTAttention,旨在加强低级语义信息中的重要特征,减轻由于背景噪声以及车道线和井盖等杂物产生的影响,增强有用信息的特征表达能力;对原编码器中的卷积模块进行重新设计,引入膨胀卷积增大感受野,采取多维特征提取的策略,提高模型在不同裂缝形态下的特征提取能力。对比实验结果表明,在自建数据集CrackNew上,DCM-Net在Dice、平均交并比、准确率、召回率和 F1 上相较于UNet分别提升了 6.3%5.7%5.4%1.8%5.3% 。同时,优于其他主流分割模型,在Crack500和Gaps384两个公开数据集上各个指标仍保持领先,在DeepCrack数据集上进行了消融实验,证明了各模块的有效性。对比其他分割模型,DCM-Net提高了路面裂缝的分割精度,该模型可适用于复杂环境下的道路裂缝分割。
摘要:针对在雾天环境下的道路目标检测存在特征提取难度大、精度与效率难以平衡的问题,文中在YOLOv5n的基础上创新性地提出一种高效且轻量的YOLOv5n-BGF变体,该变体结合了双向特征金字塔网络(BiFPN)模型,利用双向连接的结构特点,更加有效地结合不同尺度的特征;其次,引入GELAN模块代替颈部网络中的C3结构,在减少计算量的同时增强了有效特征的提取;最后,考虑不同样本的边界框回归问题,采用Focaler-IoU来进一步提高检测性能。在本地平台针对非公开雾天道路目标检测数据集D-8800进行验证,实验结果表明,相较于基础模型 ΥOLOv5n ,改进后的YOLOv5n-BGF的mAP@0.5 提升了 5.3% ,参数量减少了 25% ,GFLOPs仅为3.5,YOLOv5n-BGF凭借其卓越的性能,在雾天道路目标检测数据集D-8800上的表现优于其他目标检测模型,为雾天道路目标检测提供了高效的解决方案。
摘要:为提高机载合成孔径雷达(SAR)实测数据成像处理程序的调试效率,文中首次提出并设计了基于实测惯导数据的机载SAR仿真平台。该平台能准确复现雷达参数、飞行轨迹及姿态,通过设置已知、可控的成像场景,将成像结果与预设场景对比,大幅提高实测数据成像处理程序的调试效率。文中详细介绍了平台的功能需求、总体设计、主要模块设计、处理流程,并提供了应用示例,展示了该平台在提升调试效率与准确性方面的显著优势。该平台在科研应用、实验教学方面发挥着巨大优势,可显著提高成像处理算法的研发效率和程序开发能力。
摘要:对敌方雷达进行定位可以获取雷达位置,进而引导干扰和反辐射攻击,为获取电磁战场优势提供了先决条件。通常,采用无源定位的方式获取雷达位置,其中测向交叉定位法环境适应性好、所需设备量适中,是雷达无源定位中最广泛应用的方法。然而,多站测向交叉定位存在定位模糊区,模糊区越小,定位精度越高。为了分析定位精度,在定位原理的基础上,提出一种几何稀释度的精度计算方法。通过分析几何稀释度的计算公式,定位误差的影响因素包括测向误差、侦察站位置、侦察站数量和布站方式。仿真实验结果表明,提高测向精度、侦察站靠近目标、合理布站以及增加侦察站数量这四条措施可以有效提高定位精度。在实际应用中,可根据需要采取相应的措施来提高测向交叉定位的定位精度,从而得到更为精确的雷达目标位置信息,该方法具有一定的实用价值。
摘要:针对内部缺少耦合校准回路或无法开展近场扫描测试校准的相控阵系统设备,文中提出四种基于旋转矢量法的快速发射阵相位校准方法。四种方法的总思路均是直接从能量域角度衡量相控阵功率合成效率,测试环境搭建较为简单,便于操作实现。通过理论推导和仿真比对,四种快速校准方法均可得到较为理想的理论合成结果,并利用12阵元相控阵发射阵设备进行实验测试。结果表明:四种快速校准方法在合成功率上均有提升,且REV3和2SREV合成效率最高,单子阵合成功率提升约3dB,整阵提升可达6dB,在恢复设备技术状态上有较大改善。另外,2MREV测试时整机热耗最低,最大辐射功率也最低,最大降幅分别为 10°C 和 11dB ,有利于降低用频风险。这四种方法均可达到较高的理论合成效率,具有一定的适用性。
摘要:在大规模机器类通信中,机器设备的高速移动所带来的多普勒频偏会导致活跃用户检测和信道估计性能下降。针对上述问题,文中提出一种基于延迟假设的结构化矢量近似消息传递的联合估计算法。该算法利用延迟假设后感知矩阵双重稀疏性的特殊结构对信道的功率谱密度函数进行重新表述,并基于贝叶斯原理和最小均方误差准则重新设计了一种非线性矢量降噪器,以提高活跃用户和频率偏移的联合估计性能。同时,对于可能存在的高计算复杂度问题,设计了一种动态更新测量矩阵的加速计算方法来降低计算复杂度。仿真结果表明,所提算法能够准确地实现频率偏移和用户检测的联合估计,验证了所提算法的有效性。
摘要:为促进射频芯片的国产化替代,文中提出并实现了一种基于Kintex-7FPGA和国产射频芯片CX8242K的软件无线电系统,并对正交频分复用(OFDM)技术在物理层波形设计中的应用展开研究。该系统基于IEEE802.11a协议标准,以Kintex-7作为主控芯片,负责完成基带信号的数字处理和CX8242K射频芯片的初始化配置等,从而实现了OFDM系统完整的信号收发功能。系统硬件设计中采用JESD204B高速接口技术,以保障基带和射频模块的高速数据传输需求,并通过微处理器软核MicroBlaze的嵌入式设计,提升了系统的可扩展性和灵活性。系统测试结果表明,在信号波形功率谱、误码率(BER)和误差矢量幅度(EVM)等关键指标上,该系统均满足设计要求,验证了系统的可行性与性能的有效性。
摘要:为了解决数据帧较长时,冗长的保护带会降低网络的有效带宽利用率问题,文中提出基于深度强化学习PerDQN的PerDQN-TAS方法。将经典的优先约束背包问题(PCKP)转化为马尔可夫决策过程(MDP),通过引入两种新的奖励值(分组长度和分组优先级的加权和)训练PerDQN-TAS模型,以学习在不同状态下应该采取的最优行为,充分利用保护带中可用带宽的同时,提高累计优先级。实验结果表明,相较于已有的TAS保护带算法,PerDQN-TAS的带宽利用率始终保持在 91% 以上,并且随着保护带初始剩余容量的增加逐渐提高,最终达到 98.1% ;同时,累计优先级持续提升,最终达到8.98,显著提升了带宽利用率。
摘要:传统URL检测方法主要依赖黑名单和启发式规则,在应对新型URL变体时存在局限。随着BERT模型被引入恶意URL检测领域,仍存在词汇表依赖、未登录词处理能力不足、语义细粒度较低等问题。为此,文中提出一种基于CharacterBERT与URL结构特征相融合的恶意URL检测模型。该模型采用字符级卷积神经网络(CharacterCNN),摆脱对预定义词汇表的依赖,并通过可变形卷积核提取更精细的语义信息。此外,设计了门控融合网络单元,结合子域名数量、敏感词、URL长度等结构信息来增强恶意URL识别能力。实验结果表明,所提模型在Grambeddings和kaggle_1数据集上均取得了最佳性能, F1 值分别达到 97.88% 和 99.83% ,展现出卓越的性能,在实际安全场景中具有较高的应用价值。
摘要:为了解决图像超分辨率重建模型普遍参数量大和计算过程复杂,对计算量和资源需求急剧增加的问题,文中提出一种基于部分卷积的残差特征聚合轻量超分辨率网络。该网络在部分卷积层的基础上减少模型冗余计算的同时也减少了参数量。在轻量化的前提下,引入残差特征聚合模块,同时关注局部与非局部特征信息,以增强网络对图像细节的全面捕捉,加速信息传递的同时提高网络泛化能力。实验结果表明,所提方法同NGswin和LKFN在公共基准测试集2倍、3倍、4倍缩放因子下的PSNR相比,分别平均提升 0.28dB?0.13dB?0.08 dB和0.03dB、0.02dB、0.02dB;参数量分别减少 82% /81%81% 和 38%,37%,36% ;GFLOPs分别减少 55%.58%.56% 和 6%,7%,11% 。网络在轻量化的同时实现了重建图像质量的提高,减少了图像模糊程度,缓解了重建图像的伪影情况,充分证明了所提方法的高效性。
摘要:针对联邦学习中数据异质性导致的模型泛化能力低以及用户隐私数据泄露问题,文中提出一种基于自适应联邦聚合的分层梯度裁剪算法。首先,根据参与方数据分布情况,利用哈达玛积更新聚合权重初始化本地模型。随后,通过预先设定的阈值,将模型划分为个性化层和冻结层。在训练过程中,对个性化层添加扰动噪声,特别是随着网络层数的增加,扰动的幅度逐渐增大。实验结果表明,HGT-AFA在FashionMNIST数据集上的准确率可达到 91.83% ,在CIFAR10数据集上的准确率可达到 72.08% ,有效地保证了模型的泛化性,也降低了隐私数据泄漏的风险。
摘要:以丰富网络节点近邻入侵特征、能够及时发现潜在无线通信网络节点近邻入侵,防止入侵者进一步破坏无线通信网络或窃取敏感信息为目的,文中提出一种多分支平滑空洞卷积的无线通信网络节点近邻入侵预警方法。通过建立无线通信网络图信号模型,在该模型内以无向图呈现无线通信网络节点拓扑和节点信号,并使用傅里叶变换获得无线通信网络节点近邻的图信号分量,将其作为输入,使用多分支平滑空洞卷积网络模型检测无线通信网络节点近邻是否存在入侵;然后运用JMX通告机制对存在入侵的无线通信网络节点近邻进行预警通知。实验结果表明:该方法具备较强的无线通信网络图信号模型构建能力,可准确检测无线通信网络节点近邻入侵,并可以弹窗通知的形式向用户发出无线通信网络节点近邻入侵预警,应用效果较佳。
摘要:针对微电网中可再生能源和负荷的不确定性,文中提出基于多样性场景性能的微电网鲁棒经济优化算法。该算法对历史数据进行K-means聚类,得到典型场景序列和最小包络集序列。基于最小包络集序列构建两阶段鲁棒优化模型,从而计算最小包络集内的最恶劣场景序列。通过将期望场景、典型场景序列和最恶劣场景序列混合,构造多样性场景集。在日前计划阶段,算法以任意场景下的设备正常运行及功率平衡为约束条件,以多样性场景对应的微电网运行成本概率加权为目标函数,构建两阶段鲁棒优化问题,并通过列与约束生成算法求解,从而确保“多样性场景性能最优,所有场景可行”。在日内调度阶段,利用可再生能源和负荷的测量数据,基于日前计划调度结果,对传统能源发电功率和电网交互功率偏差进行惩罚,进而调整微电网日前优化解,使微电网的经济性提升。最后,通过仿真算例对提出的方法进行验证,证明所提方法具有一定的经济性和鲁棒性。
摘要:多模态方面级情感分析旨在从文本与图像构成的多模态数据中分析特定方面实体的情感极性,为舆情监测、用户体验优化等场景提供支持。现有方法虽尝试融合文本与图像特征,但仍存在图像中承载关键情感信息的小区域或分散区域易因特征弱而被忽略,跨模态对齐缺乏区域感知约束导致匹配精度低,且依赖最终预测监督,未有效解决模态语义差异与噪声干扰,影响模型鲁棒性等问题。为解决上述问题,文中提出基于区域聚焦注意力的多模态方面级情感分析模型(RFAMA)。具体而言,采用RoBERTa提取文本特征,标记目标实体位置以生成上下文感知表示;借助FasterR-CNN提取图像区域特征,保留候选区域并投影至统一维度后经Transformer得到目标级图像表示。核心设计区域聚焦交叉注意力机制,通过小目标掩码增强模块提升关键区域权重,结合双向注意力实现跨模态交互,同时引入中心距离损失优化类内紧凑性与类间判别性。实验结果显示,在Twiter2015和Twittr2017数据集上,模型的准确率相较于表现最佳的对比模型分别提升了1.5% 和 1.28% ,验证了模型设计的合理性,实现了图文特征的精准对齐与深度融合。
摘要:单目深度估计对自动驾驶和机器人导航等应用至关重要,但其部署面临模型复杂性和边界精度低双重挑战。针对上述问题,文中提出一种自监督单目深度估计方法。为降低计算负载,采用一种类似ResNet的高效模型(EMO)编码器,仅使用倒置残差移动块(iRMB)进行高效的多尺度特征提取,实现轻量级编码。为提升几何感知能力,构建双向空间-通道注意力(BSA)机制,该机制将空间建模与通道建模解耦,在不增加模型复杂度的情况下增强区分能力。为缓解解码器通道减少带来的边界伪影问题,提出一种创新的边缘感知蒸馏损失,该损失函数通过Sobel运算符动态权重并融合 L1 和SSIM损失,显著锐化深度图边界。所提方法在KITTI数据集上实现了 、RMSE ,=4.417 和 δ?1=0.894 的性能,能够成功抑制深度图的边缘伪影,优于目前主流方法。
摘要:针对机械臂在复杂密集障碍物环境中的路径规划计算资源冗余及搜索效率不高等问题,文中提出一种GF-RRT* 算法。首先,基于RRT\*算法的核心思想,引入了人工势场法的目标引力,以增强路径搜索的导向性;其次,为了避免算法陷入局部最优解,将人工势场中的斥力场设为0,并设计了合理的碰撞检测机制,确保路径的安全性;此外,采用自适应节点生成优化机制,通过目标偏置策略和节点保留策略,有效减少了冗余节点并优化了路径采样过程;最后,借助三次B样条曲线对路径进行平滑处理,提升了路径的平滑性与实用性。仿真结果显示:相对于RRT算法 ,RRT* 算法和APF-RRT\*算法,GF-RRT\*算法在路径长度上分别缩短了 14.8%.10.6%.3.3% ;运行时间分别下降了 66.1%.57.7%.38.1% ;节点数分别减少了73.2%.61.2%.46.7% ;成功率也从 87.6% 升高到 99.8% 。通过ROCR6机械臂进行了实际环境实验,进一步验证了GF-RRT\*算法在复杂密集障碍物环境下的良好表现,证明了该算法的可行性与有效性。
摘要:高维不平衡数据增量变化时,因多类别样本数目不一、特征分布不均,降维时难免过度关注多数类样本,忽视少数类样本,导致降维后少数类数据失真。为此,文中提出基于等角映射的高维不平衡数据增量式降维算法。利用模糊C-means 算法将高维不平衡数据划分为不同类型数据后,使用基于时间窗口的增量数据抽取方法,抽取不同类型高维不平衡数据的增量数据。由基于等角映射的增量流形学习降维算法运算增量数据与原始数据点距离。结合距离设定权重因子,将此增量数据映射于低维空间,实现高维不平衡数据增量式降维。实验结果表明:所提算法在不同类别高维不平衡数据增量式降维中,无论是1GB还是10GB的新增数据量,降维后数据维度较低,数据结构和信息的保真度较高,没有出现明显失真情况。该方法是一种有效的数据降维算法,可应用于处理大规模高维不平衡数据增量式降维问题中。
摘要:在自然语言处理下的命名实体识别任务中,文本序列长度差异较大,逐词处理会导致计算时间长、效率低下。因此,提出自然语言处理下并行化命名实体识别方法。利用自然语言处理领域中的QRNN(准循环神经网络)和CRF(条件随机场)技术构建并行化命名实体识别模型,通过预处理层对输入文本进行去噪、文本编码等预处理操作,并将预处理后的文本序列输入至QRNN层。QRNN层通过交替使用卷积模块构建网络结构,能够同时处理文本序列中的多个位置,解决逐词处理导致的效率低下问题,从而并行化提取文本深层次的命名实体上下文特征。CRF层通过综合考虑标签序列的全局信息,对QRNN层输出的命名实体上下文特征向量进行解码,采用维特比算法输出最大分数的命名实体标签,从而实现自然语言处理下并行化命名实体识别。实验结果显示,该方法提取的命名实体上下文特征的重要性得分在90分以上,能够为命名实体识别提供关键的信息支持,并且能够精准无误地识别文本中的所有命名实体,无任何遗漏。
摘要:针对交通场景中小目标与细长条型目标的边缘细节信息丢失以及模型参数量过大等问题,文中提出一种形状感知引导边缘结构化的知识蒸馏语义分割算法。该算法能够在缓解小目标信息丢失的同时平滑目标分割边缘,且在低模型参数量下保持较好的分割性能。首先,构建形状感知注意力特征融合模块,动态融合局部几何信息和空间特征,增强目标形状信息的感知能力;其次,提出基于轻量级卷积的语义金字塔模块,构建并行深度分解卷积运算编码多尺度上下文信息;最后,提出基于空间相关性的边缘损失函数传递结构化的全局像素依赖关系,构建基于边缘损失的结构化知识蒸馏网络,精炼轻量级模型的目标分割边缘。在交通场景数据Cityscapes和CamVid上的实验结果表明,所提算法能够在减少模型参数量的同时显著改善目标边缘的分割性能,特别是在处理纤细长条形目标边界时具有显著优势。
摘要:为了解决传统系统依靠人力现场维护以及全量升级存在的文件过大导致通信延迟与设备端占用内存等问题,文中提出一种基于Bsdiff的冷链物流OTA升级技术对设备端进行程序分区设计,经4G进行远程数据传输与下载更新,通过设置中断向量表的偏移量及改变跳转栈顶地址实现程序的跳转。结合Bsdiff算法,通过差分工具分离新旧程序的差异,提取关键信息并压缩生成补丁包,设备端获取还原信息还原出目标更新包。通过STM32F429芯片进行系统验证并进行全量升级和差分对比,实验结果表明,该系统可以实现程序的远程更新,且系统升级文件的平均大小是全量升级的 1/6 ,减少了内存空间的使用率与程序更新的时间,提高了系统的升级效率,验证了所提方法的可行性和可靠性。
摘要:针对斜测电离层图像数据集存在样本人工筛选工作量大与类别分布不平衡的问题,文中提出一种基于改进DCGAN的数据增强方法。该方法通过引入MDTA机制与残差网络,分别对DCGAN的生成器与判别器进行优化,显著提升了网络的生成性能。消融实验结果显示:改进前后DCGAN的FID值从82.5降至47.1,表明所提方法可显著增强生成数据的质量与真实性;进一步采用当前主流检测网络YOLO11对比原始数据集与扩增后数据集的检测性能,结果显示,平均精度均值 (mAP) 从 88.3% 提升至 92.8% ,验证了数据增强方法生成的斜测电离层图像在较为常见的深度学习任务中具有良好的适用性。
摘要:视距情况下的高精度位移估计对滑坡监测、建筑形变监测等场景非常重要,但是在多径与噪声等误差因素的影响下,无线电测距方法对位移的估计精度不佳。针对该问题,文中提出一种基于迁移学习的位移估计方法,从少量的新环境信号样本中快速学习误差知识,修正估计网络,提高新环境中位移估计的精度。使用单输入/单输出系统信道频率响应(CFR)协方差矩阵的随机低秩近似(RLA)作为特征信息,构建基于深度卷积神经网络(CNN)的位移估计模型,学习输入信号样本与其位移信息的映射,并引入对信号样本划分支持集-查询集的学习策略,设计迁移学习模型,优化模型的泛化性和适应能力。通过仿真实验结果表明,提出的方法在测距精度方面优于传统无线电测距方法,在新环境中的总体均方根误差(RMSE)能达到 0.01m 以下。验证了迁移学习在无线位移估计中的有效性,为复杂环境下的高精度位移检测提供了一种具有强适用性的新解决方案。
摘要:为了解决微表情识别中特征提取能力不足和样本数据不均衡导致的识别偏差问题,文中提出一种基于多尺度注意力与双流融合特征的微表情识别方法。首先设计多尺度注意力模块,通过光流和差分序列特征的融合提升微表情关键动态信息的提取能力;其次设计了改进的多核Inception模块,结合深度可分离卷积和多尺寸卷积核,在提升特征表达能力的同时降低计算复杂度;最后采用数据扩充策略和FocalLoss损失函数以缓解样本类间不均导致的识别偏移。实验结果显示,该方法在CASMEⅡ、SMIC-HS、SAMM和MEGC2019等4个自发微表情数据集上实现了优异性能。其中UAR和UF1指标分别达到最高,为0.914和0.912,显著优于近期主流方法。同时,设计的消融实验验证了多尺度注意力模块和多核Inception模块在特征提取中的关键作用。实验结果表明,所提方法通过多维度融合、创新特征提取、数据扩充和改善损失函数等操作,获得了高精度且具有竞争力的微表情识别性能。
摘要:针对现有车辆轨迹预测模型精度不高、特征提取能力不足的问题,文中提出一种基于时空趋势感知多头自注意力的LSTM车辆轨迹预测模型。模型在LSTM编码-混合递归-示教解码器架构基础上,加入局部窗口机制和因果掩码机制的多头自注意力模块对编码向量进行特征提取,即将LSTM编码的隐藏状态向量分割成若干个独立的局部窗口,对每个子窗口进行因果注意力计算,并逐层扩大局部窗口直至覆盖全部历史时刻。此机制有效挖掘了驾驶行为的时间依赖性和空间交互特性,提升了多头自注意力的特征提取能力。利用NGSIM轨迹数据集进行仿真验证,与改进前的轨迹预测模型相比,在预测时域分别为 1s?2s.3s.4s.5s 时,RMSE分别降低了 21.0%?10.6%?13.2%?0.4%?0.8% ,FDE分别降低了 19.5%.7.6% 、1.1%0.0%0.2.1% 。同时分析了多头自注意力中头的数量对轨迹精度的影响,实验结果显示,注意力头数为4时综合表现最优。验证了所提模型在特征提取能力和轨迹预测性能方面的有效性。
摘要:在自动驾驶场景中,检测远距离目标和小目标(如行人和骑行者)时,因其尺寸较小、形状复杂和点云稀疏,检测难度显著增加。为此,文中提出一种改进的三维目标检测方法(3DGP-PointRCNN)。该方法基于PointRCNN,首先,在特征提取阶段引入全局分组坐标注意力(GGCA)模块,结合全局上下文信息和局部特征,通过加权融合的方式减少无关点的影响,提升网络对关键目标区域的关注能力;其次,基于 PnP3D 重新构建网络架构,通过K近邻搜索与全局双线性正则化方法,对点云局部邻域特征与全局特征进行深度融合,增强网络对目标形状和位置的精细建模能力;最后,基于KITTI数据集进行了实验对比。实验结果表明,改进后的网络模型相比基准网络,在困难级别下行人和骑行者的检测精度分别提升了 1.83% 和 4.17% ,汽车的检测精度提升了 0.46% ,特别是在小目标的检测精度上,所提方法的性能得到显著提升。