摘 要:由于图像数据的爆炸式增长,使得图像压缩算法得到蓬勃发展与广泛应用。系统综述了自2018年以来基于深度学习的图像压缩算法研究工作;首先,对比传统算法,阐述了深度学习算法的优势;其次,基于图像压缩算法经典框架,从编解码器优化和熵模型优化两方面对国内外研究方法进行对比和讨论。研究发现,编解码器能优化提升算法的特征提取与图像重建能力,熵模型优化则致力于提升压缩效率和降低算法复杂度。最后,分析了图像
摘 要:针对传统的鼠洞、秃斑检测方法速度慢、过程烦琐等问题,提出了一种基于改进YOLOv7的鼠洞、秃斑检测模型。首先,在YOLOv7的主干网络中引入BiFormer注意力机制;其次,引入CARAFE算子作为上采样算法;最后,将MPDIoU代替原模型的CIoU损失函数。实验结果表明,改进模型的准确率、召回率、平均精度均值分别达到了91.6%、86.0%和90.9%,较原YOLOv7模型分别提升了4.
摘 要:为实现拔节期玉米土壤水分的有效估测,基于无人机(UAV)多光谱数据构建了三分支深度学习回归模型LN_Net。通过灰度板校正、图像裁剪与配准等预处理手段,对可见光与多光谱波段进行融合,构建了具有8个通道的复合图像数据集。并借鉴RepViT模型轻量化的思路,设计了多分支特征提取与融合结构,在可见光和红边、近红外波段独立提取光谱信息,并通过多层感知机(MLP)进行特征整合。多分支结构模型性能较单
摘 要:随着网络视频数量呈指数级增长,视频版权等问题愈发严重。相关的科研领域也诞生了许多方法用于解决近似重复视频检索和部分重复视频检测等问题。以往的方法通常是先提取帧级特征再进行时间对齐,这会导致时序信息的丢失以及性能浪费。为此提出将镜头分割技术引入部分重复视频检测方法,保留镜头内的时序信息,并省去了时间对齐步骤。通过在VCDB数据集上的测试,全面地分析了各项参数对方法性能的影响。与传统方法对比,
摘 要:针对社交媒体上虚假信息传播能力影响因素不明确的问题,提出了一种结合LDA的主题建模和模糊集定性比较分析(fsQCA)的潜在狄利克雷分配研究方法。一方面,运用LDA技术构建微博用户评论的主题分析图谱,提取出6个关键主题。另一方面,基于刺激-有机体-反应(S-O-R)框架,以6个主题为条件变量,以传播能力为结果变量进行了fsQCA分析,探究影响虚假信息传播能力的组态路径。实验结果表明,单一主题
摘 要:针对表格单元格检测与结构重建中的优化问题,提出了一种名为CellAligner的表格结构识别算法。与现有方法主要依赖表格内文本特征不同,CellAligner通过集成TabHTMLizer算法,有效解决了表格坐标解析、检测误差修正、跨行跨列单元格处理等关键问题,从而显著提升了表格结构恢复的精度。实验结果表明,CellAligner在表格结构识别任务中提升了树编辑距离相似度(TEDS)值达3
摘 要:针对矢量网络分析仪(VNA)操作场景中动作识别率低的问题,提出一种手部交互物体引导的矢量网络分析仪操作动作识别方法。利用人体手部骨架序列提取手部姿态时空特征,针对手部相似动作难以通过姿态特征区分的问题,凭借隐含位置关系的YOLOv8网络提取手部交互物体特征,对得到的手部姿态时空特征和交互物体特征进行融合,使用极限学习机(ELM)算法得到动作识别结果。实验结果表明,所提方法对9种典型矢量网络
摘 要:针对旋转机械多工况下,振动子序列起始点位置(初相位)不同导致序列无法准确对齐的问题,提出了一种基于改进变分模态提取的振动子序列对齐方法。使用短时傅里叶变换确定初始中心频率,通过映射关系计算惩罚因子,使得变分模态提取可以自适应地获取不同工况下振动子序列中的所需模态。对所需模态进行曲线拟合计算出初相位值,并根据相位差对序列进行裁剪,实现序列对齐。实验结果表明,该方法对齐后序列之间的动态时间扭曲
摘 要:针对实时语义分割中高精度与低延迟难以兼顾的问题,提出双分支多尺度特征复用网络(TMMNet)。该网络采用语义分支与细节分支协同设计,分别提取深层语义与边缘细节信息,并通过多尺度信息提取融合模块(MEF)与多尺度信息融合还原模块(MFR)实现跨尺度特征的高效整合。在Cityscapes和Camvid数据集上的实验结果表明,TMMNet的MIoU分别为74.9%和67.8%,同时推理速度高达9
摘 要:为解决物流寄递地址准确性问题,提出了一种基于编辑距离的物流地址相似度检测方法。通过引入预定义关键词集合对地址文本进行层级分割,结合最小编辑距离算法计算地址相似度,并为不同地址层级分配权重,实现了对相近地址的精准匹配,有效处理了方言、非标准格式地址及新地名等情况。实验结果表明,与传统算法相比,该方法在相似度准确率、查准率、召回率及运行耗时方面均显著提升,相似度准确率达92.39%,查准率提升
摘 要:物联网(IoT)Web管理系统中,不同应用场景对数据的时效性要求存在显著差异,而现有单一通信方案难以同时满足低延迟交互和资源优化的需求。针对这一问题,提出了一种基于HTTP轮询、服务器推送事件(SSE)和WebSocket的混合通信架构。该架构根据业务对时效性的不同要求,动态选择最适合的实时通信方式,综合考虑时效等关联因素,有效解决了IoTWeb管理系统中的差异化通信需求,为大规模IoT设
摘 要:针对现有人脸反欺诈方法在面对未知欺诈类型时泛化能力不足的问题,提出VISTA(Vision-IntegratedSemanticTextAlignment)模型。通过多模态语义对齐,融合视觉和语言模态,采用对比学习和文本监督调制,在共享嵌入空间区分真伪人脸。跨域数据集上的实验结果显示VISTA的半总错误率HTER最低降至3.36%,曲线下面积AUC最高达99.44%,优于传统方法和其他深度
摘 要:为解决现有日志解析方法中有效词丢失和异常检测忽略关键信息以及无法充分利用日志中隐藏的依赖关系问题,提出了一种基于Bi-LSTM-CNN的异常日志检测方法BCNLog。该方法通过分词长度限制保留有效词,利用双向编码器表示来自变压器(BERT)(BidirectionalEncoderRepresentationsfromTransformers)提取模板语义,并通过词频-逆文档频率(TF-I
摘 要:针对传统模糊测试难以全面覆盖黑盒条件下的智能家居低功耗蓝牙(BLE)协议行为的问题,提出了一种基于有限状态机引导的蓝牙协议模糊测试方法。该方法对蓝牙协议的多层结构进行跨层联合状态建模,通过主动学习推导目标设备的协议状态机模型,生成更高效、更全面的测试用例。同时,基于此方法设计实现原型系统FSMBLEFuzzer。测试结果表明,FSMBLEFuzzer在生成的状态数、模糊测试轮数、查询次数、