江苏省技术产权交易市场

基于多模态信息的目标追踪一体化模型
  • 通信系统设备制造
2883人浏览  | 交易次数:0次
商品编号
53566299103569944646
商品权属
自有
交易方式
合作开发
商品价格
面议
关键词
Transformer结构 多/维单纯形结构 多模态目标追踪 强化学习模型 拓扑学 持续同调性图 极坐标形式

店铺信息

苏州苏大技术转移中心有限公司
电话 159xxxx3939
商品摘要
商品详情
详细参数
其他附件
商品评价
多模态目标追踪是多模态任务中的一项关键技术,也是很多相关下游任务的“指挥棒”,目的是根据目标的指示信息(视频第一帧目标的标签)在视频流中持续追踪目标(逐帧输出追踪结果)。其中,目标的指示信息可以以一种或多种模态的形式提供,例如目标的语言描述、边界框图片、掩膜图片等等。追踪模型会拆解提示信息并抽象出目标的高层次特征,与视频帧中的背景区域或干扰物体进行比对,从而找到对应的目标并输出跟踪结果。追踪模型还需要时刻关注目标在视频中的变化,包括位置移动、动作变形等等,及时更新目标的特征,最终完成整个视频流的目标跟踪任务。
目前,多主流的多模态目标追踪模型的通用性却不高,主要表现为单个模型只能应对某个特定模态的指示信息,当要处理涉及不同模态信息的场景时,需要使用多个模型才能完成任务,且无法处理多种模态信息共存的情况。
本项科技成果着眼于多模态目标追踪的统一框架,该框架立足于两个层面的统一:其一为上层结构(输入输出)的统一,包括对不同模态输入(语言模态、图片模态)的统一建模方式,以及对不同精度追踪结果(位置点、边界框、掩模图)的统一输出方式;其二为内部模块的统一,包括对不同模态特征的统一优化方式,以及对不同模态信息重点区域的统一预测方式。
AI猜你喜欢
换一批

Hi,我是江苏省技术产权交易市场成果转化AI技术经理人!

试试对话AI技术经理人

  • 该成果有哪些相似的成果?
  • 该成果可能有哪些需求方?
  • 该成果可能的应用领域?