TAPIR:使用每帧初始化和时间细化跟踪任何点

该论文提出了一种新颖的模型,名为TAP,可以在视频序列中有效地跟踪任何查询点在任何物理表面上的位置。该模型采用两个阶段:匹配阶段和细化阶段。该模型在TAP-Vid基准测试中表现优异,平均Jaccard(AJ)的改进幅度约为20%。该模型可以快速推断长时间高分辨率的视频序列。源代码、预训练模型和可视化结果可以在项目网页上找到。

d1b68ae62c214f87a50f5cbf9eead2b0_2076989541495611392

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun235183.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2023年6月20日 下午9:39
下一篇 2023年6月20日

相关推荐