token - AI有智慧

原作者带队，LSTM卷土重来之Vision-LSTM出世

AI智慧秀 原作者带队，LSTM卷土重来之Vision-LSTM出世

与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比，ViL 的性能更胜一筹。

DeepMind升级Transformer，前向通过FLOPs最多可降一半

AI智慧秀 DeepMind升级Transformer，前向通过FLOPs最多可降一半

引入混合深度，DeepMind 新设计可大幅提升 Transformer 效率。

CVPR 2024 | 让视频姿态Transformer变得飞速

AI智慧秀 CVPR 2024 | 让视频姿态Transformer变得飞速

目前，Video Pose Transformer（VPT）在基于视频的三维人体姿态估计领域取得了最领先的性能。