Meta 发布了新一代的视频和图像分割模型 SAM 2(Segment Anything Model 2),比起第一代的图像分割模型,SAM 2是一种统一模型,可以在图像和视频中实现实时提示对象分割,并达到最先进的性能。Meta 将以 Apache 2.0 许可证共享代码和模型权重文件,同时还将共享SA-V 数据集,该数据集包括约 51,000 个现实世界视频和超过 600,000 个掩码(时空掩码 spatio-temporal masks)。
SAM 2 可以分割任何视频或图像中的任何对象,即使是之前从未见过的对象和视觉领域的任何内容,从而无需自己训练和适配即可用于多种用途。
从应用场景来说,SAM 2 的输出可以与生成视频模型一起使用,可以创建新的视频效果从而产生新的创意应用;SAM 2 还可以帮助更快的标注工视觉数据。
详细介绍:https://t.co/QuwuGTLG4J
中文译文:https://t.co/EQFEAlOLv4