Meta 开源计算机视觉基础模型 DINOv2

文章

往日文章往日投票
皮肤

蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

消息

本文已被查看 575 次

Meta 开源计算机视觉基础模型 DINOv2

Wilson (42865)发表于 2023年05月24日 18时23分星期三
来自先知

Meta 开源了它的计算机视觉基础模型 DINOv2，源代码托管在 GitHub 上，和 Meta 近期开源的其它 AI 模型一样，采用的是非商用的 CC-BY-NC 4.0 许可证。DINOv2 是基于 Vision Transformer (ViT)架构，使用一个包含 1.42 亿幅图像的精选数据集进行预训练，可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta 称 DINOv2 模型的速度是旧方法的两倍，使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。

https://ai.facebook.com/blog/dino-v2-computer-vision-self-supervised-learning/
https://github.com/facebookresearch/dinov2

大胆的假设，小心的求证；认真的做事，严肃的做人。 --胡适

本站提到的所有注册商标属于他们各自的所有人所有，评论属于其发表者所有，其余内容版权属于 solidot.org(2009-) 所有。

京ICP证161336号京ICP备15039648号-15 北京市公安局海淀分局备案号：11010802021500

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：[email protected]　网上有害信息举报专区：https://www.12377.cn