IT之家 6 月 6 日消息,苹果公司宣布将参加本年度 IEEE / CVF 计算机视觉与模式识别会议(CVPR),现场展示其最新的计算机视觉研究成果,并进行多场技术演示。本次会议“有超过 20 位与苹果有关的研究人员”担任会议审稿人,这暗示苹果公司正积极加强与学术界在人工智能领域的深度融合。
IT之家获悉,今年的 CVPR 大会将于 6 月 11 日至 15 日在纳什维尔举行。苹果将在大会现场展示三篇最新发布的研究论文:
FastVLM:面向视觉语言模型的高效视觉编码器,该模型通过减少视觉标记数量,大幅提升了对高分辨率图像的实时理解效率;
Matrix3D:大型三维建模一体化方案,该统一模型即使在训练数据不完整的情况下,也能简化 3D 内容生成流程;
World-Consistent Video Diffusion with Explicit 3D Modeling,该模型通过显式三维建模提升 3D 一致性,在摄像机位置未知的情况下依然能够实现更准确的三维结构预测。
苹果表示,该公司将在以下时间段现场演示其 FastVLM 模型(IT之家注:下述时间已根据时差调整为北京时间):
6 月 13 日(周五):11:00-13:30、15:30-17:30
6 月 14 日(周六):11:00-13:30、15:30-17:30
6 月 15 日(周日):1100-13:30
公开信息显示,IEEE / CVF 计算机视觉与模式识别会议自 1983 年起举办,是计算机视觉领域最具影响力的国际会议之一,竞争异常激烈,口头报告录取率不足 5%。