情综合婷婷色五月蜜桃

EN
www.dcsz.com.cn

9.1免费视频免费版ICCV 2025 HERMES:首个统一3D场景理解与生成的世界模型

本文第一作者周鑫、共同第一作者梁定康,均为华中科技大学博士生,导师为白翔教授。合作者包括华中科技大学涂思凡,旷视科技丁宜康,迈驰智行陈习武、谭飞杨,香港大学赵恒爽助理教授。 在复杂的城市场景中,HERMES 不仅能准确预测未来三秒的车辆与环境动态(如红圈中标注的货车),还能对当前场景进行深度理解和问答(如准确识别出 “星巴克” 并描述路况)。 近年来,自动驾驶技术取得了令人瞩目的进展。要让智能汽车安全高效地行驶在复杂的真实道路上,车辆必须具备两大核心能力:对当前环境的深刻理解(例如识别交通参与者、理解交通规则、推理场景语义)以及对未来场景的准确预测(如预测行人、车辆的运动,提前规避风险)。 世界模型(Driving World Model, DWM)侧重于未来场景的生成与预测,但缺乏对当前环境的细致语义理解,难以回答 “现在是什么情况?”、“驾驶员该如何决策?” 等问题。大语言模型(LLM)及视觉 - 语言模型(VLM)则在场景理解、问答和描述方面表现优异,但通常只能 “看懂”,却难以 “想象” 未来场景的演化。 然而,现实中的自动驾驶决策,恰恰需要这两种能力的深度融合。例如,车辆不仅要能描述 “前方有行人正在通过斑马线”,还要能预测 “3 秒后这位行人将到达路中央,需提前减速”。 其次,如何在一个模型内,让 “理解” 和 “生成” 这两个看似独立的任务能够相互促进,而非相互干扰?如何将强大的世界知识与前瞻性的场景预测无缝集成到一个统一的框架中,成为亟需突破的难点。 HERMES 采用 Bird’s-Eye View(BEV,鸟瞰图)作为统一的场景表达。它首先通过一个 BEV Tokenizer 将六路环视图像高效地编码并投影到一个紧凑的俯视视角表征中。这种做法不仅有效解决了 LLM 输入长度的限制,更重要的是保留了多视图图像之间的精确空间几何关系和丰富的语义细节。无论后续任务是理解还是生成,模型都能在同一套高质量的 BEV 特征空间中自由切换,为后续的统一处理奠定了坚实基础。 为了打破理解与生成之间的壁垒,HERMES 引入了世界查询(World Queries)机制。这是一组从 BEV 特征中通过自适应采样(如最大池化)提取出的、代表场景核心信息的可学习 Token。其工作流程如下: 1.知识注入:将 BEV 特征通过自适应采样(如最大池化)转化为一组表达世界知识的查询向量,再把世界查询与 BEV 特征、用户文本指令一同被送入 LLM。在 LLM 处理语言理解任务(如回答问题)的过程中,世界查询通过因果注意力机制(causal attention)吸收和编码了对于当前场景的丰富世界知识和上下文信息。 2.知识传递:经过 LLM 处理后,这些富含知识的世界查询被一个 “当前 - 未来” 连接模块(Current to Future Link)所使用。该模块通过交叉注意力将世界查询中蕴含的 “理解” 成果,有效地注入到对未来场景的预测中,引导模型生成未来多帧的 BEV 特征。 3.统一输出:最终,一个共享的渲染器(Shared Render)将当前和未来的 BEV 特征解码为 3D 点云序列,同时完成对当前场景的理解和对未来场景的生成。 在未来生成任务上,Chamfer Distance 显著优于 ViDAR,3 秒未来点云误差降低 32.4%,仅用当前帧即可实现更高精度的未来预测。与同类模型相比,HERMES 无需历史序列,推理更高效,泛化能力更强。在场景描述、视觉问答等理解任务上,HERMES 在 CIDEr、METEOR、ROUGE 等主流自然语言生成指标上超越了 OmniDrive 等理解专用模型,CIDEr 提升 8%。HERMES 与 “分离式理解 + 生成” 模型(即简单共享特征,但理解和生成模块独立)对比,生成精度提升显著,理解能力无损,充分验证了统一建模的有效性与优越性。 HERMES 不仅能够生成时序连贯且几何精确的未来点云,还能对驾驶场景的细节进行精准描述。无论是预测动态物体的移动,还是识别路边的商家,HERMES 都展现出强大的综合能力。更多可视化结果请访问项目主页。 HERMES 为自动驾驶世界模型提供了一个简洁、有效且统一的新范式。它通过利用 BEV 表征和世界查询,成功弥合了 3D 场景理解与未来生成之间的鸿沟,为开发更智能、更可靠的自动驾驶系统迈出了坚实的一步。

9.1免费视频免费版
9.1免费视频免费版对于那些有志于通过“三支一扶”实现自己职业理想的高学历人才来说,他们需要做好充分的准备,不仅要有扎实的知识和技能,还要有应对挑战的勇气和决心。同时,社会也应该给予他们更多的支持和鼓励,让他们在基层这片广阔的天地中绽放光彩。无论是今年4月官方为智能驾驶按下“急停键”,还是7月通过第三方测试提醒公众辅助驾驶并非完美,都反映出监管正在努力跟上创新的步伐。在这种“先探索,后规范”的模式下,消费者自身的清醒和判断就显得尤为重要,需要理性看待技术创新,将安全置于尝鲜之上。9.1免费视频免费版少女国产免费观看高清电视剧大全职业生涯中,阿卡首次在硬地比赛中击败德约(此前战绩为0胜3负)。同时,他也结束了对德约的2连败。目前,阿卡和德约共交手9次,阿卡4胜5负,稍稍落后。“第二场比赛间隔两天且需要移动,这也是为了模拟世界杯,在苛刻的环境下进行两场比赛。我们计划最大限度地轮换阵容,因此会根据第一场比赛的情况和球员的状态,大幅调整阵容。”
20251017 ? 9.1免费视频免费版这样的场景,不禁让人发问:这体面吗?说实话,老教师那撕破脸的样子,确实在众人眼中显得那么不和谐,与她平日里温文尔雅的形象形成了巨大的反差。jmcomic官网入口安卓下载知情人士透露,欧盟监管机构将接受微软承诺,将 Teams 从 Office 套件中拆分出来。这些人士指出,在市场测试中,竞争对手和客户没有提出重大反对意见。
9.1免费视频免费版
? 张胜利记者 孙兰田 摄
20251017 ? 9.1免费视频免费版近日,美中航空遗产基金会主席杰弗里·格林向记者回忆了二战期间飞虎队的故事。他表示,80年前,面对敌人,美中两国人民携手并肩、共同奋战。这段历史告诉我们,只要团结协作、同心合力,就一定能够战胜艰难险阻、赢得最终胜利。他说,历史是最好的教科书。中国人民抗日战争暨世界反法西斯战争胜利80周年纪念活动提醒人们铭记历史,因此意义深远。他也对未来美中两国的合作充满信心。《在床上怎么做才能让男人荷尔蒙提高》“不可能有梅西的接班人,肯定不会有。可能会有一些伟大的球员在这个时代留下印记,但他这么长时间以来所做的一切,我认为是无法复制的。足球界发生过很多不可思议的事情,但在这一点上我几乎可以肯定地说,不会再有像他这样的球员了。至少以我所见来看,我认为梅西是无与伦比的。”
9.1免费视频免费版
? 曹小九记者 宫晓秋 摄
? 是的,是的,绝对是的,我很高兴。是的,我想我尽力为我的球队创造了尽可能多的机会。我知道这是一场什么样的比赛。我觉得这种比赛你必须拿球,并且拥有那种无所畏惧的心态,就是“好的,酷”。是的,有11名球员在30米的空间里,所以你真正能进球的唯一方法就是你比某个人踢得更好,或者你像里斯-詹姆斯制造的第二个进球那样,用传中制造一个真正的精彩瞬间。所以我觉得作为一个整体,那确实是我们努力在做的,就是在场上表现得很敏锐,保持好防守,然后努力去创造机会,把对手甩开,我想我们在某些阶段做得很好。《weyvv国产的suv视频》
扫一扫在手机打开当前页