尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
成色18k.8.35mb菠萝小贝林厄姆这样谈道:“这场比赛非常艰难,我必须这么说。对手真的很强——他们的表现非常出色。在这种气候条件下,他们可以为自己感到骄傲。这种天气对我们来说是全新的,我们还需要适应。这确实是一场非常艰难的比赛,但这场胜利对我们来说至关重要。”前几个月,王欣瑜的状态持续低迷,直到参加柏林站,似乎被打通了任督二脉,从资格赛打起,王欣瑜已经豪取一波5连胜,连赢吉布森、贾巴尔、卡萨金娜、高芙、巴多萨,尤其两盘横扫淘汰新科法网冠军高芙,赢得职业生涯最高光的一场胜利,也是首胜世界前二。成色18k.8.35mb菠萝《温柔的谎言》完整版日本的道路和停车场适合紧凑型汽车,消费者更在意燃油效率,而美国车一直没能解决车身尺寸大、燃油效率差和混动车型少的问题,再加上售价高、售后网点少,市场份额连年下降,福特在2016年宣布退出日本市场。回归日常,父亲们面临如何在繁忙工作与有效陪伴间找到平衡的挑战。时间是最大的挑战,但心理老师建议,可以利用碎片化时间,比如早上和孩子一起刷牙洗脸,晚上睡前讲个故事、听听音乐,5到10分钟即可,但要全身心陪伴,放下手机和工作。
20251223 ? 成色18k.8.35mb菠萝记者亦未能在南京大学的官方网站找到李江涛作为博士生的导师的信息。记者致电南京大学商学院,该院表示,李江涛并非该院博士生导师。45岁老阿姨喷了三次尿素乳膏一马东辉作为此次调整的核心人物,是理想技术基因的奠基人。从理想ONE到L系列、MEGA全系车型的研发交付,再到增程电动、高压纯电、智能空间、智能驾驶四大技术平台的搭建,均由其主导完成。这位1975年出生的“理工男大神”,拥有武汉理工大学动力工程学士、上海大学机械制造与自动化专业硕士学位,曾在简式国际汽车设计、阿尔特汽车、三一重工等企业积累了深厚的技术与管理经验。2015年加入理想后,他从总工程师起步,逐步成长为覆盖产品研发、采购供应、生产制造、质量安全的“大管家”,其主导的技术平台与产品矩阵,已成为理想冲击智能网联汽车时代的核心竞争力。
? 王玉平记者 王振 摄
20251223 ? 成色18k.8.35mb菠萝宝洁一直信奉的底层逻辑是 HBG,来自书籍《How Brands Grows》。宝洁认为,只要市场份额增加,消费者就会更倾向于选择品牌,所以大渗透打广告,大分销铺货架就是王道。《丫丫影院免费观看电视剧合法吗理论》“我们往往过高估计一年所能取得的成绩,而过低估计未来10年所能取得的成就。”刘进长表示,场景落地是未来推动人形机器人产业高速发展的关键点,但一定要沉下心来,不断攻克每一道难关,才能够使人形机器人真正越走越稳健、越走越有能力。
? 王运旺记者 张兵 摄
?? 卡西姆称,美国总统威胁攻击伊朗最高领袖哈梅内伊和攻击伊朗,这是对该地区所有人民的侵略。美国正引领该地区陷入混乱和不稳定,引领世界陷入公开的危机。《他的占有欲》李暮夕




