IT之家 8 月 23 日消息,科技媒体 9to5Mac 今天发布博文,报道称苹果研究团队开源 SlowFast-LLaVA-1.5 长视频多模态大语言模型,在 1B、3B、7B 参数规模下,均刷新 LongVideoBench、MLVU 等 SOTA 基准纪录。
IT之家援引博文介绍,当前大语言模型在处理和理解视频方面,通用做法是在 AI 预训练中集成视频感知,但这种做法存在以下 3 重局限性:
现有现有模型往往严重依赖长上下文窗口,而处理时通常会遇到大量冗余帧,易超出上下文窗口限制,从而丢失信息。大多数训练需要复杂的多阶段训练管道(通常使用私有数据集),难以重现。许多模型仅针对视频任务优化,限制了在图像的理解,从而降低通用模型的实用性。
苹果公司针对上述 3 个局限性,首先研究推出了 SlowFast-LLaVA 开源模型,最大的亮点是创新双流(two-stream)设置,其中“慢流”选取少量高分辨率帧捕捉场景细节,“快流”选取更多低分辨率帧追踪运动变化。
苹果进一步在开源模型 SlowFast-LLaVA 模型上,通过微调图像模型,进一步增强视觉推理能力,再联合图像与视频训练,保留图像理解优势,推出了 SlowFast-LLaVA-1.5 版本。
在设计上,SF-LLaVA-1.5 将输入视频帧数固定为 128,其中快流 96 帧,慢流 32 帧,适配各种时长视频。这种方法虽可能漏掉关键帧或影响播放速度判断,但显著降低了计算和显存需求。研究团队指出,可通过引入内存优化技术(如随机反向传播)进一步改进,但需解决高显存占用问题。
测试显示,该模型在长视频基准 LongVideoBench、MLVU 上均取得新纪录,而且 1B 版本也能领先竞争对手。同时,它在知识问答、数学推理、OCR 等图像相关任务上表现出色,实现视频与图像的通用理解能力。
永久免费的crm网站她也感到,规则在向买家倾斜。不知道从什么时候开始,买家退款不再需要提供视频或照片,可以随便选择理由退货退款。有次收到货后,她发现鞋子不仅被装得一团糟,还有损坏。抱抱称,她尝试向平台小二申诉,打过不下40次电话,但每次都是机器人应答。当她最后一次试着联系曾负责这笔订单的小二,却发现是一个新人接听。得知原先的小二已经离职,她放弃申诉,事情不了了之。研究团队创新性地引入火震阵列分析方法,通过对23个信噪比较高的火震事件数据的分析,成功提取出穿过火星核的关键震相。实验结果表明,火星核具有分层结构,即外层为液态核,更深部则存在一个波速更高的固态内核。永久免费的crm网站姐姐让我戴上避孕套歌曲原唱为将蓝图落地为实景,省科技厅、发改委、工信厅三部门联合发布《安徽省科技成果转化中试基地建设指引》,以“施工图”式精准指导,划定中试基地建设“路线图”,明确围绕十大新兴产业和未来产业发展需求,支持建设一批通用性或行业性科技成果转化中试基地。罗俊称,这项技术处于国内领先、国际同步水平,是国内首家自主研发的自然声景疗愈系统,目前已应用于7家医院、2家康养社区、1家大型车企。
20251010 ? 永久免费的crm网站从社会层面来看,“三支一扶”岗位受到如此多高学历人才的青睐,反映出当前就业市场的严峻形势。一方面,体制内工作的稳定性和保障性吸引了大量求职者;另一方面,基层对于人才的需求和提供的发展机会也逐渐被大家所认识。男朋友隔着内裤蹭蹭会得妇科病吗而到了法网和温网,德约再次发挥稳定,打进半决赛。然而他两次被世界第1辛纳直落3盘横扫。在草地和红土上面对辛纳都1盘不得,显然目前的德约已经很难对现任世界第1有任何挑战。
? 任丽琼记者 曲彤升 摄
20251010 ? 永久免费的crm网站近日,根据我们的最新了解,Polestar极星汽车发布了今年上半年的最新财报,数据显示,今年上半年的营业收入为14.32亿美元,虽然同比增长了56.5%,但是亏损却相比上年扩大至119.4%,为11.93亿美元,毛利率为-49.4%。麻花星空天美mv免费观看电视剧SK海力士很早就确定在HBM4上选择台积电进行合作,可是先进制程节点的高成本可能让其HBM产品的定价高于三星。美光出于成本方面的考虑,HBM4仍然采用DRAM工艺生产基础裸片,到HBM4E才转换到台积电,不过这么做有可能让自身的产品性能受到影响。
? 赵宇宙记者 张建英 摄
? 从一个侧面可以看出云厂商目前的选择,他们依然一面在购买英伟达的GPU芯片,另一面持续推进内部自研AI芯片迭代,只是由于各自定位差异,以及相关芯片连接生态的成熟度等因素影响,而各自步伐有所不同。5566.gov.cn