新闻
体育
汽车
房产
旅游
教育
时尚
科技
财经
娱乐
母婴
更多
icon_Unfold
健康
历史
军事
美食
文化
星座
专题
游戏
搞笑
动漫
宠物
登录
无障碍
最新
时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」
基准测试表明,MistralMedium3在软件开发任务中表现出色。LeChatEnterprise提供了AI「智能体」构建器等工具,并将Mistral的模型与Gmail、GoogleDrive和ShareP…
46分钟前
·
1阅读
·
0评论
加载中
ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码,多项任务远超RoPE
但从上面的分析可以看出,整个模型中的线性层、激活函数和时域截断也都会对长度外推产生影响,并且是不利影响(也就是上文提到的频谱损坏)。考虑到线性层和激活函数可以带来更强的表征能力,时域截断又是受到硬件限制无法改…
46分钟前
·
11阅读
·
0评论
加载中
2025年第二届「兴智杯」全国人工智能创新应用大赛正式启动,线上报名开启
为进一步发挥“以赛促研、以赛促用、以赛育人”的作用,今年,第二届兴智杯大赛如约而至,由中国信息通信研究院、深圳市人工智能产业办公室、深圳市前海深港现代服务业合作区管理局、深圳市宝安区人民政府主办,旨在聚焦技术…
47分钟前
·
8阅读
·
0评论
加载中
原来,AI也有「搜商」高低的差别?
简单来说,深度搜索在深度思考的基础上强化了AI的思考能力,让AI真正拥有了「高搜商」,AI能像人一样先主动理解、思考、拆解问题,再分点推理并规划搜索思路和步骤,给出结构清晰、内容可信、可直接执行的解决方案。他…
49分钟前
·
4阅读
·
0评论
加载中
01:17
用上了AI,多邻国更好还是更废?网友:先卸为敬
Duolingo多邻国宣布全面转向 AI-first 战略,但用户并不买账,有人吐槽“AI翻译毫无语感”,甚至直接卸载App。小绿鸟究竟是在提效,还是在自毁?
2小时前
·
156阅读
·
0评论
加载中
绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世
在本项研究中,研究团队全面评估了AbsoluteZeroReasoner(AZR)在多项推理任务中的表现,涵盖代码生成与数学推理两个关键领域,并与多个基于专家数据训练的推理模型进行了对比。团队进一步构建并验证…
4小时前
·
20阅读
·
0评论
加载中
01:33
AI编程榜被屠,Gemini 2.5 Pro升级实测,摸鱼神器,一键生成!
Gemini 2.5 Pro更新,据说编程能力大幅提升,在 LMArena 编程排行榜、 WebDev Arena 排行榜都名列第一,效果到底怎么样呢?对此我们进行了实测,快来看看吧!
昨天21:44
·
73阅读
·
0评论
加载中
视频生成模型无损加速两倍,秘诀是「抓住attention时空稀疏性」
分别使用Spatial和Temporal两种稀疏模式计算其注意力结果,并与DenseAttention对比误差;实验结果表明,经过布局转换后,SparseVideoGen在TemporalHead上实现了接近…
昨天17:38
·
28阅读
·
0评论
加载中
北大、清华、UvA、CMU等联合发布:大模型逻辑推理能力最新综述
为推进大语言模型的逻辑推理能力研究,来自北大、清华、阿姆斯特丹大学(UvA)、卡内基梅隆大学(CMU)、MBZUAI等5所高校的研究人员全面调研了该领域最前沿的研究方法和评测基准,联合发布了调研综述《Empo…
昨天17:27
·
570阅读
·
0评论
加载中
万字长文带你读懂强化学习,去中心化强化学习又能否实现?
现在,我们已经了解了监督微调(SFT)以及PPO和GRPO之间的区别,可以更清晰地看到DeepSeek的R1-Zero训练过程实际上是多么简单。DeepSeek不仅通过GRPO验证了纯强化学习的价值,更揭示了…
昨天14:44
·
841阅读
·
0评论
加载中
OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
我们是第一个i)关注大模型工具使用行为优化的RL算法;ii)发现并量化认知卸载现象,且模型越大,认知卸载越严重,即模型过于依赖外部工具而不自己思考;iii)提出工具生产力概念,兼顾收益与成本;我们提出OTC-…
昨天14:16
·
19阅读
·
0评论
加载中
搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核
使用这种方法,轨迹的长度在几次传递后很容易达到5-10万个token,这会导致训练不便;样本效率低下和credit分配问题:即使我们生成了多个内核,仍然只为整个轨迹分配一个奖励。为了比较这两种方法,作者使用6…
昨天14:13
·
16阅读
·
0评论
加载中
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
VPP利用了大量互联网视频数据进行训练,直接学习人类动作,极大减轻了对于高质量机器人真机数据的依赖,且可在不同人形机器人本体之间自如切换,这有望大大加速人形机器人的商业化落地。VPP将视频扩散模型的泛化能力转…
昨天14:11
·
265阅读
·
1评论
加载中
ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍
激活策略:由于查找表检索在推理时无需额外计算,MoLE无需依赖稀疏激活来控制推理计算量,因此在训练中选择激活所有路由专家。如表所示,在推理阶段,MoLE的计算过程中仅保留了共享专家模块,因此只有共享专家被激活…
昨天10:48
·
1479阅读
·
0评论
加载中
刚刚,Gemini 2.5 Pro升级,成编程模型新王
可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini2.5Pro(I/Oedition)就创建出了一个功能完备的Web应用。网友@thenomadevel让Gemini2.5ProPre…
昨天10:15
·
93阅读
·
0评论
加载中
00:56
家政机器人上线,陌生环境秒懂指令,网友:哪里卖?
机器人新模型π-0.5,可以让机器人清理从来没见过的家居环境,铺床、收拾脏衣物、收拾碗筷、擦除污渍……π-0.5通通都会,感觉让机器人养老越来越近了。
前天18:21
·
188阅读
·
0评论
加载中
微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」
在实际任务执行中,UFO²可以智能地根据操作环境与任务特性,自动判断是否优先使用API执行来提高速度与精准度,或者在API不足以完成任务时,灵活转向GUI操作,从而实现效率与通用性的最佳平衡,显著提升任务稳定…
前天16:31
·
714阅读
·
0评论
加载中
公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
通过这一最终的预训练阶段,LN-Ultra不仅实现了与基准模型Llama3.1-405B-Instruct相当的性能,还在多个关键基准测试上取得超越,验证了即使进行激进的架构优化,也可通过短周期的蒸馏与预训练…
前天16:30
·
306阅读
·
0评论
加载中
VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika
通过这一方法,以单机的训练成本训练出了一套在细粒度表达、人类偏好一致性等方面均表现卓越的视频细粒度描述模型,为后续视频生成模型的训练和优化打下了坚实基础,模型细节如下(更多详情可参考论文和开源github):…
前天14:02
·
185阅读
·
0评论
加载中
ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
当我们谈论大型语言模型的理解能力时,通常将其知识分为两类:参数知识(存储在模型权重中的事实和信息)和上下文知识(从当前输入文本中获取的信息)。研究发现,专门处理极大值的量化方法(如AWQ和SmoothQuan…
前天14:04
·
57阅读
·
0评论
加载中
机器之心Pro
6655.5万+
阅读
8673
内容
544
订阅
108
获赞
科技领域优质创作者
未来在这里发声
注册信息
分享作者至
活动勋章
24小时热文
更多
副市长仇珂静,主动交代问题!五一节前还参加视频会议
首批加征145%关税货物抵美,美国港口一片冷清!商品贵了,特朗普喊话:少买点!可以暂时不用交关税,这种操作大火……
发射导弹 击落战机 关闭机场 一夜之间印巴大打出手
SGA轰34+8约基奇6犯毕业 雷霆狂胜掘金总分1-1
网友称朋友在银行买到“掺假金条”,涉事银行:正核实
菲35号护卫艇企图侵闯中国黄岩岛领海 南部战区回应
支付中心
- 搜狐招聘
- 广告服务
- 联系方式
- About SOHU
- 公司介绍
- 隐私政策
Copyright © 2025 Sohu All Rights Reserved. 搜狐公司 版权所有
邮箱账号登录
忘记密码
请输入正确的登录账号或密码
手机号验证码登录
获取验证码
我已阅读并同意搜狐网
用户服务协议
和
隐私政策
需阅读并勾选同意
其他方式
微信登录
qq登录
微博登录
账号密码登录
手机号验证码登录
安全提示
为保证您的账户安全,建议您绑定手机号码
请输入正确的登录账号或密码
获取动态码
收不到短信验证码?点击获取
语音验证码
安全提示
系统出于安全考虑,在点击“发送语音验证码”后,您将会收到一条来自950开头号码的语音验证码,请注意接听。
暂不发送
发送语音验证码
手机注册
邮箱注册
获取验证码
同意
《搜狐服务协议》
使用已有账号登录