机器之心Pro的个人主页

最新

地平线首曝BPU「黎曼」架构，用数学流形重构AI计算

12月8日，在深圳举办的2025地平线技术生态大会上，地平线不仅交出了全场景智驾（HSD）的量产答卷，更通过全新的BPU「黎曼」架构、HSDTogether算法服务以及开源具身智能模型，试图为物理AI（Phy…

8分钟前 · 1阅读 · 0评论

谷歌TPU杀疯了，产能暴涨120%、性能4倍吊打，英伟达还坐得稳吗？

就连预言了2008年金融危机的《大空头》预言家迈克尔・伯里，也在2025年末斥资920万美元买入了针对英伟达的看跌期权，押注随着Meta和Oracle等超大规模数据中心运营商面临数据中心过剩和GPU库存贬值的…

9分钟前 · 0阅读 · 0评论

全图与切片并非等价？LLaVA-UHD-v3揭示差异推出高效全图建模方案

基于对全图编码与切片编码优劣的深入分析，LLaVA-UHDv3提出了结合两者优势的渐进式视觉压缩全图编码方案，在保证模型能力的前提下实现了显著的推理效率提升，并展现出良好的迁移与泛化能力，为MLLM的高精度原…

2小时前 · 1.9万阅读 · 0评论

Snapchat提出Canvas-to-Image：一张画布集成 ID、姿态与布局

值得注意的是，即便在数据中并不存在显式标注的「多模态组合控制」样本，模型在推理阶段仍然能够在统一画布中同时解析并整合多种控制信号：它会在身份参考的约束下保持人物外观一致性，在姿态骨架约束下生成结构合理的姿态，…

2小时前 · 459阅读 · 0评论

刚上市的摩尔线程，即将揭晓新一代GPU架构

为全方位赋能开发者与合作伙伴，大会设立超过20场技术分论坛，议题覆盖智能计算、图形计算、科学计算、AI基础设施（AIInfra）、端侧智能、具身智能、开发者工具与平台等关键领域，推动前沿技术与产业实践的深度融…

5小时前 · 560阅读 · 0评论

没了遥控器，还被扔进荒野，具身智能该「断奶」了

这也是为何ATEC会在垃圾分拣任务中选择玩具香蕉：软、可变形，但不会被机器人捏烂。这也是为什么自主浇花会难倒一溜儿机器人，因为任务链实在太长了——想在复杂场景中做这种高质量感知和控制，目前的算力和本体都还差了…

5小时前 · 572阅读 · 0评论

四款最新Amazon Nova 2 系列模型登场，多模态能力全面升级

Amazon Nova 2 系列推出四款新模型，全面支持文本、图像、音频和视频的多模态理解与生成。从高效的企业级推理、复杂的任务，到多语言的自然语音对话，Amazon Nova 2 为企业提供灵活可选的生成式 AI 引擎，加速应用开发和落地。

昨天18:48 · 41阅读 · 0评论

AAAI 2026 Oral | 手机传感器正在泄露隐私？PATN实时守护隐私安全

为应对实时防护和时间错位问题，PATN设计了两大核心技术：利用历史传感器数据的生成网络实现未来扰动的即时预测与施加，解决实时扰动生成；引入历史感知top-k优化策略，缓解扰动与攻击序列的时间错位。作者在两个移…

昨天18:44 · 81阅读 · 0评论

2025浦东国际人才港论坛-人工智能产业人才论坛成功举办

本次论坛以“青年聚力·智汇浦东”为主题，聚焦青年力量与创业动能，汇聚高校教授、青年科学家、青年创业先锋及产业领袖，通过产业推介、企业签约、圆桌对话、报告发布、展区互动等多种形式，旨在激发创新潜能，推动技术与产…

昨天18:32 · 1.1万阅读 · 0评论

斯坦福最火CS课：不让学生写代码，必须用AI

本周聚焦于AI开发环境：包括上下文管理与代码理解、为智能体撰写PRD，以及IDE的集成与扩展能力。本部分内容聚焦软件开发职业的未来方向，探讨AI驱动下正在兴起的新型编码范式，并分析行业发展趋势与未来预测，帮助…

昨天18:25 · 1781阅读 · 0评论

ICLR 2026还会好吗？300篇投稿50篇含幻觉，引用example.com竟也能过审

事情是这样的：AI生成内容检测平台GPTZero扫描了300篇投稿论文，发现其中有50篇在论文引用上至少包含一处明显的幻觉内容。GPTZero表示：「我们希望，在50篇ICLR投稿中识别出这50个幻觉，能向那…

昨天18:25 · 38阅读 · 0评论

AAAI 2026｜新突破：北大彭宇新团队提出可见光-红外终身行人重识别方法CKDA

针对这一问题，北京大学彭宇新教授团队提出了跨模态知识解耦与对齐的可见光-红外终身行人重识别方法CKDA，通过跨模态通用提示模块与单模态专用提示模块显式地解耦并净化不同模态通用与特定模态专用的鉴别性信息，从而避…

昨天16:23 · 60阅读 · 0评论

两个LLM互相对线，推理能力起飞：康奈尔团队发布大模型版类GAN训练法

为评估问题的难度，我们计算Solver在该问题上的准确率（6），并将Proposer的难度奖励定义为该准确率的反比（7）；同时，还会加入一个多样性奖励以鼓励生成新颖的问题（8）。在冷启动之后，我们使用GRPO…

昨天16:13 · 20阅读 · 0评论

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

团队提出了一套全新的、检测情感动态轨迹的评估框架（简称ETrajEval），用于更加科学、系统地评估大语言模型在长期对话中提供情感支持的能力。为了更直观地理解本文提出的评估框架，团队针对三种情绪干扰程度（0、…

昨天16:05 · 43阅读 · 0评论

从分钟级等待到20倍超速：LightX2V重写AI视频生成速度上限

LightX2V背后并不是单一模型的优化，而是一整套面向低成本、强实时视频生成的推理技术栈：从步数蒸馏与轻量VAE，到低比特算子、稀疏算子、多卡并行与分级Offloading，目标只有一个——在主流硬件上，把…

昨天14:03 · 85阅读 · 0评论

DeepSeek V3到V3.2的进化之路，一文看全

）我也猜想，虽然DeepSeek团队开发了具有推理能力的V3.1和V3.2，但他们可能仍在开发专门的R2模型。」对于证明验证器模型，他们从DeepSeekV3.2-Exp-SFT开始，这是他们基于DeepSe…

昨天14:03 · 50阅读 · 0评论

全球引才：Faster R-CNN、ResNet作者，中国科大任少卿，招募教授、学者和学生

2025年9月加入中国科学技术大学担任二级教授、讲席教授。任少卿教授在深度学习、计算机视觉及智能驾驶等领域做出了基础性、开创性贡献，其研究成果已成为驱动自动驾驶、工业检测、医疗影像、安防监控、卫星遥感等国计民…

4天前 · 110阅读 · 0评论

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

openPangu-R-72B通过后训练阶段进行长链难题合成、非索引信息处理、快慢思考融合三大策略，显著提升了模型DeepSearch能力。此次SuperCLUEDeepSearch评测登顶，不仅是openP…

4天前 · 89阅读 · 0评论

智能体研究上火箭了！云科技一哥宣布，Agentic AI加速演进

亚马逊云科技一年一度的re:Invent大会上，全世界都见证了云计算一哥——亚马逊云科技，一个又一个重量级新发布，大部分都是面向Agentic AI的，AI Agent 的时代正式来了！

4天前 · 122阅读 · 0评论

字节前技术负责人创业，联手清华姚班校友，编程智能体世界登顶

传统基于向量相似度的RAG（Retrieval-AugmentedGeneration）机制，往往只会检索到包含「search」关键词的注释或变量，这套机制在中小规模仓库上或许能够定位到问题位置，但在大型工程…

4天前 · 1.1万阅读 · 0评论

机器之心Pro

7110.3万+

阅读

1万

内容

732

订阅

127

获赞

+订阅

科技领域优质创作者

未来在这里发声注册信息

活动勋章

中山佳能工厂员工：这一天还是来了，赔偿没有网传夸张

寒潮即将影响我国中东部气温冲高回落大范围雨雪将至

黄种人的骄傲！36岁苏炳添宣布退役：9秒83证明一切皆有可能

特朗普宣布：允许英伟达向中国出售H200芯片

俄罗斯版《疯狂动物城2》上映引发热议，画面比正版小一圈，网友戏称：正版到不了的地方，迪士尼律师函也到不了

日本又发生6.6级地震！此前发生7.6级强震，后续或有更大地震！核污染水排海已暂停，中国大使馆紧急提醒

支付中心 - 搜狐招聘 - 广告服务 - 联系方式 - About SOHU - 公司介绍 - 隐私政策

Copyright © 2025 Sohu All Rights Reserved. 搜狐公司版权所有