Artificial Intelligence (A.I.)
  • CAMEL-AI 的 OWL:复刻 Manus 通用智能体,完全开源!

     CAMEL-AI 的🦉OWL项目看完Manus视频,集体摊手:就这?0天复刻走起! Manus还在闭门造车,OWL 已经和全球开发者一起开源狂飙了,我们 🦉OWL 项目直接做到开源界 GAIA 性能天花板,达到了57.7%,超越 Huggingface 提出的 Open Deep Research 55.15%的表现。 🔗项目地址:GitHub:https://github.com/camel-ai/owl… Read More

  • Manus.im:Monica.im 推出的全球首款通用型 AI Agent

    Manus是什么 Manus 是中国团队推出的全球首款通用型 AI Agent。Manus能独立思考、规划和执行复杂任务,直接交付完整成果。与传统 AI 不同,Manus 拥有强大的工具调用能力,能自主完成从任务规划到执行的全流程,如文件处理、数据分析、代码编写、内容创作等。Manus在 GAIA 基准测试中表现优异,远超OpenAI的Deep Search。Manus 的设计理念是“知行合一”,基于智能化手段扩展人类能力,成为人类的智能伙伴。目前,Manus 仍处于内测阶段,需要使用邀请码登录使用。 Manus的主要功能 Manus的官网地址… Read More

  • DeepSeek-R2真的要来了,这次不是 KFCVWO50!

    来自路透社的独家报道: – DeepSeek原计划在5月初发布新一代R2模型,但已经开始考虑提前发布,这段时间Grok 3、Claude 3.7、Qwen 2.5-Max等竞品接连推出,还是有影响的; – 梁文锋在距离清华、北大两所高校步行可达的地段设立了北京办公室,非常乐于和实习生以及应届生一起工作和讨论问题,而且从不鼓励加班; – 采访中一名已经离职的研究员依然对前老板赞不绝口,「他把我们视为专家,不断提问,一起学习,而且愿意下放管理权,普通员工也能参与核心技术,这很让人兴奋」; – 梁文锋在幻方量化时就以薪酬慷慨著称,他会给数据科学家开出150万的年薪,而同行给的数字一般不会超过80万; – 在创办DeepSeek前,幻方量化就制定了把70%对可支配收入投入到AI研究上的战略,从2020年到2021年,幻方量化花了12亿买卡训练模型; –… Read More

  • 三项未入选 2025 年十大突破性技术榜单的技术:虚拟发电厂、AI 代理与 eVTOL

    2025 年版榜单将于 1 月发布。以下是不会出现在该榜单上的技术。 下个月,《麻省理工科技评论》(MIT Technology Review)将公布 2025 年十大突破性技术榜单。每年,我们的新闻编辑室都会在我们所涵盖的各个领域中寻找那些真正迎来突破时刻的技术。这个年度专题会突出展示我们认为目前最为重要的技术。 我们从几个方面来定义 “突破”—— 也许是有了一项科学进展,使得一项新技术成为可能;或者是一家公司获得了一项关键医疗疗法的监管批准;又或许是一款消费设备的采用率达到了临界点,或者一项工业技术出色地通过了关键的试点阶段。在 1 月份发布的 2025… Read More

  • OpenAI 发布 GPT-4.5,宣称最佳但遭质疑,优势与局限并存

    OpenAI 刚刚发布了 GPT-4.5,这是其旗舰大型语言模型的新版本。该公司宣称,它是迄今为止在全方位聊天方面最大且最佳的模型。OpenAI 的研究科学家米娅・格莱斯(Mia Glaese)表示:“这对我们来说确实是向前迈出的一步。” 自所谓的推理模型 o1 和 o3 发布以来,OpenAI 一直在推进两条产品线。GPT-4.5 属于非推理系列 —— 格莱斯的同事、同样身为研究科学家的尼克・赖德(Nick Ryder)称其为… Read More

  • LLM是如何训练出来的——训练工程科普

    我们在多达 512 个 GPU 上进行了超过 4000 次扩展实验,并测量了吞吐量(标记大小)和 GPU 利用率(标记颜色)。需要注意的是,在本可视化中,两者都根据模型大小进行归一化。 数千块 GPU 协同工作,完美协调——这正是当今最强大 AI 模型所需的训练规模。直到最近,这种规模还只属于顶尖研究实验室的专有领域。开源让这块领域发生了翻天覆地的变化,但并没有彻底改变现状。是的,你可以下载最新的 Llama 或 DeepSeek 模型。是的,你能阅读它们的 技术和 实验报告。但最具挑战性的部分——用于协调 GPU… Read More

  • HOMIE:配备同构外骨骼驾驶舱的类人型移动操作

    当前的类人型远程操作系统,要么缺乏可靠的底层控制策略,要么难以获取精确的全身控制指令,这使得对类人型机器人进行移动操作任务的远程控制变得困难。为了解决这些问题,我们提出了 HOMIE,这是一种新型的类人型远程操作驾驶舱,它集成了类人型移动操作策略和基于低成本外骨骼的硬件系统。该策略使类人型机器人能够在适应任意上身姿势的同时,行走并下蹲到特定高度。这是通过我们基于强化学习的新型训练框架实现的,该框架融入了上身姿势课程、高度跟踪奖励以及对称性利用,且不依赖于任何运动先验知识。作为对该策略的补充,硬件系统集成了同构外骨骼手臂、一副动作感应手套和一个踏板,使得单个操作员能够实现对类人型机器人的全面控制。我们的实验表明,与基于逆运动学的方法相比,我们的驾驶舱促进了更稳定、快速和精确的类人型移动操作远程控制,加快了任务完成速度,并消除了重定向误差。我们还验证了由我们的驾驶舱收集的数据对于模仿学习的有效性。 强化学习 我们在基于强化学习的训练框架中引入了三项核心技术,以显著扩展类人型机器人的操作工作空间,同时确保其运动的稳健性: 我们的框架完全无需动作捕捉,从而形成了更高效的流程。 我们的框架可用于训练不同种类的机器人,如宇树科技的 G1 和傅利叶智能的 GR-1。 在英伟达 RTX 4090 上使用我们的框架训练约 3 小时后,我们可以得到能够直接部署在现实世界中,驱动机器人稳健行走和下蹲的策略。… Read More

  • 微软马约拉纳 1 号芯片:拓扑核心架构驱动,开启量子计算新征程

    微软今天推出了马约拉纳 1 号芯片,这是世界上首款由新型拓扑核心架构驱动的量子芯片。微软预计,该架构将在几年内(而非几十年)实现能够解决有实际意义的工业规模问题的量子计算机。 它利用了世界上首个拓扑超导体,这是一种具有突破性的材料,能够观测和控制马约拉纳粒子,从而产生更可靠且可扩展的量子比特,而量子比特是量子计算机的基本组成单元。 微软表示,就如同半导体的发明使如今的智能手机、计算机和电子产品成为可能一样,拓扑超导体以及由其所驱动的新型芯片,为开发能够扩展到拥有一百万个量子比特的量子系统提供了一条途径,并且该系统能够应对最复杂的工业和社会问题。 微软技术研究员切坦・纳亚克(Chetan Nayak)表示:“我们退一步思考,‘好吧,让我们为量子时代发明晶体管。它需要具备哪些特性呢?’ 这就是我们走到今天这一步的原因 —— 正是我们新材料堆栈中的特殊组合、质量和重要细节,造就了一种新型的量子比特,并最终形成了我们的整个架构。” 马约拉纳 1 号,由约翰・布雷彻(John Brecher)为微软拍摄。 微软称,用于开发马约拉纳… Read More

  • xAI 发布 Grok 3,号称超越 GPT – 4o,独立开发者如何把握机遇与风险

    埃隆・马斯克(Elon Musk)的人工智能公司推出了一款带有深度搜索(DeepSearch)功能的新旗舰模型。该模型首先面向 X Premium + 订阅用户开放。 埃隆・马斯克的 xAI 公司发布了其最新旗舰人工智能模型 Grok 3。 据 TechCrunch 报道,这款新模型能力增强,公司称其计算能力比前一代提高了 10… Read More

  • 马斯克称 xAI 公司的 Grok 3 聊天机器人即将发布

    马斯克在 X 平台(原推特)发文称,该产品将于太平洋时间晚上 8 点通过演示正式上线。 周四,马斯克在迪拜举行的世界政府首脑会议视频会议上,提前透露了 Grok 3 聊天机器人的发布计划,他称这是一款性能将超越目前所有已发布竞争工具的人工智能模型。 马斯克表示,该模型基于合成数据进行训练,能够通过反复梳理数据来反思自身所犯错误,以实现逻辑一致性。 马斯克旗下xAI推出最新大模型Grok 3,并在直播中进行了现场演示。马斯克称,我们非常高兴能够推出 Grok3,它的能力将在短时间内比Grok2强大一个数量级。 马斯克还介绍了“Grok”的含义说,“实际上,我们应该解释一下为什么我们称之为‘Grok’。这个词来自罗伯特·海因莱因的小说《异乡异客》。这个词被一个在火星长大的角色使用,意思是充分而深刻地理解某事。‘grok’这个词传达了深刻的理解,而同理心是其中的重要组成部分。” Grok… Read More