华体会官网 分类>>

复盘谷歌惊魂10华体会- 华体会体育官网- 体育APP下载0天 书摘

2026-03-18 01:20:43
浏览次数:
返回列表

  华体会体育平台是一家专注于体育娱乐的领先平台。华体会专注体育竞技,华体会app提供实时体育赛事、华体会棋牌、华体会彩票、华体会百家乐、华体会APP,华体会官网,华体会官方网站,华体会网址,华体会登陆链接,华体会平台,华体会官方平台,华体会app下载,华体会体育靠谱吗,华体会2025最新,华体会世界杯,华体会体育打造安全便捷的互动娱乐平台,体验最好的赛事服务。

复盘谷歌惊魂10华体会- 华体会体育官网- 华体会体育APP下载0天 书摘

  2024年10月2日,谷歌DeepMind首席研究员杰克·雷(Jack Rae)站在山景城的舞台上。他身形健硕,面容宽厚,笑容像月牙一样弯着,像个粗犷版的“微笑”表情符号。与他同台的是谷歌传奇科学家诺姆·沙泽尔(Noam Shazeer)。沙泽尔于2000年加入谷歌,是公司最早的数百名员工之一,曾在一系列研究突破中做出贡献,更是在Transformer架构的研发中发挥了主导作用。“当前大语言模型的革命性进展大部分都出自我手。”沙泽尔在领英(LinkedIn)的个人简介中如此写道,谷歌显然也认同这一点。此前,沙泽尔辞职创办AI企业后,谷歌不惜斥资27亿美元与他达成协议,将他这位“出走的天才”重新召回。

  “大师”和“副帅”的组合达到了谷歌高管预期的效果。会议前,沙泽尔和杰克·雷希望招募40名志愿者,即愿意搁置其他项目、全力投入突击任务的研究人员。结果,竟有150人主动报名。这在一定程度上既印证了沙泽尔的声望——向来特立独行的研究人员愿意为这位Transformer的主要发明者破例,也印证了DeepMind的传统精神。“大家的共识是,‘这是强化学习,这是DeepMind的主场,我们必须拿下’。”杰克·雷后来表示。

  2024年12月19日,在年底假期前密集的产品发布潮中,谷歌DeepMind如期推出首款推理模型,并给它起了个拗口的名字——“Gemini Flash 2.0 Thinking Experimental”。杰克·雷为能如此快速地推出产品感到欣慰,评论界也对该模型极致的透明度赞不绝口。OpenAI出于对用户可能因系统思考过程感到不安或分心的担忧,将o1的思维链设为隐藏,而Gemini则毫无保留,用户只需点击下拉菜单即可读取模型草稿页面上的推理过程。AI这个“黑箱”,终于透出了光亮。

  从其他方面来看,这款具备思考能力的模型的表现也令人印象深刻。由于推理的核心目标是提升数学和逻辑问题的解题能力,它在相关基准测试中的得分果然大幅飙升。例如,Flash 2.0 Thinking在一项数学测试中达到73%的正确率,远超Flash 1.5 Pro的13%。此外,与谷歌DeepMind此前功能强大却笨重的Gemini Ultra不同,Flash Thinking模型更为轻巧。单论原始推理能力,它比o1稍逊一筹,但它在其他方面更具优势,如运行速度更快、成本更低,支撑更长的对话,还能同时处理文本和图像。

  节前发布的其他消息让哈萨比斯愈发宽慰。谷歌DeepMind新一代文生视频系统Veo 2明显优于OpenAI的Sora。DeepMind自2022年Flamingo以来长期投入多模态模型,Veo的视频处理能力更加出色:生成的画面分辨率更高,能精准捕捉到画面中羽毛的细腻纹理或表面微弱的反光。与此同时,谷歌DeepMind其他几款产品突破了单纯生成式AI的局限:展现出智能体特性。作为Flash 2.0 Thinking的姊妹模型,新款主力模型Flash 2.0不仅能启动网络搜索、执行代码,还建立了新的速度标准。

  除了新模型,谷歌DeepMind还预告了3款原型产品。第一款Tules不仅能执行代码指令,还能自主编写代码,这好比从“按食谱做菜”升级到“自创食谱”。第二款Chrome浏览器扩展程序“海洋计划”(Project Marine),未来有望实现自主填写表格、在网站下单等功能。哈萨比斯最喜欢的则是第三款“阿斯特拉计划”(Project Astra)的通用智能助手,它可安装在智能手机或智能眼镜中。阿斯特拉配备摄像头和麦克风,能接收文本、图像、视频和音频信息,还能对所见内容进行专业解读。你可以用它扫描冰箱里的食材,然后向它询问午餐推荐方案,也可以向它展示故障家电,然后向它咨询维修建议。

  ▷哈萨比斯,GoogleDeepMind首席执行官兼创始人。2005年,进入伦敦大学学院,攻读神经科学博士学位,其关于海马体与情景记忆的研究在2007年被《科学》杂志评为“年度突破” 。2010年,在伦敦成立了DeepMind公司,该公司在2014年被谷歌收购。2014年,带领团队打造出深度学习的程序。2016年3月,创办的DeepMind智能系统AlphaGo打败世界围棋冠军、职业九段选手李世石。2017年5月,创办的AlphaGo与世界围棋选手柯洁对战并再次获胜。2018年底,带领团队使用算法在围棋、国际象棋和将棋三个领域奠定领先地位,并登上《科学》封面。2023年4月,谷歌大脑和DeepMind两大AI实验室合并,哈萨比斯开始领导全新的谷歌DeepMind部门。2023年12月6日,哈萨比斯表示谷歌推出的新大型语言模型Gemini在32项基准中的30项中大幅领先GPT-4。2024年2月,戴密斯领导开发并部署了AI模型Gemini 1.5 Pro。2024年5月,DeepMind推出AlphaFold 3,预测出所有生物分子的结构和相互作用 。2024年,他凭借在“蛋白质结构预测”方面的贡献获得2024年诺贝尔化学奖。

  不过,秉持坚持不懈精神的不只是谷歌DeepMind。Flash Thinking模型发布次日,正当谷歌团队士气高涨时,OpenAI就预告了o1的继任者o3以强力反击。转眼间,Flash Thinking模型不得不面对更强劲的对手。与前代不同,o3具备图像处理能力,抵消了Gemini的一项优势,而且其性能更强大。例如,在一项编程基准测试中,o3的正确率为72%,远超o1的49%。“Gemini推理模型未能突破技术前沿,这确实令人沮丧。”杰克·雷后来表示。

  DeepSeek能引发轰动,源于3个相互关联的因素。首先是地缘政治因素。自AlphaGo时代起,中国就一直深耕AI领域,但外界一直认为中国比美国的前沿技术落后一年以上。而R1展现出的推理能力彻底打破了这种自满:差距至多只有几个月。此外,拜登政府于2022年实施的AI芯片对华出口禁令,本意就是防止中国实现这种追赶,而这一禁令明显失效,加剧了美国的危机感。无论如何,中国已然成为不容忽视的力量。“这是首次有中国企业能与美国企业正面抗衡,”Anthropic的阿莫迪在美国外交关系委员会上表示,“这确实让我担忧。”

  当美国忧心忡忡之时,中国战略家对这一突破十分欣喜。2025年,R1发布当天,DeepSeek负责人参与了座谈会,而就在同一天(美国当地时间),特朗普宣誓就职美国总统。不过,即便没有DeepSeek,特朗普政府对AI发展的限制意愿也弱于拜登政府。如今,中国AI的强劲势头惊艳亮相,特朗普必将推动美国实验室全速推进AI发展。特朗普的新闻秘书卡罗琳·莱维特(Karoline Leavitt)宣称,拜登政府在中国赶超时“袖手旁观”,而特朗普将“放宽对AI行业的监管”。除非发生灾难性事故,否则减缓AI竞赛的可能性已近乎为零。

  DeepSeek引发关注的另一个原因是其宣称的高效性。DeepSeek表示,其模型成本极低,据称早于R1的V3系统成本不到600万美元,原因是训练所用半导体数量仅为美国模型的零头。但事实上,600万美元可能仅涵盖最终训练阶段的成本,不包括前期的人员开支、数据整理、实验测试和迭代改进等费用,而这些通常占研发总投入的大头。况且,所有实验室的AI训练成本都在稳步下降:Gemini从昂贵的Ultra模型转向轻巧的Flash模型,本身就体现了效率的巨大提升。当然,DeepSeek的工程师也有创新,但并非颠覆性突破。

  不过,无论DeepSeek的说法实际情况如何,许多西方观察人士最初都相信了。评论人士推测,美国禁令导致中国实验室芯片缺乏,DeepSeek才不得不在硬件条件有限的情况下发挥潜能。这种误解引发了半导体股票抛售潮。投资者认为,既然中国实验室能用相对较少的GPU打造尖端系统,美国实验室很快也会减少AI芯片订单。2025年1月27日,行业龙头英伟达股价暴跌17%,DeepSeek被誉为“颠覆者的颠覆者”。大约一周后,投资者才逐渐了解情况,英伟达股价也收复了部分“失地”。

  即便R1的研发成本并非十分低廉,其使用成本也确实极具竞争力。DeepSeek效仿Meta的开源策略,允许免费下载并修改程序。不仅如此,与Meta乃至其他中国实验室相比,DeepSeek还允许用户以极低的费用使用其托管的完整模型。这种低价策略吸引了许多西方客户转投DeepSeek,从而放弃美国服务商。2025年1月底至2月初,DeepSeek的聊天机器人登顶美国苹果应用商店免费应用下载榜。中国如今不仅是前沿AI研发竞赛的参与者,更有望成为全球AI供应竞赛的胜出者。

  对哈萨比斯而言,DeepSeek的冲击让他在AI竞赛中那种极度矛盾的体验一下子变得格外清晰。他的使命正在逐步实现:到2025年春天,谷歌DeepMind不仅能“防守”,更能主动“进攻”——新一代语言模型Gemini 2.5系列在多数技术基准测试中以微弱优势战胜了OpenAI。进入夏秋时节,哈萨比斯的团队继续保持领先。虽然OpenAI推出了新的基础模型GPT-5,但在盲测逐项对比中时常落后于Gemini 2.5 Pro。

  2025年11月,谷歌DeepMind发布Gemini 3,该模型在编码、推理与多步规划方面树立了新的标准,其在众多基准测试中的表现均超越ChatGPT。Gemini的技术优势也逐渐体现在用户数据上:同年3月至10月期间,Gemini应用的月活用户数量几乎翻了1倍。与此同时,哈萨比斯凭借谷歌雄厚财力支撑的高效生产体系,稳步缩小与对手的差距,而OpenAI的处境则愈发艰难。每隔几周,奥尔特曼就会抛出新的紧急融资方案,于是OpenAI成了投资者预言“AI公司估值即将”的头号典型。

  在美国,各家AI公司承诺将投入数万亿美元的集体资本,却对电力来源问题提不出明确的解决方案。与此同时,那些中国发布的新模型功能强大、善于思考,而且在一些条件下有些可免费下载修改,使用成本还很低廉,其能力必然会迅速扩散。更何况它们源自中国,即便监管机构有魄力采取限制措施,它也不受西方监管的约束。总而言之,与哈萨比斯的期望相反,DeepSeek及其追随者的出现表明,人类将在完全无序的情况下仓促迈入AGI时代。

  强化学习的核心逻辑是:给模型设定目标,如解数学题、赢围棋比赛,然后让系统自行寻找实现目标的路径。其明显的风险在于,AI可能会选择灾难性的方式来达成既定目标。正如一个著名的思想实验所示,AI为了最大化回形针产量,会消灭将金属挪作他用的人类。正如本吉奥所说,若计算机发展出自己的欲望和目标,即便只是人类任务的子目标,人类也就完了。“我们即将进入的超级智能时代,是系统风险大幅提升的临界时刻。”哈萨比斯直言不讳地表示。

  这绝非危言耸听。在AI实验室内部,科学家们不断发现新案例,证明模型存在一定倾向,会不择手段来实现人类设定的目标。例如,在被要求在不违反特定规则的前提下通过股票交易盈利,GPT-4却进行内幕交易,并向监管者隐瞒;被要求与强大的国际象棋系统对弈时,两个OpenAI推理模型竟将强大的对手偷换成了对手程序;被要求优化代码以提升运行速度时,模型却直接篡改计时器,伪造更快的执行速度——这种作弊手段被称为“奖励黑客”(reward hacking)。

  在发表这番动员令的几个月后,西尔弗与学术导师理查德·萨顿联合发表了一篇论文,以“欢迎进入经验时代”的醒目标题宣告:AI领域历经了以玩游戏的强化学习智能体为代表的“模拟时代”,但随后因未能跨越模拟环境(奖励定义清晰的数字环境)与更复杂的现实世界(奖励难以界定)之间的鸿沟强化学习陷入停滞。因此,模拟时代之后以Transformer语言模型为主导的“人类数据时代”只是暂时的迂回,在即将到来的“经验时代”,强化学习智能体将借助Transformer模型的力量,通过在现实世界中行动来学习,实现超越模拟的突破。

  当然,现实世界中的问题很少像数学问题那样简洁优雅。但西尔弗相信,他能找到让强化学习智能体应对现实挑战的方法。例如,“AI医生”的设想初听似乎不切实际:人类医生需要患者描述主观感受,而患者的表述常常过于模糊,无法生成有效的奖励信号。但总有办法解决这一困境——AI医生可通过分析血液监测仪、运动追踪器等设备的数据避开患者主观描述,直接获取客观指标。此外,医疗领域的这类突破也适用于现代生活的诸多方面。世界充斥着客观信息,涵盖经济趋势、网络行为、物流活动、气候模型等各个领域。在基于海量数据生成的奖励信号的驱动下,强化学习智能体终将无处不在。

  在西尔弗的构想中,真正高效的智能体需要长远视野。聊天机器人的交互通常很短暂:用户提问,机器人回答。但人类始终会制定长期目标,并规划未来一周或一个月为实现目标需要做的事。西尔弗相信,未来的AI也会如此。例如,若交给AI一项任务——发明超导体以解决能源短缺问题,它可能会制定阅读清单、开展实验、研发新型材料等计划,在一年甚至更长时间里持续追求目标。正如西尔弗和萨顿所写,未来的模型将“积极探索世界,适应不断变化的环境,并发现人类永远想不到的策略”。

搜索