新闻资讯-歌剧话剧

AI研习社 | 人工智能(AI)资讯简报(2025年第11期 )

发布时间:2025-12-05 15:01:35  浏览量:31

人工智能(AI)资讯

嘉兴市图书馆参考阅览室自行收集并二次编辑的人工智能(AI)行业资讯宣传册。主要分为四大板块:政策法规、热点资讯、精选论文、书籍推荐 。

简 报

本期精选分享

谷歌发布最新AI模型Gemini 3

【摘要】当地时间18日,谷歌正式推出Gemini 3系列人工智能(AI)模型,并同步上线Gemini 3 Pro预览版。该公司称,Gemini 3是迄今为止“最智能”和“最具事实准确性的”AI系统。它不仅拥有卓越的推理能力、多模态理解能力和智能体编码能力,还能将用户创意快速转化为应用程序,在创建软件、整理邮件和分析文档等任务中,相比前代产品都有显著提升。

据谷歌介绍,Gemini 3的推理能力堪称一流,能够捕捉创意中的细微线索,理解复杂问题的深层含义,并更精准地把握用户请求背后的语境与意图,从而减少对大量提示词的依赖。其部分推理能力已在独立基准测试中得到体现。在旨在衡量通用推理能力和专业知识的“人类终极考试”中,该模型以37.4分的成绩创下有史以来最高分。此前的最高分由GPT-5 Pro保持,为31.64分。

Gemini 3 Pro则具备“原生多模态”能力,可同时处理文本、图像和音频。例如,用户可用它翻译菜谱照片并生成电子食谱,或将一系列视频讲座转化为互动学习卡片。此外,Gemini 3 Pro还支持生成杂志风格的可浏览页面或定制化动态布局界面,提供更丰富的交互体验。

在搜索应用中,Gemini 3 Pro可呈现图片、表格、网格和模拟结果等多样化视觉内容。升级后的“查询分解技术”不仅能将问题拆解为可搜索的子任务,还能更准确理解用户意图,帮助发现以前可能错过的新内容。

谷歌特别强调,Gemini 3 Pro在答问中有别于OpenAI的ChatGPT,其更加“智能、简明、直接”,用真实洞察替代陈词滥调,“告诉你需要知道的,而不仅是你想听的”。

目前,Gemini 3 Pro已在热门AI基准测试平台LMArena排行榜上位居首位。其“深度思考”模式进一步强化了推理能力,不过该功能目前仅面向安全测试人员开放。

空间智能将成AI攀登的下一座高峰

【摘要】人工智能(AI)的发展正在进入一个全新阶段,或将从“理解语言”走向“理解世界”。

11月10日,美国斯坦福大学教授、World Labs联合创始人李飞飞发文《从语言到世界:空间智能是AI的下一个前沿》,提出空间智能将成为AI攀登的下一座高峰。她指出,当前以大型语言模型为代表的AI系统虽然能熟练生成文字与图像,却仍停留在“语言的世界”中,困于“纸上谈兵”,缺乏对现实空间、物理规律与因果关系的真正理解。而具备空间智能的AI将突破这一瓶颈,像人类一样在现实世界中感知、推理和行动。

李飞飞认为,当前以大型语言模型和图像分类器为主导的人工智能时代已经达到了极限。

从算法智能到空间智能

这些局限使得AI难以真正赋能人类的创造性工作。无论是帮助学生理解复杂的分子化学概念,协助建筑师构思空间结构,还是为导演、游戏设计师构建虚拟世界,目前的AI距离这一目标尚远。

在李飞飞看来,空间智能是人类认知建构的脚手架,驱动着想象、创造与推理,是连接感知与行动的核心能力。这种能力让人们轻松完成停车时估算车距、在人群中自如穿行等日常动作,其核心在于将想象、感知与行动融为一体,实现从“知道”到“理解”的跨越。

她认为,空间智能代表着超越语言的边界,融合了想象、感知与行动,让机器不仅理解“看到了什么”,还理解“这些东西如何关联、意味着什么、为何重要”。这类AI将能真正拓展人类的创造力与理解力,从医疗健康到艺术创作,从科学探索到日常辅助,将会带来前所未有的变革。

标签: 谷歌 人工智能 gemini 推理 研习社
sitemap