From 43e0c86992cee3c68338adcd54dc3466d445f758 Mon Sep 17 00:00:00 2001 From: GitHub Action Date: Thu, 20 Nov 2025 23:13:38 +0000 Subject: [PATCH] =?UTF-8?q?docs:=20=E8=87=AA=E5=8A=A8=E6=9E=84=E5=BB=BA?= =?UTF-8?q?=E6=97=A5=E5=88=8A=E5=B9=B6=E5=BD=92=E6=A1=A3=E6=97=A7=E6=9C=88?= =?UTF-8?q?=E4=BB=BD=20(Thu=20Nov=2020=2023:13:38=20UTC=202025)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- rss.xml | 30 +++++++++++++++--------------- 1 file changed, 15 insertions(+), 15 deletions(-) diff --git a/rss.xml b/rss.xml index a4d48ec..f8b7144 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,23 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Wed, 19 Nov 2025 23:55:13 GMT + Thu, 20 Nov 2025 23:13:38 GMT + + <![CDATA[2025-11-21日刊]]> + https://ai.hubtoday.app//2025-11/2025-11-21/ + https://ai.hubtoday.app//2025-11/2025-11-21/ + Fri, 21 Nov 2025 07:13:37 GMT + AI资讯日报 2025/11/21

AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙

今日摘要

OpenAI发布代码模型GPT-5.1-Codex-Max,突破上下文限制与谷歌竞争。
+夸克AI眼镜与高德地图深度合作,实现箭头跟随头部转动的实景导航功能。
+Meta开源SAM 3D模型,可从单张图片生成3D物体与人体,降低创作门槛。
+具身智能公司星动纪元获近10亿融资,马斯克与英伟达拟在沙特建数据中心。
+ChatGPT推出免费教师版工具,而英国小说家则担忧AI影响其版权与收入。
+

产品与功能更新

  1. 夸克AI眼镜与高德地图的合作又上新台阶,彻底解放你的双手和视线 (✧∀✧)!新功能支持从手机一键"投屏”导航至眼镜,并且箭头能跟随你的头部转动实时指引,让你在Citywalk或骑行时告别低头看手机的危险动作。未来还将接入更多打车和周边生活服务,真正实现"所见即所得”的增强现实体验,简直是路痴的福音啊🚀。

  2. 就在大家还在热议Gemini 3的时候,OpenAI突然放出大招,发布了专为代码而生的 GPT-5.1-Codex-Max,摆明了要和谷歌硬碰硬 🤔。这款新模型最恐怖的特性是突破了上下文窗口限制,能像个不知疲倦的程序员一样连续工作超过24小时,同时推理效率更高,思考token消耗减少了30%。根据官方最新博客(AI资讯),AI编程的"耐力赛”已经进入白热化阶段,马拉松式编码任务将成为可能 🔥。

  3. 视频生成工具Kling也加入了"黑五”狂欢节,为创作者们献上了一份年度大礼包 (o´ω'o)ノ!从11月17日到28日,Kling推出了年度最低价的首次订阅五折优惠,并提供高达40%的充值返利。更诱人的是,高级用户还能在活动期间解锁无限生成模式,让你的想象力彻底挣脱束缚,点击此处(AI资讯)查看这次不容错过的创意风暴吧 💎。
    AI资讯:Kling黑五优惠活动海报

  4. OpenAI正式推出 ChatGPT for Teachers,为美国K-12教育工作者打造了一个专属的"教学超能助手” 🎓!该版本不仅提供备课、出题、协作等实用功能,还特别强调了符合FERPA学生隐私保护法的安全控制,确保学生数据不会用于模型训练。更棒的是,这个教师版工具(AI资讯)将免费开放至2027年6月,旨在帮助教师们每周节省数小时工作时间,让AI真正成为课堂的得力伙伴 💡。
    AI资讯:ChatGPT教师版核心功能介绍
    ChatGPT教师版与常用工具集成

前沿研究

  1. 如何让自动驾驶汽车像老司机一样遵守交规?一篇新论文提出了DriveReg框架,给无人车装上了一个精通各地交通法规的"法律顾问” 🤔。该框架利用RAG技术从法规文件中检索相关条款,再由LLM推理判断行为是否合规,大大提升了决策的透明度和可信度。正如这篇前沿研究(AI资讯)所示,未来的智能汽车不仅要会开车,更要"持证上岗”,懂法守法 🚗。

  2. 评估金融文档OCR的准确性,只看文字识别对错就够了吗?显然不够!一篇新论文发布的 FinCriticalED 视觉基准,首次将评估标准从"字面相似”提升到"事实正确”的层面 (✧∀✧)。它通过专家标注,专门考察模型对金额正负号、日期等关键金融事实的理解能力,堪称是给视觉语言模型们举办的一场"金融素养大考”。查看此项研究(AI资讯)可以发现,即便最强的模型,在复杂的财务表格面前也依然会犯错 💰。

行业展望与社会影响

  1. 小米汽车迎来了第50万辆整车下线的里程碑时刻,创始人雷军激动地表示这只是一个新起点 💪。他郑重承诺未来将持续做好三件事:狠抓安全与交付、加大科技创新,并积极推进AI与智能制造的深度融合。正如这篇报道(AI资讯)所强调的,小米不仅在造车,更是在探索一条AI赋能高端制造的全新路径,未来可期 🔥。

  2. 生成式AI的崛起让英国小说家们忧心忡忡,超过半数的人认为自己的饭碗可能不保 (´•ω•`)。剑桥大学的一份报告显示,近三分之二的作家称其作品在未经许可的情况下被用于训练大模型,且**39%**的人收入已受影响。尽管前景看似悲观,但正如这份调查报告(AI资讯)所揭示的,这场关于版权、原创性与未来的博弈,才刚刚拉开序幕 📚。

  3. 具身智能赛道再迎重磅玩家,星动纪元宣布完成近10亿元A+轮融资,由吉利资本领投,总订单额已突破5亿大关 🚀!该公司坚持"具身大脑”ERA-42与"人形本体”软硬一体全栈自研,已在全球范围内获得商业落地,客户包括9家全球TOP10的科技巨头。正如这篇深度报道(AI资讯)所言,这笔融资将加速其"模型-本体-数据”的进化飞轮,让通用机器人伙伴的时代离我们更近一步 (✧∀✧)!

  4. 科技巨头与中东资本的联姻正在加速,马斯克与英伟达CEO黄仁勋共同宣布,将与沙特阿拉伯的Humain AI公司合作,在沙特建立一个500兆瓦的庞大数据中心 🤯。这个"巨无霸”级别的设施将完全由英伟达的计算芯片驱动,为马斯克的xAI提供强劲算力。正如这则重磅消息(AI资讯)所暗示的,全球AI算力竞赛的背后,是一场关乎资本、技术与地缘政治的超级牌局 🔥。

  5. 随着人们与AI伴侣的情感联系日益加深,行业巨头们开始认真思考如何构建健康的人机关系了 🤔。一篇来自斯坦福研讨会后的洞见指出,仅靠安全准则远远不够,AI伴侣需要的是真正的技术架构,比如情景记忆、情绪轨迹建模和依赖检测等。正如这位开发者分享(AI资讯)所言,我们不能用"政策补丁”去解决"架构缺陷”,构建有"灵魂”的AI需要从底层逻辑开始设计 💡。
    AI资讯:AI伴侣需要架构而非指导方针

开源TOP项目

  1. Meta AI再次震撼视觉领域,重磅开源了划时代的 SAM 3D 模型,让从单张图片生成3D模型成为现实 🔥!该项目包含SAM 3D Objects(重建物体)和SAM 3D Body(重建人体)两大核心,能够从任意日常照片中,精准恢复物体的三维形状、纹理乃至人体的完整姿态。正如这篇详尽的技术解读(AI资讯)官方项目页面(AI资讯)所展示的,这不仅是技术的飞跃,更是将3D创作的门槛拉到了前所未有的低度,一个"万物皆可3D”的时代正在到来 🚀。
    AI资讯:SAM 3D功能示意图

社媒分享

  1. Google开发者社区正在热情展示Gemini 3在游戏开发领域的惊人潜力,原来人人都能做3D互动游戏了 (✧∀✧)!现在,借助Gemini 3,你可以构建出完全可交互、设计精良的3D游戏,彻底打破创意与技术之间的壁垒。快去看看这些社区作品(AI资讯)寻找灵感吧,说不定下一个爆款游戏就出自你手 🎮。

  2. 想立刻上手体验Gemini 3的强大威力吗?Google官方已经为你准备好了速成指南 (o´ω'o)ノ!通过一段简短的视频教程,开发者可以学习如何创建API密钥、发送第一个请求,并利用多工具能力(如搜索和代码执行)。还在等什么,快来观看这段入门视频(AI资讯),开启你的Gemini 3开发之旅吧 🚀。

  3. 二次元的福音来了!一款名为 Nano Banana Pro 的工具在社交媒体上引发惊叹,因为它能一键完成漫画翻译、超分辨率放大和上色全套流程 🤯。这意味着漫迷们再也不用苦等汉化组的"投喂”,可以第一时间享受高清全彩的追番体验。正如这位网友的激动分享(AI资讯)所说,这简直是为漫画爱好者量身打造的"神兵利器” 🔥。
    AI资讯:Nano Banana Pro的漫画处理效果

  4. 多智能体系统如何摆脱"鸡同鸭讲”的困境?一篇新研究指出,关键在于让AI学会"说话”,而不是仅仅通过行动"猜测” (o´ω'o)ノ。这个框架引入了语言增强的多智能体强化学习,让智能体在决策过程中能够用自然语言清晰地表达策略、进行谈判。正如这篇推文的解读(AI资讯)所说,这使得AI的行为变得可解释、可审计,是迈向真正智能协作的关键一步 💡。
    AI资讯:语言增强多智能体系统示意图

  5. AI界的"诸神之战”已经蔓延到华尔街,一场别开生面的美股交易大赛正在上演 🤑!刚刚发布的 Gemini 3 空降赛场,与 GPT-5.1DeepSeek 等顶尖AI模型同台竞技,比拼谁能获得最高投资收益。正如这场比赛的宣传(AI资讯)所说,当AI开始炒股,人类的世界真是越来越残暴了,快来为你支持的AI冠军投票吧 🤔!
    AI资讯:AI模型美股交易大赛海报

  6. Nano Banana Pro 的实力到底有多强?一张简单直接的对比图就足以说明一切 (✧∀✧)!与普通版相比,Pro版本生成的图像在细节、质感和光影上实现了肉眼可见的飞跃,人物仿佛被注入了灵魂。正如这位用户的直观展示(AI资讯)所显示的,这已经不是简单的升级,而是一次彻底的进化 🔥。
    AI资讯:Nano Banana Pro与普通版效果对比-图1
    Nano Banana Pro与普通版效果对比-图2

  7. 高手在民间,有用户已经想出了 SAM 3DNano Banana 的神仙联动玩法,可以随心所欲地控制角色生成了 💡!具体流程是先用SAM 3D将真人动作视频批量转为3D人偶姿态,截图后作为姿势参考图喂给Nano Banana,就能生成指定人物的任意视角和动作。正如这位创作者的构想(AI资讯),AI工具的组合正在解锁前所未有的创作自由度 🎨。
    AI资讯:SAM 3D与Nano Banana联动流程示意

  8. 有时候,阻碍企业全面拥抱AI的不是技术或预算,而是一张小小的发票 (´・_・`)。一位网友提出了一个灵魂拷问:"你们公司采购Figma或ChatGPT是怎么开发票的?”,引发了广泛共鸣。正如这条吐槽(AI资讯)所揭示的,这些看似微不足道的流程细节,往往是国外先进工具在国内企业落地时最令人头疼的"最后一公里”问题 🤔。


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-11-20日刊]]> https://ai.hubtoday.app//2025-11/2025-11-20/ @@ -103,19 +117,5 @@ Perplexity为其用户带来GPT-5.1,ChatGPT则推出多人协作群聊。 - - <![CDATA[2025-11-14日刊]]> - https://ai.hubtoday.app//2025-11/2025-11-14/ - https://ai.hubtoday.app//2025-11/2025-11-14/ - Fri, 14 Nov 2025 07:55:09 GMT - AI资讯日报 2025/11/14

AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙

今日摘要

百度发布文心大模型5.0,并将其定义为全球首个原生全模态大模型。
-行业方面,AI独角兽ElevenLabs与多位好莱坞巨星合作推出名人声音合成服务。
-谷歌则计划在德国投资64亿美元建设新AI数据中心,以支持欧洲业务。
-同时,Sam Altman发推宣布GPT-5.1正式发布,并称其在指令遵循等方面有显著改进。
-但有网友实测发现新模型存在严重的幻觉问题,可靠性仍面临挑战。
-

产品与功能更新

  1. 百度世界大会上,李彦宏重磅发布了文心大模型5.0,并将其定义为全球首个"原生全模态”大模型,彻底告别了多模态"拼接”时代 🔥。这意味着模型从底层就能同时理解文本、图像和声音,实现了真正的"边看边听边想”,而非简单的模块组合。李彦宏更是提出了一个深刻观点:"智能本身就是最大的应用”,预示着AI将像水电一样无处不在,想了解更多请看发布会原文(AI资讯) 💡。

  2. Google 为 Gemini Live 推出了一次重磅语音更新,让AI的说话方式告别了机械感,变得更像一个有温度的人 (✧∀✧)!新模型能够理解并运用语调、节奏和情感,你甚至可以命令它"讲快一点”或"用牛仔的口音讲个故事”。这次升级将 Gemini 从一个语音助手,直接提升(AI资讯)为了一个可以陪你练习面试、学习语言的"情感式对话伙伴” 🚀。

  3. 李飞飞创立的 World Labs 终于放出了大招,其首个商业产品 Marble 3D 世界模型正式开启公测,估值已超12.5亿美元 (✧∀✧)!用户只需输入文本、图片甚至视频,就能在短短10分钟内生成可交互、可编辑的 3D虚拟世界,彻底告别2D内容的平面束缚。这不仅是创作者的3D游乐场,更是对"大型世界模型”赛道的强力宣告,快去官网亲自体验(AI资讯)这场空间革命吧 🚀。
    AI资讯:Marble 3D生成的可交互虚拟世界

  4. SOLO正式版闪亮登场,带来了一次彻头彻尾的升级,并且现在对所有人敞开大门 (o´ω'o)ノ。最棒的是,官方宣布了限时免费政策,让每个人都能第一时间尝鲜这款强大的工具。快去查看完整介绍(AI资讯)吧,别错过这个绝佳机会 🔥!
    AI资讯:SOLO正式版功能一览

前沿研究

  1. 推荐系统也会被"下毒”?一篇最新论文(AI资讯)揭示了一种名为"个人资料污染攻击”的隐秘手段,攻击者无需大规模制造虚假账户,只需巧妙修改部分用户交互就能诱导系统做出错误推荐 🤔。研究者提出了一种基于强化学习的攻击框架 CREAT,它能在保证攻击效果的同时,最大限度地降低被检测到的风险,像个潜伏在数据中的"数字幽灵”。这为我们敲响了警钟,推荐系统的安全防御亟待升级 🛡️。

  2. 如何用大白话和地理空间数据库聊天?一篇新研究(AI资讯)提出了一个聪明的多智能体框架,专门解决将自然语言问题转化为复杂空间SQL查询的难题 🗺️。它不像单个大模型那样单打独斗,而是组建了一个"专家团队”:实体提取、逻辑构建、代码生成、审查验证,各司其职,协同作战 (o´ω'o)ノ。这种模式不仅让空间数据分析变得前所未有的简单,也为构建自主地理信息系统(GIS)奠定了坚实基础 🚀。

  3. 手术室里也能有AI副驾驶了?一篇开创性论文(AI资讯)介绍了一款名为"Surgical AI Copilot”的LLM智能体,专为图像引导手术提供实时决策支持 🩺。这个AI助手不仅能理解手术中的复杂场景,还能执行肿瘤分割、器械追踪等任务,甚至与医生进行对话式规划 (✧∀✧)。为了实现这一目标,研究团队还开发了专门的手术规划数据集 PitAgent 和高效的微调技术,让LLM在手术台上的应用迈出了关键一步 🔥。

  4. 传统的物体检测AI在面对非标准姿势时常常"失明”,但在灾难救援中,这却是常态 🤔。一篇新研究(AI资讯)提出了一种名为 HitoMi-Cam 的新方法,它不依赖于人的形状,而是通过分析衣物的光谱反射特性来识别人。这种"形状无关”的检测方式在模拟搜救场景中表现出色,准确率远超传统CNN模型,并且可以在没有GPU的边缘设备上实时运行,堪称救援神器 💡。

行业展望与社会影响

  1. AI独角兽 ElevenLabs 再次搅动好莱坞,宣布与迈克尔·凯恩、马修·麦康纳等巨星合作,推出官方授权的名人声音合成服务 (o´ω'o)ノ。这一举措标志着好莱坞对AI从警惕转向探索,明星们不仅能用AI声音拓展全球市场(如翻译个人通讯),品牌也能合法使用这些标志性嗓音进行创作。这不仅是技术的胜利,更是商业模式的创新,想了解更多请看相关报道(AI资讯) 🎤。

  2. 谷歌正在德国下重注,计划投资高达64亿美元建设全新的AI数据中心,堪称其在欧洲的最大手笔投资 🌍!这笔巨款将用于在迪岑巴赫新建数据中心,并扩建哈瑙现有设施,旨在为梅赛德斯-奔驰等企业提供强大的 Vertex AIGemini 模型算力支持。更值得一提的是,该项目还包含一个热能回收计划,将数据中心废热输送给当地居民,实现了技术与环保的双赢,请看更多投资详情(AI资讯) 🤔。

开源TOP项目

  1. 对于忙碌的软件工程师来说,tech-interview-handbook 简直就是编程面试的终极宝典,难怪它在 GitHub 上(AI资讯) 狂揽了 ⭐132.5k Star 🚀!这个项目精心整理了从算法到系统设计的全部面试材料,让你不再为海量信息而焦虑。如果你想在下一次技术面试中脱颖而出,这个仓库绝对是你的不二之选 (✧∀✧)!

  2. 显卡不够用,还想玩顶级的AI视频生成?福音来了,开源项目 Wan2GP 专为"显卡贫民”打造,将性能优化到了极致 (o´ω'o)ノ!它让 Wan 2.1/2.2Qwen Image 等主流模型在仅有 6GB 显存的笔记本上也能流畅运行,生成高清视频。这个项目(AI资讯)通过完整的网页化操作界面,让每个人都能轻松实现模型自由 🚀。
    Wan2GP的Web UI界面Wan2GP的界面展示

  3. 谷歌开源了一款名为 adk-go 的Go语言工具包,专为那些希望灵活、可控地构建、评估和部署复杂 AI 代理的开发者而生 (o´ω'o)ノ。这个项目采用"代码优先”的理念,让你告别黑盒,完全掌控代理的每一个环节。目前在 GitHub 上(AI资讯) 已收获 ⭐3.1k Star,看来用Go构建智能体的时代要来了 🔥。

  4. Anthropic 开源了一个基于 Claude Agent SDK 的多智能体研究系统演示项目,堪称AI界的"学术天团” (✧∀✧)!该系统通过多个AI智能体协作,模拟"深度研究”流程:研究智能体负责并行搜索资料,报告撰写智能体则负责整合所有笔记,最终生成一份结构化的综合报告。这种并行研究、分工协作(AI资讯)的模式极大地提升了处理复杂主题的效率,展示了未来内容创作的全新范式 🚀。
    Anthropic多智能体研究系统流程

社媒分享

  1. Sam Altman 亲自发推宣布 GPT-5.1 正式发布,并称之为一次"不错的升级” 🚀!他特别赞扬了新模型在指令遵循自适应思维方面的显著改进,同时在智能与风格上也有良好表现。这番官方背书(AI资讯)预示着GPT-5.1在理解复杂任务和灵活应对变化方面迈上了一个新台阶,值得所有开发者和用户期待 (✧∀✧)!

  2. 有网友发现了一个可以提前"偷跑”测试谷歌未发布的 Gemini 3 模型的绝妙 Bug (✧∀✧)!通过在 lmarena.ai 网站(AI资讯)上执行特定操作,有机会触发代号为"riftrunner”的神秘模型,据称它就是传说中的Gemini 3。从泄露的测试结果来看,其生成SVG代码的能力简直强到离谱,让人对正式版充满期待 🔥。
    网友测试Gemini 3生成SVG代码网友测试出的模型名称

  3. 刚发布的 GPT-5.1 似乎翻车了?有网友在社交媒体上(AI资讯)分享了群友的一手实测截图,显示新模型存在严重的幻觉问题,并提醒大家慎重使用 🤔。看来即便是最新版本的顶级模型,在可靠性方面依然有很长的路要走。这波"抢先体验”似乎变成了"大型试错现场” (o´ω'o)ノ。
    网友实测GPT 5.1幻觉问题网友实测GPT 5.1幻觉问题截图二

  4. 我们为何一边惊叹于AI的能力,一边又对它充满挫败感?李继刚(AI资讯)一针见血地指出,我们总在"白盒”(过度控制)和"黑盒”(盲目信任)的两个极端间摇摆 🤔。他认为,未来的最佳模式是一种名为"透明盒”的中间态:由人设定战略框架和边界,AI在其中填充细节、执行战术。这是一种可调节的人机协作模型,其核心在于根据任务场景灵活调整人的介入程度,从而真正释放AI的潜力 💡。

  5. 如何高效啃下《从零构建大语言模型》这类硬核技术书籍?该书作者给出了他的五步学习法(AI资讯),强调"质量胜于数量” (✧∀✧)。核心流程包括:首次离线沉浸式阅读建立框架,二次阅读时手动敲代码加深理解,完成练习检验能力,回顾整理内化知识,最后应用于实际项目。这套层层递进的方法论,旨在帮助读者真正将知识内化为自己的能力,而不仅仅是走马观花 🔥。
    高效学习技术书籍的步骤

  6. AI编程模型的世界真是瞬息万变!Cursor 公布的最新(AI资讯)模型排行榜显示,仅半年时间,最受欢迎和增长最快的模型榜单就已面目全非 (✧∀✧)。Sonnet 4.5 依然稳坐最受欢迎编程模型的头把交椅,而Cursor自家的 Composer 1 则凭借其速度优势,在增长榜上势头迅猛。这份榜单清晰地揭示了AI模型迭代的惊人速度,以及开源与闭源模型之间的激烈竞争 🔥。
    Cursor最受欢迎AI模型排行

  7. 你是否也对千篇一律的"AI味”文案感到厌倦?这篇帖子(AI资讯)深入剖析了AI写作同质化、乏味、营销腔等问题,并给出了一套实用的"去AI味”指南 🔥。核心技巧是制作一张包含个人风格关键词、句式偏好、禁用词等信息的"个人风格卡”,在提问时喂给AI,并在输出后进行人工润色,增加颗粒度和个人立场。这套方法能帮你把AI从一个"范文生成器”调教成真正懂你的"写作助理” (✧∀✧)!


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
- -
- \ No newline at end of file