From 730f771d4dff48466b8664cd483ee9f8fd2698c9 Mon Sep 17 00:00:00 2001
From: GitHub Action 傅利叶GR-3首秀CES。
+CES2026上傅利叶带着🔥人形机器人GR-3(AI资讯)亮相,现场设置了互动区让观众零距离体验(✧∀✧)。GR-3能下棋聊天还会💡识别表情,55个全身自由度让它动作超灵活。这款机器人主打有温度的陪伴,用莫兰迪配色消解机械感。傅利叶还展出了桌面级玩偶机器人概念原型。 小鹏第二代VLA大模型上车。
+何小鹏宣布🚀物理AI成为2026核心关键词,第二代VLA模型(AI资讯)一季度量产推送。这模型能从视觉直接驱动动作,号称初阶L4能力(厉害了)。2026款P7+和G7都搭载这技术,Robotaxi运营也要正式启动💡。小鹏还要量产人形机器人和飞行汽车。 OpenAI推ChatGPT Health。
+OpenAI正式发布ChatGPT健康版(AI资讯),能连接Apple Health和电子病历🏥。上传血检报告它帮你用大白话解释指标,还能生成就诊提问清单(✧∀✧)。健康数据独立加密存储,不用于模型训练。目前仅向小范围用户💡开放测试。 谷歌课堂上线Gemini播客工具。
+教师输入课程主题就能🎙️自动生成播客风格音频课(AI资讯),专门为Z世代设计。支持主持人+嘉宾对话式呈现,还能加背景音乐💡。一位老师反馈学生完听率达92%(比读PDF高一倍)。多语言支持一键生成,碎片化学习神器(✧∀✧)。 腾讯开源HY-Motion1.0。
+腾讯混元发布🔥文生3D动作大模型(AI资讯),十亿参数基于DiT架构。能生成200多种动作类别,从日常走路到💪体育竞技都覆盖。输出直接接入Unreal和Unity,开箱即用(✧∀✧)。项目已在HuggingFace(AI资讯)开源。 V-Agent多模态视频搜索。
+新论文提出🔍V-Agent视频搜索系统(AI资讯),微调VLM就能同时理解画面和语音。三个Agent协作💡处理用户意图,在MultiVENT2.0测试集达到SOTA零样本性能。视频帧和语音转文字被嵌入同一空间(✧∀✧),模型已开源。 PhysVideoGenerator物理感知视频生成。
+这篇论文让视频生成模型🎬学会物理规律(AI资讯),解决物体碰撞不自然的问题。用V-JEPA2提取物理特征注入生成过程💡,重力和时序一致性都变好了。目前是概念验证阶段,训练稳定性已验证(✧∀✧)。 ThinkRL-Edit推理式图像编辑。
+新框架让图像编辑模型🧠先思考再动手(AI资讯),用思维链采样探索多种方案。传统方法只在去噪时随机,这个在语义层面就开始探索💡。用二元检查表替代模糊评分,效果显著超越之前工作(✧∀✧)。 MiniMax港股暗盘涨15%。
+继智谱AI后又一家🔥大模型公司上市,MiniMax(AI资讯)募资41.89亿港元。暗盘最高199.8港元,市值逼近600亿💰。资金主要投入下一代多模态模型和自研芯片,国产大模型进入价值兑现阶段(✧∀✧)。盈利压力和国际竞争是未来挑战。 蚂蚁阿福月活飙至3000万。
+一个月从1500万涨到🚀3000万用户(AI资讯),OpenAI紧急跟进推ChatGPT Health。蚂蚁阿福打通了咨询-问诊-就医全链路💡,接入5000家医院和十大品牌设备。ChatGPT Health目前还停留在信息辅助阶段(;′⌒`)。中美AI健康路径分化明显。 谷歌急聘AI质检员。
+谷歌正面临🔥搜索质量信任危机(AI资讯),AI概述频繁出现幻觉。同一问题两次问出400万到7000万不等的错误答案(;′⌒`)。更严重的是医疗建议给出致命指导💡,招聘信息首次间接承认功能缺陷。 恶意Chrome扩展窃取AI对话。
+两款伪装成AI工具的💀恶意扩展(AI资讯)下载量超90万次。专门针对ChatGPT和DeepSeek窃取聊天记录,其中一款还获得谷歌精选徽章(;′⌒`)。定期把浏览URL和敏感词发送到远程服务器,已被下架💡。 claude-mem自动会话记忆。
+这个Claude Code插件(AI资讯)⭐12.3k,能自动捕获编程会话中所有操作🔥。用AI压缩后注入未来会话,上下文不再断片(✧∀✧)。基于Claude的agent-sdk开发💡,对长期项目特别友好。 ComfyUI-LTXVideo视频生成。
+Lightricks官方出的🎬ComfyUI视频支持(AI资讯)⭐2.5k,LTX-Video模型接入变得超简单。工作流拖拽就能用💡,生成质量不错(✧∀✧)。 memU记忆基础设施。
+面向LLM和🤖Agent的记忆系统(AI资讯)⭐3.6k,解决长期记忆管理问题。NevaMind团队开发💡,让AI真正记住你说过啥(✧∀✧)。 VideoRAG视频对话。
+港大出品的📹视频检索增强生成(AI资讯)⭐1.9k,KDD2026论文配套代码。能跟视频内容直接对话💡,理解画面还能回答问题(✧∀✧)。 MiroThinker搜索智能体。
+号称🔍全球最强搜索Agent(AI资讯),30B模型跑出1T级性能。支持256K上下文和400次工具调用💡,在BrowseComp测试全球第一梯队(✧∀✧)。像科学家一样主动查证自我修正,在线体验(AI资讯)已开放。 MOSS语音识别能标说话人。
+@Gorden_Sun分享🎤复旦团队的MOSS Transcribe Diarize(AI资讯),不仅识别语音还能区分不同说话人💡。支持多语言最长90分钟音频,国内用不了Gemini的替代方案(✧∀✧)。Demo已开放(AI资讯)。 Gemini CLI支持Agent Skills。
+@Jimmy_JingLv说继Codex之后🎉Gemini CLI也支持技能插件(AI资讯)了,v0.23.0更新💡。http://AgentSkills.me今年全力押注agents(✧∀✧)。 Claude Code画Canvas超好用。
+@vista8分享用🎨Obsidian CEO写的Canvas技能(AI资讯),让Claude搜索清朝皇帝然后画可视化图谱💡。画组织结构图产品架构图都行(✧∀✧)。 智谱上市z.ai出海经验。
+@op7418转发🔔智谱敲钟日子玄的出海总结(AI资讯),介绍z.ai如何在海外快速提升影响力💡。做出海没头绪的可以参考(✧∀✧)。 Planning with Files复现Manus。
+@shao__meng推荐📁用Markdown当AI外挂大脑的Claude技能(AI资讯),解决记忆波动和目标漂移问题💡。三个文件管理任务清单研究笔记和最终产出(✧∀✧)。 黄仁勋自嘲中美同时吊打。
+@dotey转发🤣黄仁勋幽默发言:我们是历史上第一家被中美同时吊打的公司(AI资讯)💡。 AI决定谁升职引争议。
+Reddit热帖讨论🤔AI自动决定升职加薪(AI资讯),调查显示60%经理已在用AI做这事💡。打字速度和邮件都被监控(;′⌒`)。AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙今日摘要
傅利叶GR-3亮相CES具备55自由度主打陪伴
+小鹏二代VLA量产实现视觉驱动初阶L4能力
+OpenAI推健康版连接Apple Health解读血检
+MiniMax港股募资42亿国产大模型进入变现期
+蚂蚁阿福月活破3000万打通咨询问诊全链路
+产品与功能更新


前沿研究
行业展望与社会影响

开源TOP项目

社媒分享


AI资讯日报语音版
]]>🎙️ 小宇宙 📹 抖音 来生小酒馆 自媒体账号 

Nerd语言专供机器读写,视频生成实现时空解耦
-特斯拉FSD横穿美国零接管,端到端技术大胜利
-谷歌DeepMind合体逆袭,Gemini重夺行业高地
-Memos笔记开源支持自托管,LEANN优化RAG存储
-Qwen接棒Llama地位,Reddit陷数据自我吞噬
-Nerd:给机器看的编程语言。 -这是一门不给人看的新编程语言(AI资讯)。专为AI模型🧠设计而非人类。作者称机器生成代码☁️占比近半。引发关于调试⚠️和审计的激烈争议。这究竟是未来还是歧途(AI资讯)?
SpaceTimePilot:视频生成大突破。 -视频生成迎来🚀重大突破。新模型SpaceTimePilot(AI资讯)实现时空解耦。单目视频也能随意改变🎥视角。动态场景生成(✧∀✧)不再是难题。训练方案利用了多视角数据(AI资讯)。
HEAR:量化评估音乐审美。 -音乐审美也能被🤖量化评估?HEAR框架(AI资讯)挑战这一难题。结合多尺度特征提取🎶旋律美感。分层增强策略防止❌过拟合。在SongEval基准(AI资讯)上表现优异。
特斯拉FSD横穿美国零接管。
-马斯克十年前的🚗豪言终于成真。特斯拉FSD完成横穿美国(AI资讯)壮举。全程近4400公里竟😲零接管。端到端神经网络💡彻底胜利。方向盘或许真要退出历史舞台(AI资讯)了。
谷歌三年卧薪尝胆终逆袭。 -谷歌三年隐忍终于🦁逆袭。从ChatGPT发布时的红色警报(AI资讯)开始。到Gemini全线开花🌸重夺高地。合并DeepMind结束⚡资源内耗。创始人布林回归亲自写代码(AI资讯)。
Memos:开源笔记自托管神器。 -这是一款开源笔记(AI资讯)神器。⭐4.7w星标证明其🔥火爆程度。数据完全掌握在自己✊手中。无广告且支持自托管☁️部署。
LEANN:万物皆可RAG。 -在个人设备运行RAG应用(AI资讯)。实现快速准确且🔒完全隐私。节省高达97%的💾存储空间。让万物RAG成为可能(✪ω✪)。
Bedrock Agent:企业级智能体。 -亚马逊推出的智能体样本(AI资讯)。加速AI智能体🚀投入生产环境。具备企业级的🛡️安全性。确保大规模部署的☁️可靠性。
非技术人员用Agent编程。
-不懂代码也能用🤖Agent开发。Ben Tossell分享实战经验(AI资讯)。通过终端CLI指挥AI干活🛠️。无需精通语法也能🚧构建项目。AI正在创造新的技术阶层(AI资讯)。
二十元支架打造AI阅读伴侣。
-几块钱支架搞定懒人读书(AI资讯)。反向夹住手机打开📹豆包App。摄像头对着屏幕或📚书本。随时提问让AI陪你🧠阅读。
Reddit数据沦为AI衔尾蛇。 -Reddit正被AI生成内容(AI资讯)填满。公司花钱买数据训练🌪️模型。模型生成内容又回到🔃Reddit。数据贪吃蛇正在咬自己的尾巴🐍。
警惕Manus成功学幸存者偏差。 -别盲目迷信Manus的成功学(AI资讯)。这种特殊案例难以📝复制。创业更多是坚持加🍀偶然突变。应该关注其被收购的💰影响。
Qwen上位与MCP新架构。 -Qwen正在接过Llama的👑权杖。MCP协议成为新的AI入口(AI资讯)。便宜可靠的架构🏗️战胜暴力美学。系统化智能时代⏰将来临。
| 🎙️ 小宇宙 | 📹 抖音 |
|---|---|
| 来生小酒馆 | 自媒体账号 |
![]() | ![]() |