AI资讯|每日早读|全网数据聚合|前沿科学探索|行业自由发声|开源创新力量|AI与人类未来| 访问网页版↗️ | 进群交流🤙
阿里Qwen3-TTS新增49种声音支持10语言8方言
微软开源VibeVoice仅0.5B参数实现300ms响应
谷歌Gemini3 Deep Think推理模式ARC-AGI测试达45.1%新高
@@ -21,10 +21,10 @@ AI编程代理SUSVIBES测试功能正确率61%但安全率仅10.5%
阿里通义千问发布Qwen3-TTS新版本。
新增49种🚀高品质声音,涵盖可爱、睿智等多种风格,支持10种语言及8种方言(闽南语、粤语等)。语速和节奏高度拟人(AI资讯),播报自然度令人惊叹(✧∀✧)。用户可通过千问聊天、实时API或离线API(AI资讯)体验功能。
微软开源VibeVoice实时语音模型。
该模型仅0.5B参数,却实现300ms🔥极速响应,支持90分钟超长音频生成。最多支持4人多角色对话(AI资讯),情绪识别精准,中英文双语播报自然(✧∀✧)。模型在HuggingFace和GitHub完全开源,显存占用不到2GB,适合本地部署💡。
谷歌Gemini3 Deep Think推理模式上线。
-该模式面向Ultra订阅用户,在数学、逻辑等复杂问题上表现🚀出色。未使用工具时,人类最后的考试得分41.0%;使用代码执行时,ARC-AGI-2测试达45.1%历史新高(AI资讯)。采用并行推理技术,同时探索多个假设(✧∀✧),推理能力显著提升💡。
NotebookLM角色定制字符数扩展至10000。 +该模式面向Ultra订阅用户,在数学、逻辑等复杂问题上表现🚀出色。未使用工具时,人类最后的考试得分41.0%;使用代码执行时,ARC-AGI-2测试达45.1%历史新高(AI资讯)。采用并行推理技术,同时探索多个假设(✧∀✧),推理能力显著提升💡。
NotebookLM角色定制字符数扩展至10000。
之前仅支持500字符,现在用户可为AI设定更复杂的角色身份(AI资讯),如产品经理、科研助理等。AI回答会更贴近预期🚀,理解资料时更有角色意识(✧∀✧)。官方提供三种高级示范:产品经理、初中教师、科研助理💡。
OpenAI发布GPT-5.1-Codex Max API。
该模型已接入Cursor等编程工具(AI资讯),提供低、中、高三种推理级别🔥。付费用户限时免费使用低推理级别,代码能力显著提升(✧∀✧)。Windsurf平台也已向所有用户开放该模型💡。
谷歌突破Transformer长文本瓶颈。
-发布Titans架构和MIRAS框架,推理阶段可将上下文扩展至200万token(AI资讯)。Titans兼具RNN速度和Transformer性能🚀,通过神经长期记忆模块动态更新权重(✧∀✧)。"大海捞针"任务准确率高,突破了自注意力机制效率瓶颈💡。
NeurIPS 2025最佳论文聚焦Gating机制。 +发布Titans架构和MIRAS框架,推理阶段可将上下文扩展至200万token(AI资讯)。Titans兼具RNN速度和Transformer性能🚀,通过神经长期记忆模块动态更新权重(✧∀✧)。"大海捞针"任务准确率高,突破了自注意力机制效率瓶颈💡。
NeurIPS 2025最佳论文聚焦Gating机制。
研究测试超30种gating变体,模型参数达150亿(AI资讯)。逐元素gate效果最佳🔥,训练更稳定、支持更高学习率(✧∀✧)。大幅减少"attention sinks"现象,长文本性能显著提升💡。
扑克AI框架Patrick挑战传统solver理念。
该AI不追求不可剥削的完美打法(AI资讯),而是专注最大化剥削对手🚀。通过预测锚定学习方法理解人类心理缺陷,64267手试验中表现盈利(✧∀✧)。论文挑战"solved myth"理论,提出掌握人类不完美性才是关键💡。
AI生成内容与假新闻级联传播研究。
研究分析Reddit五个社区中虚假信息和AI图像传播机制。框架整合文本情感、视觉属性和扩散指标,预测即时病毒性AUC=0.83(AI资讯)。长期级联传播预测AUC=0.998🔥,为合成和误导性视觉内容审核提供重要见解(✧∀✧)。
AudAgent工具守护AI代理隐私合规。