From d5a718578b5aa590af1a31d15d788ff0013b2166 Mon Sep 17 00:00:00 2001 From: GitHub Action Date: Wed, 2 Jul 2025 23:55:09 +0000 Subject: [PATCH] =?UTF-8?q?docs:=20=E8=87=AA=E5=8A=A8=E6=9E=84=E5=BB=BA?= =?UTF-8?q?=E6=97=A5=E5=88=8A=E5=B9=B6=E5=BD=92=E6=A1=A3=E6=97=A7=E6=9C=88?= =?UTF-8?q?=E4=BB=BD=20(Wed=20Jul=20=202=2023:55:09=20UTC=202025)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- rss.xml | 55 ++- src/SUMMARY.md | 3 +- today/book/2025-07-02.html | 333 ------------- today/book/2025-07-03.html | 333 +++++++++++++ today/book/daily/2025-07-02.html | 4 +- today/book/daily/2025-07-03.html | 339 +++++++++++++ today/book/index.html | 120 ++--- today/book/print.html | 810 ++++++++++++++++++------------- today/book/searchindex.js | 2 +- today/book/toc.html | 2 +- today/book/toc.js | 2 +- 11 files changed, 1231 insertions(+), 772 deletions(-) delete mode 100644 today/book/2025-07-02.html create mode 100644 today/book/2025-07-03.html create mode 100644 today/book/daily/2025-07-03.html diff --git a/rss.xml b/rss.xml index fc6fe2c..dae4ed2 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,37 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Wed, 02 Jul 2025 01:09:44 GMT + Wed, 02 Jul 2025 23:55:09 GMT + + <![CDATA[2025-07-03日刊]]> + https://ai.hubtoday.app//2025-07/2025-07-03/ + https://ai.hubtoday.app//2025-07/2025-07-03/ + Thu, 03 Jul 2025 03:29:09 GMT + AI洞察日报 2025/7/3

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI内容摘要

谷歌发布教育AI助手和跨应用整合的Gemini Live。百度推出首个中文音视频生成模型MuseSteamer,并升级搜索。
+微信AI搜索引隐私担忧。研究揭示大模型内源性奖励,智谱开源视觉模型。亚马逊因AI预测裁员,学术论文现AI作弊。
+业界聚焦AI智能体,编程界正被大模型重塑,强调提示词与上下文工程对AI Agent的重要性。
+

AI产品与功能更新

  1. 谷歌贴心地推出了专为学生和教育工作者打造的免费AI助手Gemini for Education!🤔 它基于强大的Gemini 2.5 Pro模型和智慧的LearnLM,旨在让师生工作学习更高效。从老师的快速备课、个性化教学内容、自动出题,到学生的写作、复习、资料查询和语音学习,统统都能搞定,而且还特别注重数据隐私与安全,真是教育界的"神队友”啊!💡📚🔒 更多详情
    谷歌教育AI助手

  2. 百度商业研发团队放了个大招!🚀 他们推出了全球首个中文音视频一体化生成模型MuseSteamer及其创作平台绘想。这模型可厉害了,能把画面、音效和人声台词完美融合,轻松生成高质量视频内容,简直是视频创作者的福音!🎬 它还在权威榜单VBench I2V中拔得头筹,极大地降低了视频创作门槛,看样子未来的内容创作模式要被它颠覆了!🌟 +
    百度AI技术展示

  3. 微信新推出的AI搜索功能,本意可能是好的,结果却因为能把人名自动转成超链接并生成个人简历,引发了用户们对隐私泄露的巨大担忧!😮‍💨 大家纷纷吐槽这简直是"强行开盒”!对此,腾讯赶紧出来解释,说这功能只是整合了公众号和互联网上的公开信息啦,并且承诺会进一步优化AI搜索的用户体验。希望真能让用户安心吧!🕵️‍♀️🛡️ +

  4. 百度搜索最近可真是大手笔!🔄 在AI Day开放日上,他们宣布进行了十年来最大规模的改版,全面升级了"智能框”、"百看”和"AI助手”三大核心功能,让用户能更轻松地进行多模态输入和创作。这次改版还巧妙地接入了百度自家研发的MuseSteamer模型和"绘想”平台,这意味着百度在AIGC中文视频创作领域取得了里程碑式的突破!💡🎬 +

  5. Google的AI助手Gemini Live迎来了一次超级大升级!🤝 它将和Google MapsGoogle CalendarGoogle Keep以及Google Tasks等应用深度整合,以后你只要动动嘴或敲敲字,就能轻松实现跨应用智能操作啦!🌐 这波升级旨在大大提升生产力,打造一个高度整合的智能助手生态。未来,它还会连接更多Google生态应用,同时谷歌也承诺会把用户隐私放在心上。✨🚀 +
    谷歌AI助手Gemini

  6. 武汉市汉阳区率先亮出黑科技!🛵 他们推出了全国首辆搭载AI技术的"智音车”外卖配送车。这辆车简直是"智能快递员”的升级版,配备了北斗双频芯片,让配送效率飙升30%!💨 而且还能实现人车智能管理和1米级的精准定位。这款由北斗和雅迪联合研发的智能配送工具,多项先进技术加持,不仅提升了配送安全和效率,也为未来的智能交通描绘了新蓝图。📍✨


  7. OpenRouter平台近日上线了一款名叫"Cypher Alpha”的神秘模型!🕵️‍♀️ 它免费提供惊人的100万token上下文和强大的推理能力,立刻引爆了网友们的热烈讨论,大家都在猜测它是不是OpenAI的"亲儿子”呢?🤯 尽管它的性能(尤其是在复杂推理方面)还有待提升,但这次事件无疑预示着AI模型领域持续不断的技术探索社区互动。💬✨ 更多详情模型地址
    Cypher Alpha模型
    Cypher Alpha界面

AI前沿研究

  1. 南京大学周志华教授团队传来好消息!🤯 他们首次理论证明了在大语言模型(LLM)中,竟然潜藏着一个"内源性奖励模型”!🔬 这意味着,我们以后可以更有效地利用强化学习(RL)来提升模型表现,而且还不需要依赖大量的人类反馈数据,这可真是太棒了!💡 这项突破不仅大大降低了大语言模型的开发成本,提高了效率,还预示着人工智能将能得到更广泛的应用。📈 +
    南京大学Logo

  2. 智谱AI近日扔出了一个重磅炸弹!✨ 他们开源了基于GLM-4V架构的新一代通用视觉模型GLM-4.1V-Thinking。这款模型超厉害,通过新增思维链推理机制,在处理复杂认知任务时能力显著提升,而且在多项权威评测中表现都非常出色!🧠 它支持图像、视频等多种模态输入,性能超越了不少同级别甚至更大参数的模型,更让人惊喜的是,它还提供免费商用授权!🚀 全球开发者们,快去项目地址体验吧!🆓 +

  3. 央广播电视总台(CMG)要搞大事情啦!🐾 7月6日上午10:30,他们将直播世界机器人技能大赛的首场机器狗任务赛!届时,酷炫的"黑豹2.0”机器狗将挑战极限任务,甚至还会上演一场惊心动魄的百米人机对决!🤖 这场大赛可不只是为了看热闹,它旨在全面评估机器狗在火灾、地震等极端应急救援环境下的综合能力,有望推动机器人在此领域的进一步发展,守护我们的安全!🔥🏆 +
    机器狗特写

  4. 一篇深入探讨通用人工智能(AGI)认知基础及其社会影响的论文新鲜出炉!🧠 它指出,真正的智能远超当前令牌预测模型的局限,必须通过整合模块化推理持久记忆多智能体协调才能实现。文章强调,Agentic RAG框架记忆和推理的深度结合是迈向通用智能的关键路径。当然,论文也坦诚指出了实现AGI所面临的科学、技术和伦理挑战,未来可期,挑战也并存!💡🌐🚧 论文地址

AI行业展望与社会影响

  1. 亚马逊CEO安迪・贾西最近发出了一个信号:💼 随着人工智能技术的飞速发展,亚马逊未来将面临更多裁员!😮‍💨 这不是空穴来风,因为AI正在推动办公室和仓库工作自动化,自然就减少了对员工的需求。不过,别太悲观,亚马逊正积极投入至少200亿美元建设人工智能数据中心,并且还在大力招聘更多AI与机器人人才。🤖 这大概是为了适应技术变革,同时也能让员工们从重复性工作中解放出来,去完成更具创造性的任务吧!🤔 +

  2. 一项最新调查简直让人惊掉下巴!😱 全球至少14所顶尖大学的论文中,竟然被"偷偷”植入了AI可读的秘密指令,目的就是为了诱导AI审稿提高评分!🎓 这事儿一出,立刻引发了关于学术诚信和"提示词注入”攻击的轩然大波。🚫 这不仅严重威胁了学术同行评审的公正性,也迫使学术界和各国政府必须加速制定更严格的AI使用规范,以应对这些潜在的风险。🕵️ +
    学术论文
    AI审核概念

开源TOP项目

  1. scira (原 MiniPerplx)是一款拥有8825颗星的极简AI驱动搜索引擎!🌟 它利用了Vercel AI SDKxAI的Grok 3等先进模型,能帮你高效查找互联网信息,并且还会贴心地提供引用来源。🔍💡 项目地址

  2. Mastering-GitHub-Copilot-for-Paired-Programming是一个获得了6113颗星的多模块课程!🌟 它旨在手把手教你如何将GitHub Copilot作为AI结对编程的得力助手,高效地利用起来。👨‍💻🤖 项目地址

  3. ntfy是一个星标数高达24220的开源项目!🌟 它的超实用功能就是能让用户通过简单的PUT/POST请求,直接向手机或桌面发送推送通知,实现便捷的消息推送。📱🔔 项目地址

社媒分享

  1. 小互最近激动地分享了Topview AI推出的手持产品数字人新版本"Topview Avatar 2”!🤩 他直呼效果"很哇塞”,特别适合出海电商。这款产品简直是电商福音,只需一张产品图和模特图,就能生成逼真的数字人带货视频,还支持任意产品尺寸、Prompt自定义数字人形象以及多语言,这预示着未来营销可能真的不再需要真人模特了!🛍️🌍🎬 +
    更多详情

  2. 与梓可栖在社交媒体上详细列出了VC行业专业人士对AI Agent的"饥渴”需求!💼 这些痛点简直是他们日常工作的"拦路虎”,包括自动化报销多端会议管理(带笔记和截屏)、智能会议排程,甚至是线下拜访规划。🤖 除此之外,他们还期待募投管退项目流程的智能跟踪、像"Map穷举”这样提升拜访前提效的工具,以及文章和播客的智能提炼与RAG搜索等强大功能。📊🗺️ +更多详情

  3. 杨溢推出了"归藏(guizang.ai)”,致力于通过Gemini CLI,提供无需代码的多种高效方法!💡 它涵盖了批量修改系统设置、文档编辑、PPT生成、音视频及图片处理,以及文件格式转换等功能。👨‍💻 他还分享了详细教程和案例,帮助普通用户也能轻松利用AI工具,低门槛地提高效率。⚡ +更多详情
    归藏AI应用界面

  4. 张翼ZYi真是数据分析的高手!📈 他通过分析头部20个All in one AI站的30万条外链,总结出了一套选择优质外链的量化标准。🔍 核心就是:优先考虑产品起步阶段新增的外链、外部链接少、AS高但要结合流量判断,以及非站点模板区链接。这些标准不仅能固化为SOP,还能利用Cursor等工具自动化筛选竞品外链,大大提高效率!🤖 +更多详情

  5. 黄赟根据Min Choi的经验,分享了运营Twitter (𝕏) 的三条核心策略!🐦 首先,要坚持日更并"抱大腿”;其次,积极"商业互吹”能增加曝光;最后,要巧妙利用AI(比如Grok或ChatGPT)作为内容顾问。他强调,在社交媒体上,内容和个人影响力远比直接的收入分成更有价值,因为它们能带来更广阔的网络和品牌机会。🤝💡🌟 +更多详情
    Twitter分享图

  6. 萌少分享了a16z的犀利观点,指出AI正在通过大语言模型重塑编程界!🤖 这不仅大幅提升了开发效率,还降低了新人入门的门槛,预计能为全球开发者市场带来数千亿美元的价值提升。💻 这预示着未来的软件开发将不再是依赖Stack Overflow苦苦寻觅答案,而是与AI协作,开发者将更侧重表达意图和边干边学,而不是被取代。🚀✨ +更多详情
    AI编程概念图

  7. 宝玉的博文深度剖析了提示词(Prompt)提示词工程(Prompt Engineering)上下文工程(Context Engineering)之间的微妙区别!🧠 他解释说,提示词是给AI模型的"指令”;提示词工程则是系统化设计、测试和优化这些指令的过程;而上下文工程,则是为大语言模型提供恰当信息和工具,以最高效地完成任务的艺术与科学,尤其对于AI Agent来说,这可是至关重要的"内功”!💡🛠️ +更多详情上下文工程图


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆来生情报站
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-07-02日刊]]> https://ai.hubtoday.app//2025-07/2025-07-02/ @@ -130,30 +158,5 @@ AI安全公司XBOW漏洞检测超人,大模型高考成绩达985水平。 - - <![CDATA[2025-06-26日刊]]> - https://ai.hubtoday.app//daily/2025-06-26.html - https://ai.hubtoday.app//daily/2025-06-26.html - Thu, 26 Jun 2025 00:42:33 GMT - AI洞察日报 2025/6/26

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI内容摘要

AI产品更新频繁,谷歌发布机器人本地AI。科大讯飞医疗大模型达专家级。
-夸克高考志愿服务火爆,正扩充算力。Rokid眼镜量产,斩获大量订单。
-AI研究在多模态、3D重建有突破。周鸿祎谈AI无法替代人类情感创意。
-

AI产品与功能更新

  1. Google DeepMind发布了Gemini Robotics On-Device,这是一款专为机器人设计的本地运行AI模型 🤖。它基于多模态推理Gemini 2.0模型,能让机器人在没网时也能快速学习新任务、稳定工作,甚至完成折叠衣物等精细操作 ✨。这无疑为具身智能的未来发展打下了坚实基础,开启了新篇章! -
    机器人操作演示

  2. 高考志愿填报火热,夸克的智能志愿报告服务因为太多人使用而出现排队现象,累计已生成超300万份报告 📈,这足以看出同学们对它AI能力的信任。面对这份"甜蜜的烦恼”,阿里巴巴集团副总裁吴嘉霸气回应,表示团队已紧急扩充算力,誓要让每个学子都能顺利拿到这份重要的升学指南!💪 -
    夸克志愿报告页面

  3. 灵伴科技(Rokid)与蓝思科技共同开发的消费级AI+AR眼镜Rokid Glasses,已经正式实现大规模量产啦!👓✨ 这款眼镜凭借其轻量化设计,并集成了智能提词、实时翻译、AI识物等多种AI大模型能力,目前已斩获25万台全球预售订单!这预示着中国AI眼镜市场即将迎来一次商业化爆发,未来可期!🚀 -
    Rokid Glasses眼镜

  4. Google在2025年Cloud Next大会上,展示了基于Gemini模型的下一代客户服务智能助手 🤖。这个助手可厉害了,不仅能多模态交互,还能自己申请折扣优惠,并深度整合了Salesforce CRM系统!这预示着客户服务即将迎来一场智能化的巨大变革 💥,不过它的准确性和隐私保护方面,我们还得再等等看哦~ 😉 -
    Google智能助手

  5. 科大讯飞重磅发布了基于全国产算力训练的星火医疗大模型V2.5国际版 🚀!这款模型在权威平台MedBench上以98.4分傲居榜首,其综合诊疗能力已经达到了三甲医院主治医师的水平,在完整性、实用性和可读性上更是超越了人类医生!👨‍⚕️🩺 它还支持多语言,未来有望在全球医疗市场大放异彩,推动国际医疗技术交流与合作呢!🌍✨ -
    科大讯飞星火模型

  6. ElevenLabs终于推出了独立的文本转语音移动应用啦!📱✨ 无论是iOS还是Android用户,现在都能随时随地生成语音片段了。免费用户也能享受大约10分钟的音频生成时间哦!这款App不仅采用了最新的v3alpha模型,还支持情感表达控制,未来还会加入语音转文本和对话式AI工具,真是太方便了!🗣️ -
    ElevenLabs手机应用

AI前沿研究

  1. 由ETH Zurich、斯坦福大学和微软团队联手推出了SuperDec,它正打破传统3D重建的局限 🤯!这项技术运用创新的超四面体原理,能实现紧凑又生动的3D场景表示。不仅能高效处理复杂的点云数据,还在机器人技术的精准抓取、路径规划,以及可控视觉内容生成等方面展现了巨大潜力,为数字世界开辟了新视野!👀 项目地址

  2. 4D-LRM是一款超酷的创新型大型时空重建模型 🤩。它能仅凭少量视角输入,就完整重建动态物体4D表示(三维空间加上时间维度),实现从任意时间、任意视角生成高质量场景!未来,它有望在虚拟现实、影视制作、工业仿真等领域大展拳脚呢!🌟 论文地址

  3. 字节跳动和上海交通大学联手发布了ProtoReasoning框架 👏。它巧妙地利用PrologPDDL等结构化原型表示,显著增强了大语言模型逻辑推理能力以及跨领域知识转移的效率 🚀。这项研究为未来推理原型的理论探索奠定了坚实基础,真是棒极了! 论文地址

  4. 香港大学MMLab、香港中文大学MMLab和商汤科技联手开发了GoT-R1框架,这项突破性研究通过引入强化学习,大大提升了多模态大模型视觉生成任务中的语义-空间推理能力 🚀,让模型能自主学习更棒的推理策略!它不仅摆脱了GoT框架对模板的依赖,更在复杂场景生成上达到了SOTA性能,太厉害了!✨ 论文地址

AI行业展望与社会影响

  1. 周鸿祎最近在视频里聊到人工智能的未来,他认为AI就算再厉害,也永远无法完全替代人类在情感理解 💖、复杂问题解决 🧠 和创造性思维 🎨 这三大方面的独特能力。他强调,未来的工作将更多地变成管理与训练AI,还拿瑞典一家公司AI客服的失败案例来证明,AI在处理复杂客户需求时还是有局限的。🧐 -
    周鸿祎演讲

  2. 联邦法官威廉·阿尔苏普做出了一项开创性的裁定:Anthropic公司在未经许可的情况下,使用版权书籍训练AI模型的行为被认为是合理使用!😮 这为AI行业的版权争议树立了一个重要的先例。不过,Anthropic还是因为从盗版网站获取训练材料而面临盗窃指控,真是喜忧参半啊~ 🤔 -
    法官在法庭上

开源TOP项目

  1. Dioxus是一个拥有28310颗星的超人气全栈应用框架 ⭐!它就像一个全能工具箱,旨在为开发者提供统一的解决方案,轻松搞定Web、桌面和移动平台的应用程序开发,大大简化了跨平台开发的复杂性!💻📱 项目地址

  2. jsoncrack.com是一个拥有38020 Stars的明星项目 ⭐!它是一款创新的开源可视化应用程序,能把JSONYAMLXMLCSV等多种数据格式瞬间变成交互式图表 📊,大大提高了数据的可读性和分析效率,简直是数据爱好者的福音!😍 项目地址

  3. free-for-devDevOps基础设施开发人员的宝藏项目啊!✨ 它坐拥惊人的100044 Stars,是一个超级实用的开源项目,专门整理并提供了SaaS、PaaS和IaaS服务的免费套餐列表。这简直是为开发者量身定制的省钱、省时神器!💰⏰ 项目地址

社媒分享

  1. 杨毅激动地分享了Google AI开发者推出的Gemini CLI,这简直是个"赛博菩萨”啊!🤩 这个开源AI代理能把Gemini 2.5 Pro直接搬到你的终端,支持高频率免费使用,轻松搞定代码编写、调试和任务自动化!他觉得这是解决目前工具不足的"很顶”方案,特别在MCP部署和GitHub搜索方面,潜力无限!🚀 - 更多详情:'更多详情'

  2. 小互惊呼发现了一个"牛P”的AI设计网站!简直是设计师的福音啊!🎨✨ 它能生成精美又直接能用的界面,还大幅简化了设计提示词要求。更厉害的是,它不仅能根据简单描述给出详细设计方案,还能基于上下文逻辑生成多级页面,甚至支持对元素进行精准编辑,大大提升了设计效率和自由度!😍 - 更多详情:'更多详情'

  3. 杨毅觉得AI歌手Yuri是首个真正"破圈”的AI Influencer!🎤🔥 这位来自Surreal旗下的AI歌手,不仅成功与The North Face合作,她的作品播放量更是突破了700万!这充分展现了AI在虚拟偶像领域日益增长的影响力与商业潜力,预示着一个激动人心的新时代已经到来啦!🎉 - 更多详情:'更多详情'

  4. 支付宝真是走在前沿!✨ 他们推出了首个AI打赏服务,允许开发者在自己的智能体里集成这个功能,这样用户就能给喜欢的智能体"送花花”啦!💰💖 '更多详情'

  5. 谷歌放大招啦!🎉 他们在AI Studio里免费开放了强大的Imagen 4Imagen 4 Ultra图像模型!🤩 现在,用户可以在Gemini API和AI Studio免费体验这些超赞的图像生成模型了,快去试试吧!🎨 '更多详情'
    Imagen模型界面

    Imagen模型生成图像

  6. Anthropic的Claude Artifacts要更新啦!🥳 用户以后可以在Artifacts Gallery里浏览、分享热门网页创意,还能直接通过Claude API创建AI前端应用,想想都觉得超酷炫!💻✨ '更多详情'
    Claude Artifacts界面

  7. Zero君聊AI分享了一个24小时内播放量突破五千万的AI视频,他一针见血地指出,当前爆款AI视频的秘诀在于一个字——"离谱”!😂 而不是追求拟人。常见的爆款主题包括ASMR、动物奥运会和AI自然灾害等。想看更多"离谱”视频?点击 '此处' 就能了解更多哦! -

  8. Tom Huang分享了20个超实用的编程Prompt小技巧 💡,还透露Warp正在大力开发一款类似Claude Code的终端Agent。虽然这个Agent是按次收费,但据说只要用一次就能把本钱赚回来!😱 简直是程序员的效率神器啊!🚀 更多详情,快点击 '此处' 围观吧! -
    编程Prompt技巧


收听语音版

🎙️ 小宇宙📹 抖音
来生小酒馆来生情报站
小酒馆情报站
]]>
- -
- \ No newline at end of file diff --git a/src/SUMMARY.md b/src/SUMMARY.md index deb04d2..dd75f46 100644 --- a/src/SUMMARY.md +++ b/src/SUMMARY.md @@ -1,8 +1,9 @@ # Summary -[Today](2025-07-02.md) +[Today](2025-07-03.md) # 2025-07 +- [07-03-日刊](daily/2025-07-03.md) - [07-02-日刊](daily/2025-07-02.md) - [07-01-日刊](daily/2025-07-01.md) # 2025-06 diff --git a/today/book/2025-07-02.html b/today/book/2025-07-02.html deleted file mode 100644 index cc6793f..0000000 --- a/today/book/2025-07-02.html +++ /dev/null @@ -1,333 +0,0 @@ - - - - - - Today - AI 日报 By 何夕2077 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
-
-

Keyboard shortcuts

-
-

Press or to navigate between chapters

-

Press S or / to search in the book

-

Press ? to show this help

-

Press Esc to hide this help

-
-
-
-
- - - - - - - - - - - - - -
- -
- - - - - - - - -
-
-

AI洞察日报 2025/7/2

-
-

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

-
-

AI内容摘要

-
AI产品创新活跃:Perplexity推投资分析,字节发布XVerse图像合成。
-Anysphere推跨平台AI编码工具,阿里开源ThinkSound音频模型。
-微软研发AI医生MAI-DxO。Meta集中开发超级智能AI,数据是AI发展核心。
-
-

AI产品与功能更新

-
    -
  1. -

    Perplexity公司最近推出了一个超酷的新功能PerMAXity!😎 它能通过AI驱动自动化分析,帮你把投资组合里的每项资产都变成一份详细又专业的综合财务报告。简直是投资小白和专业大咖的福音啊!✨ PerMAXity不仅能帮你设置计划任务,还能整合实时市场数据和各种权威信息源,目标就是大幅降低人工分析成本,让你的投资决策更精准高效。感觉就像拥有了一个专属的AI理财顾问,炒股再也不怕盲投了!📈💰 -
    PerMAXity功能图

    -
  2. -
  3. -

    开发者们有福啦!🥳 Anysphere最近推出了Cursor Web版及移动版,这意味着他们的AI编码代理不再只局限于桌面IDE,现在在浏览器和手机上也能轻松编程啦!💻📱 这简直是解放生产力啊!新版本还用上了PWA技术,提供了像原生应用一样的流畅体验,让你能在不同设备上无缝管理AI编码任务,连"BugBot”这些核心功能都完美保留!💯 远程协作效率瞬间飙升,AI编码工具的使用方式也彻底被"重塑”了!未来可期啊!✨ -

    -
  4. -
  5. -

    字节跳动最近又秀了一波肌肉!💪 他们发布了创新的图像合成技术XVerse,简直是图像生成领域的"魔法师”!🧙‍♀️ 它能对多个人物进行独立且精准的控制,让高精度、多主体图像生成变得超个性化、超复杂!😮 这项技术基于独特的DiT调制方法,你只需要简单描述一下,就能生成超高保真的图像!🎨 想象一下,这得对数字内容创作、广告和艺术领域产生多大的冲击啊!🚀 XVerse未来有望成为行业新标准,期待它能带来更多惊喜!🤩 -
    XVerse图像合成示例

    -
  6. -
  7. -

    听!👂 阿里通义实验室又放大招了!他们7月1日开源了首个音频生成模型ThinkSound!这可不是一般的模型,它创新性地把思维链(CoT)引入了音频生成,能像专业音效师一样,根据视频画面细节生成高保真、与画面同步的音频!🎬 简直是"声”临其境啊!它在多项测试中都完胜现有技术,在影视音效音频后期游戏虚拟现实音效生成等领域潜力无限!🌟 这一技术突破通过模仿人类音效师的多阶段创作流程,解决了现有视频转音频技术难以捕捉动态细节的难题。目前代码和模型都开源了,开发者们快去体验吧!🆓🎵 -
    ThinkSound模型结构
    -
    ThinkSound生成效果

    -
  8. -
-

AI前沿研究

-
    -
  1. -

    微软最近真是放了个"大招”!🚀 他们发布了一款名叫MAI-DxOAI医生系统,能像真医生一样看诊:提问、开检查、分析结果,最后把病因"揪”出来。更厉害的是,这个系统能模拟多位医生协同工作,在测试了304个《新英格兰医学杂志》的疑难病例后,它的诊断准确率竟然高达85.5%!😱 这可比人类医生平均20%的准确率高出好几倍呢!它还能智能评估检查成本,简直是病患的福音。不过,目前它还在研究阶段,有待更多临床验证实际应用。🙏🩺 -
    MAI-DxO系统界面
    -
    MAI-DxO测试结果
    -'论文地址'

    -
  2. -
  3. -

    哇塞!🎨 一篇新论文介绍了一个名叫Calligrapher的创新扩散模型框架,这简直是设计师们的福音啊!🎉 它能把先进的文本定制技术和艺术排版完美结合,让你实现自由风格的文本图像定制!想怎么玩就怎么玩!✨ 这个框架通过自我蒸馏和局部风格注入机制,巧妙地解决了字体定制中精确风格控制和数据依赖的挑战,让高质量、视觉一致的排版自动化生成成为可能!未来,数字艺术品牌设计等创意领域将因此迎来一次大爆发!🚀 -'论文地址'

    -
  4. -
-

AI行业展望与社会影响

-
    -
  1. Meta公司最近搞了个"大动作”!😲 他们宣布内部重组,把所有AI团队都塞进了一个新成立的"超级智能实验室”(Meta Superintelligence Labs)!这摆明了是要集中火力开发"超级智能”AI啊!💪 这个实验室将由前Scale AI的CEO亚历山大・王掌舵,还吸引了谷歌DeepMind、Anthropic等公司的顶尖AI研究人员加入,简直是"众星云集”!✨ 这标志着Meta在人工智能领域战略性深化布局,看来未来AI的竞争会越来越激烈了!🤔 -
    Meta实验室标志
  2. -
-

开源TOP项目

-
    -
  1. -

    语音AI界又添一员猛将!💪 TEN Agent团队正式开源了他们的企业级实时语音活动检测器TEN VAD!🗣️ 这家伙厉害在哪儿?它能做到帧级精度的语音检测,性能比WebRTC VAD和Silero VAD都要牛,简直是打造实时对话语音助手的"核武器”!💥 它不仅低延迟高兼容性,还支持ONNX多平台部署,甚至能跟TEN Turn Detection联手,让对话更流畅!它的开源不仅能推动语音AI创新,还能降低计算成本,感觉语音交互的未来都要被它重塑了!✨ -'项目地址' -
    TEN VAD项目图

    -
  2. -
  3. -

    学习机器学习概念再也不用"烧脑”了!🔥 ManimML,这个基于Python的开源动画库简直是学习者的福音!它能把Transformer架构这类复杂的神经网络模型,用超级直观的动画形式展现出来!🎥 不仅操作简单,甚至还能用AI帮你生成定制动画,简直是学习利器!👍 由于它在AI教育和科普方面的巨大潜力,已经获得了1300多个星标,还荣获了IEEE VIS2023最佳海报奖!🌟 ManimML正在把那些"高大上”的复杂AI技术变得人人都懂,真是功德无量啊!🙌 -'项目地址' -
    ManimML动画示例

    -
  4. -
  5. -

    Graphite,这个拥有16956颗星开源图形编辑器,简直是创意设计师的"瑞士军刀”!🛠️ 它是一款全面的2D内容创作工具,无论是平面设计、数字艺术,还是交互式实时动态图形,它都能轻松搞定!✨ 最牛的地方在于它基于节点的程序化编辑能力,让你在创作时拥有超高的灵活性!想怎么改就怎么改,简直不要太方便!🎨 -'项目地址'

    -
  6. -
  7. -

    AdminLTE,这个坐拥44707颗星开源项目,简直是前端开发者的"救星”!🌟 它提供了一个基于Bootstrap 5的免费管理仪表盘模板,让你分分钟就能搭建出既美观又响应式的管理界面!🚀 省时省力又省心,简直是开发效率的"加速器”!💻 -'项目地址'

    -
  8. -
  9. -

    数据采集者们注意啦!📢 MediaCrawler,这个拥有24198星标开源项目,简直是解决多平台内容爬取难题的"利器”!⚔️ 它提供了针对小红书抖音快手B站微博百度贴吧知乎等主流社交媒体平台的内容及评论爬虫功能,让你轻松搞定数据采集!📊 再也不用为数据发愁了,简直是数据分析师的"福音”!🎉 -'项目地址'

    -
  10. -
-

社媒分享

-
    -
  1. -

    扎克伯格最近在社交媒体上"炫耀”了一把!😎 他宣布Meta成功招募了一大批顶尖AI人才,而且这些人才都来自OpenAI、Anthropic和谷歌这些行业巨头,阵容简直是"豪华天团”啊!🌟 Alexandr WangNat Friedman将联手管理这个新成立的AI实验室。此举不仅秀出了Meta在AI领域的雄厚财力,更展示了他们深远的战略布局!看来AI世界的"军备竞赛”越来越激烈了!⚔️ -
    扎克伯格宣布AI人才
    -
    新AI实验室管理团队
    -更多详情:'https://weibo.com/6182606334/Pz4iizz7F'

    -
  2. -
  3. -

    李继刚大佬最近分享了一个超有意思的恐怖小说创作提示词(Prompt),简直是AI写小说的"宝典”!📖 他不是让你直接"吓”人,而是引导AI慢慢地渗透不安感,那种细思极恐的感觉!😱 这个提示词强调要通过模糊细节、把日常事物搞得"诡异”起来,再来点不完整的真相,制造那种深层的恐惧感。追求的就是一个字:克制,但深刻!👻 真是高段位的玩法啊!✨ -更多详情:'https://x.com/lijigang_com/status/1939889108194926766'

    -
  4. -
  5. -

    Yangyi犀利地指出,在产品设计中,拥有一个"有话题的传播点”简直是实现增长的"核武器”!💥 他拿Starla举例说,人家就是靠着神秘学来勾勒伴侣画像,结果在社交媒体上掀起了轩然大波,引发了全民热议!🔥 这种策略太高明了,直接刺激了用户付费解锁内容的欲望,简直是把创意传播点变成了"印钞机”!💰 看来,会讲故事的产品才能赢得人心啊!💖 -
    Starla产品界面
    -更多详情:'https://x.com/Yangyixxxx/status/1939885863317721443'

    -
  6. -
  7. -

    景文一针见血地指出,现在好多LLM初创公司在融到钱之后,反而开始"迷茫”了!🤔 究其原因,竟然是缺乏明确的产品方向!结果呢,只能火急火燎地招产品经理来"包装”下一份融资计划书。这可真是个讽刺啊!😂 这背后深刻揭示了市场对真正懂得用户需求、能交付优质体验的产品战略用户体验专业人才是多么的稀缺!人才啊,你在哪里?!🥺 -'更多详情'

    -
  8. -
  9. -

    Tom Huang给大家送福利啦!🎁 他分享了Cline官方强力推荐的五款超有价值MCP Server,号称能显著优化你的端到端AI编码流程体验!🚀 他拍着胸脯保证,这些工具能极大地提升你的开发效率!简直是程序员的"秘密武器”!🤫 想要了解更多详情,赶紧戳官方博客文章一探究竟吧!🔗 -'更多详情'

    -
  10. -
  11. -

    Meng Shao大佬手把手教你如何构建一个开源版Claude Code编程助手!👨‍💻 他强调,核心其实很简单:一个强大的AI模型,再加上命令行、搜索和文件读写编辑这些基础工具,就能高效开工,根本不用搞什么复杂的代码库预索引!👍 他还介绍了子智能体、深度思考、任务清单和版本控制这些"高级玩法”,让你的助手能轻松搞定各种复杂任务!💪 简直是程序员的"梦中情助”!✨ -
    Claude Code助手构建示意图
    -
    Claude Code助手功能
    -'更多详情'

    -
  12. -
  13. -

    宝玉分享了Jack Morris的一篇文章,简直是AI领域的一记"警钟”!🔔 文章指出,大语言模型(LLMs)的四次重大突破,居然都不是因为有什么新理论,而是每次都成功挖掘并利用了新的数据源!🤯 比如ImageNet、海量的互联网文本,还有人类反馈等等。这文章强调:数据才是推动AI不断进步的"幕后英雄”!🦸‍♀️ 甚至预测未来AI的发展,将继续依赖新的数据发现,比如YouTube视频或者机器人采集的具身化数据,而不是那些模型或算法的创新。看来,得"数据者得天下”啊!👑 -
    LLM数据突破图示
    -
    数据驱动AI发展
    -'更多详情'

    -
  14. -
-
-

收听语音版AI日报

-
- - -
🎙️ 小宇宙📹 抖音
来生小酒馆来生情报站
小酒馆情报站
-
-
- - -
-
- - - -
- - - - - - - - - - - - - - - - - - -
- - diff --git a/today/book/2025-07-03.html b/today/book/2025-07-03.html new file mode 100644 index 0000000..a9ad5fc --- /dev/null +++ b/today/book/2025-07-03.html @@ -0,0 +1,333 @@ + + + + + + Today - AI 日报 By 何夕2077 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

Keyboard shortcuts

+
+

Press or to navigate between chapters

+

Press S or / to search in the book

+

Press ? to show this help

+

Press Esc to hide this help

+
+
+
+
+ + + + + + + + + + + + + +
+ +
+ + + + + + + + +
+
+

AI洞察日报 2025/7/3

+
+

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

+
+

AI内容摘要

+
谷歌发布教育AI助手和跨应用整合的Gemini Live。百度推出首个中文音视频生成模型MuseSteamer,并升级搜索。
+微信AI搜索引隐私担忧。研究揭示大模型内源性奖励,智谱开源视觉模型。亚马逊因AI预测裁员,学术论文现AI作弊。
+业界聚焦AI智能体,编程界正被大模型重塑,强调提示词与上下文工程对AI Agent的重要性。
+
+

AI产品与功能更新

+
    +
  1. +

    谷歌贴心地推出了专为学生和教育工作者打造的免费AI助手 Gemini for Education!🤔 它基于强大的Gemini 2.5 Pro模型和智慧的LearnLM,旨在让师生工作学习更高效。从老师的快速备课、个性化教学内容、自动出题,到学生的写作、复习、资料查询和语音学习,统统都能搞定,而且还特别注重数据隐私与安全,真是教育界的"神队友”啊!💡📚🔒 更多详情 +
    谷歌教育AI助手

    +
  2. +
  3. +

    百度商业研发团队放了个大招!🚀 他们推出了全球首个中文音视频一体化生成模型 MuseSteamer及其创作平台绘想。这模型可厉害了,能把画面、音效和人声台词完美融合,轻松生成高质量视频内容,简直是视频创作者的福音!🎬 它还在权威榜单VBench I2V中拔得头筹,极大地降低了视频创作门槛,看样子未来的内容创作模式要被它颠覆了!🌟 +
    百度AI技术展示

    +
  4. +
  5. +

    微信新推出的AI搜索功能,本意可能是好的,结果却因为能把人名自动转成超链接并生成个人简历,引发了用户们对隐私泄露的巨大担忧!😮‍💨 大家纷纷吐槽这简直是"强行开盒”!对此,腾讯赶紧出来解释,说这功能只是整合了公众号和互联网上的公开信息啦,并且承诺会进一步优化AI搜索的用户体验。希望真能让用户安心吧!🕵️‍♀️🛡️

    +
  6. +
  7. +

    百度搜索最近可真是大手笔!🔄 在AI Day开放日上,他们宣布进行了十年来最大规模的改版,全面升级了"智能框”、"百看”和"AI助手”三大核心功能,让用户能更轻松地进行多模态输入和创作。这次改版还巧妙地接入了百度自家研发的MuseSteamer模型和"绘想”平台,这意味着百度在AIGC中文视频创作领域取得了里程碑式的突破!💡🎬

    +
  8. +
  9. +

    Google的AI助手Gemini Live迎来了一次超级大升级!🤝 它将和Google MapsGoogle CalendarGoogle Keep以及Google Tasks等应用深度整合,以后你只要动动嘴或敲敲字,就能轻松实现跨应用智能操作啦!🌐 这波升级旨在大大提升生产力,打造一个高度整合的智能助手生态。未来,它还会连接更多Google生态应用,同时谷歌也承诺会把用户隐私放在心上。✨🚀 +
    谷歌AI助手Gemini

    +
  10. +
  11. +

    武汉市汉阳区率先亮出黑科技!🛵 他们推出了全国首辆搭载AI技术的"智音车”外卖配送车。这辆车简直是"智能快递员”的升级版,配备了北斗双频芯片,让配送效率飙升30%!💨 而且还能实现人车智能管理和1米级的精准定位。这款由北斗和雅迪联合研发的智能配送工具,多项先进技术加持,不仅提升了配送安全和效率,也为未来的智能交通描绘了新蓝图。📍✨ +

    +
  12. +
  13. +

    OpenRouter平台近日上线了一款名叫"Cypher Alpha”的神秘模型!🕵️‍♀️ 它免费提供惊人的100万token上下文和强大的推理能力,立刻引爆了网友们的热烈讨论,大家都在猜测它是不是OpenAI的"亲儿子”呢?🤯 尽管它的性能(尤其是在复杂推理方面)还有待提升,但这次事件无疑预示着AI模型领域持续不断的技术探索社区互动。💬✨ 更多详情 模型地址 +
    Cypher Alpha模型
    Cypher Alpha界面

    +
  14. +
+

AI前沿研究

+
    +
  1. +

    南京大学周志华教授团队传来好消息!🤯 他们首次理论证明了在大语言模型(LLM)中,竟然潜藏着一个"内源性奖励模型”!🔬 这意味着,我们以后可以更有效地利用强化学习(RL)来提升模型表现,而且还不需要依赖大量的人类反馈数据,这可真是太棒了!💡 这项突破不仅大大降低了大语言模型的开发成本,提高了效率,还预示着人工智能将能得到更广泛的应用。📈 +
    南京大学Logo

    +
  2. +
  3. +

    智谱AI近日扔出了一个重磅炸弹!✨ 他们开源了基于GLM-4V架构的新一代通用视觉模型GLM-4.1V-Thinking。这款模型超厉害,通过新增思维链推理机制,在处理复杂认知任务时能力显著提升,而且在多项权威评测中表现都非常出色!🧠 它支持图像、视频等多种模态输入,性能超越了不少同级别甚至更大参数的模型,更让人惊喜的是,它还提供免费商用授权!🚀 全球开发者们,快去项目地址体验吧!🆓 +

    +
  4. +
  5. +

    央广播电视总台(CMG)要搞大事情啦!🐾 7月6日上午10:30,他们将直播世界机器人技能大赛的首场机器狗任务赛!届时,酷炫的"黑豹2.0”机器狗将挑战极限任务,甚至还会上演一场惊心动魄的百米人机对决!🤖 这场大赛可不只是为了看热闹,它旨在全面评估机器狗在火灾、地震等极端应急救援环境下的综合能力,有望推动机器人在此领域的进一步发展,守护我们的安全!🔥🏆 +
    机器狗特写

    +
  6. +
  7. +

    一篇深入探讨通用人工智能(AGI)认知基础及其社会影响的论文新鲜出炉!🧠 它指出,真正的智能远超当前令牌预测模型的局限,必须通过整合模块化推理持久记忆多智能体协调才能实现。文章强调,Agentic RAG框架记忆和推理的深度结合是迈向通用智能的关键路径。当然,论文也坦诚指出了实现AGI所面临的科学、技术和伦理挑战,未来可期,挑战也并存!💡🌐🚧 论文地址

    +
  8. +
+

AI行业展望与社会影响

+
    +
  1. +

    亚马逊CEO安迪・贾西最近发出了一个信号:💼 随着人工智能技术的飞速发展,亚马逊未来将面临更多裁员!😮‍💨 这不是空穴来风,因为AI正在推动办公室和仓库工作自动化,自然就减少了对员工的需求。不过,别太悲观,亚马逊正积极投入至少200亿美元建设人工智能数据中心,并且还在大力招聘更多AI与机器人人才。🤖 这大概是为了适应技术变革,同时也能让员工们从重复性工作中解放出来,去完成更具创造性的任务吧!🤔

    +
  2. +
  3. +

    一项最新调查简直让人惊掉下巴!😱 全球至少14所顶尖大学的论文中,竟然被"偷偷”植入了AI可读的秘密指令,目的就是为了诱导AI审稿提高评分!🎓 这事儿一出,立刻引发了关于学术诚信和"提示词注入”攻击的轩然大波。🚫 这不仅严重威胁了学术同行评审的公正性,也迫使学术界和各国政府必须加速制定更严格的AI使用规范,以应对这些潜在的风险。🕵️ +
    学术论文
    AI审核概念

    +
  4. +
+

开源TOP项目

+
    +
  1. +

    scira (原 MiniPerplx)是一款拥有8825颗星的极简AI驱动搜索引擎!🌟 它利用了Vercel AI SDKxAI的Grok 3等先进模型,能帮你高效查找互联网信息,并且还会贴心地提供引用来源。🔍💡 项目地址

    +
  2. +
  3. +

    Mastering-GitHub-Copilot-for-Paired-Programming是一个获得了6113颗星的多模块课程!🌟 它旨在手把手教你如何将GitHub Copilot作为AI结对编程的得力助手,高效地利用起来。👨‍💻🤖 项目地址

    +
  4. +
  5. +

    ntfy是一个星标数高达24220的开源项目!🌟 它的超实用功能就是能让用户通过简单的PUT/POST请求,直接向手机或桌面发送推送通知,实现便捷的消息推送。📱🔔 项目地址

    +
  6. +
+

社媒分享

+
    +
  1. +

    小互最近激动地分享了Topview AI推出的手持产品数字人新版本"Topview Avatar 2”!🤩 他直呼效果"很哇塞”,特别适合出海电商。这款产品简直是电商福音,只需一张产品图和模特图,就能生成逼真的数字人带货视频,还支持任意产品尺寸、Prompt自定义数字人形象以及多语言,这预示着未来营销可能真的不再需要真人模特了!🛍️🌍🎬 +
    更多详情

    +
  2. +
  3. +

    与梓可栖在社交媒体上详细列出了VC行业专业人士对AI Agent的"饥渴”需求!💼 这些痛点简直是他们日常工作的"拦路虎”,包括自动化报销多端会议管理(带笔记和截屏)、智能会议排程,甚至是线下拜访规划。🤖 除此之外,他们还期待募投管退项目流程的智能跟踪、像"Map穷举”这样提升拜访前提效的工具,以及文章和播客的智能提炼与RAG搜索等强大功能。📊🗺️ +更多详情

    +
  4. +
  5. +

    杨溢推出了"归藏(guizang.ai)”,致力于通过Gemini CLI,提供无需代码的多种高效方法!💡 它涵盖了批量修改系统设置、文档编辑、PPT生成、音视频及图片处理,以及文件格式转换等功能。👨‍💻 他还分享了详细教程和案例,帮助普通用户也能轻松利用AI工具,低门槛地提高效率。⚡ +更多详情
    归藏AI应用界面

    +
  6. +
  7. +

    张翼ZYi真是数据分析的高手!📈 他通过分析头部20个All in one AI站的30万条外链,总结出了一套选择优质外链的量化标准。🔍 核心就是:优先考虑产品起步阶段新增的外链、外部链接少、AS高但要结合流量判断,以及非站点模板区链接。这些标准不仅能固化为SOP,还能利用Cursor等工具自动化筛选竞品外链,大大提高效率!🤖 +更多详情

    +
  8. +
  9. +

    黄赟根据Min Choi的经验,分享了运营Twitter (𝕏) 的三条核心策略!🐦 首先,要坚持日更并"抱大腿”;其次,积极"商业互吹”能增加曝光;最后,要巧妙利用AI(比如Grok或ChatGPT)作为内容顾问。他强调,在社交媒体上,内容和个人影响力远比直接的收入分成更有价值,因为它们能带来更广阔的网络和品牌机会。🤝💡🌟 +更多详情
    Twitter分享图

    +
  10. +
  11. +

    萌少分享了a16z的犀利观点,指出AI正在通过大语言模型重塑编程界!🤖 这不仅大幅提升了开发效率,还降低了新人入门的门槛,预计能为全球开发者市场带来数千亿美元的价值提升。💻 这预示着未来的软件开发将不再是依赖Stack Overflow苦苦寻觅答案,而是与AI协作,开发者将更侧重表达意图和边干边学,而不是被取代。🚀✨ +更多详情
    AI编程概念图

    +
  12. +
  13. +

    宝玉的博文深度剖析了提示词(Prompt)提示词工程(Prompt Engineering)上下文工程(Context Engineering)之间的微妙区别!🧠 他解释说,提示词是给AI模型的"指令”;提示词工程则是系统化设计、测试和优化这些指令的过程;而上下文工程,则是为大语言模型提供恰当信息和工具,以最高效地完成任务的艺术与科学,尤其对于AI Agent来说,这可是至关重要的"内功”!💡🛠️ +更多详情 +
    上下文工程图

    +
  14. +
+
+

收听语音版AI日报

+
+ + +
🎙️ 小宇宙📹 抖音
来生小酒馆来生情报站
小酒馆情报站
+
+
+ + +
+
+ + + +
+ + + + + + + + + + + + + + + + + + +
+ + diff --git a/today/book/daily/2025-07-02.html b/today/book/daily/2025-07-02.html index ee3dcfb..84bc5ae 100644 --- a/today/book/daily/2025-07-02.html +++ b/today/book/daily/2025-07-02.html @@ -290,7 +290,7 @@ Anysphere推跨平台AI编码工具,阿里开源ThinkSound音频模型。