diff --git a/content/cn/2025-06/2025-06-28.md b/content/cn/2025-06/2025-06-28.md new file mode 100644 index 0000000..c535f91 --- /dev/null +++ b/content/cn/2025-06/2025-06-28.md @@ -0,0 +1,106 @@ +--- +linkTitle: 06-28-日刊 +title: 06-28-日刊-AI日报 +weight: 3 +breadcrumbs: false +comments: true +description: "每日精选AI行业要闻、开源热点、学术前沿及大V观点。AI资讯;AI日报;AI知识库;AI教程;AI资讯日报;AI工具;AI Daily News 。多公司AI产品更新频频,OpenAI收购Crossing Minds以强化个性化推荐与AGI应用,Hengbot发布智能机器狗。 谷歌则推出了Gemma 3n" +--- + +## AI洞察日报 2025/6/28 + +> `AI 日报` | `早八更新` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/) + + + +### **AI内容摘要** + +``` +多公司AI产品更新频频,OpenAI收购Crossing Minds以强化个性化推荐与AGI应用,Hengbot发布智能机器狗。 +谷歌则推出了Gemma 3n模型及Doppl虚拟试衣应用。Suno收购WavTool增强音乐编辑功能,应对版权诉讼。 +AI研究揭示大模型预训练中存在"顿悟”现象。同时,AI代理构建与代码审查助手优化经验被广泛分享。 +``` + + + +### **AI产品与功能更新** + +1. **OpenAI** 已宣布收购专注于电子商务AI推荐系统的**Crossing Minds**公司,其团队已加入OpenAI。此举旨在加强OpenAI在**个性化推荐**、**检索增强生成(RAG)**和**实时用户建模**等关键领域的能力,加速**通用人工智能(AGI)**在现实应用中的落地。此次战略性收购也将帮助OpenAI强化其个性化建模与电商领域推荐系统,拓展**ChatGPT**的商业化场景,并推进后训练阶段的用户调优与行为理解系统。🚀✨ ['更多详情'](https://www.crossingminds.com/) +
![OpenAI收购Crossing Minds](https://assets-v2.circle.so/k2bihhhpptnld7s9yjhy5rcklimh)
+ +2. **Hengbot**公司最新发布了**Sirius机器狗**,它不仅具备跳舞、踢球等敏捷运动能力,还集成了**OpenAI**的**大语言模型**,能够进行语音对话并形成独特个性。这款多功能智能机器狗已在官网开启预售,预售价1299美元,预计今年秋季正式上市,有望成为未来家庭的新宠。🐶🤖🎉 +
![Hengbot Sirius机器狗](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388664055657490519988244.png)
+ +3. AI音乐公司**Suno**宣布收购基于浏览器的AI数字音频工作站**WavTool**,旨在增强其歌曲创作与制作的编辑能力,此举正值Suno面临多起**音乐版权诉讼**之际。🤔尽管收购条款未公开,但大部分WavTool员工已加入Suno团队。公司此举可能旨在分散公众对法律诉讼的关注,并向投资者传递发展信心,此前Suno已获得1.25亿美元融资。🎶⚖️ +
![Suno收购WavTool](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202005281122130015_60.jpg)
+ +4. **谷歌实验室**推出了名为**Doppl**的全新虚拟试衣应用,用户可通过上传照片或截图**动态试穿任意服装**,以探索和表达个人风格。目前该应用已在美国的iOS和Android平台上线。这款应用区别于以往的静态、品牌受限的虚拟试衣,能生成动画视频,让用户更直观地看到服装上身效果,从而辅助搭配决策。👗🤳✨ +
![谷歌Doppl虚拟试衣](https://assets-v2.circle.so/4tjlf3vvqk77u07immaxg452so6a)
+ +5. **谷歌**已重启并改进了其由**Gemini AI**驱动的"**Ask Photos**”搜索工具,旨在提升用户查找照片的速度与体验。📸🔍该功能现在能为简单查询提供即时结果,同时在后台处理复杂查询,并逐步向更多美国用户开放。👍 +
![谷歌Ask Photos更新](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388662236368236647884395.png)
+ +6. Google正式推出了新一代**开源轻量级多模态大模型** **Gemma 3n**,专为**移动端和边缘设备**优化,旨在实现接近云端模型的**原生多模态**能力。💡📱它是Gemma系列迄今为止最先进的版本,支持图像、音频、视频、文本输入和文本输出,并在**lmarena.ai**测试中展现出卓越性能,特别是在数学、编程和推理方面有显著增强。🤯 ['更多详情'](https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/) +
![谷歌Gemma 3n模型](https://assets-v2.circle.so/48ph1ou3at97bcecx9v4exbkgh69)
+
![Gemma 3n模型测试](https://assets-v2.circle.so/bx2ljlkm93rf3zulfs5ucia3m3fo)
+ +### **AI前沿研究** + +1. 一项研究首次证实,**大型语言模型**(LLM)**预训练**中也存在"**顿悟**”(Grokking)现象,即模型在训练损失收敛后,**通用化性能**仍持续提升,这揭示了从**记忆到泛化**的转化过程。🤯🔍研究者开发了两种新颖且高效的**度量指标**,无需进行下游任务微调或测试,即可准确预测**大型基础模型**的**通用化改进**,为LLM预训练提供了实用的监控工具。🧠 ['论文地址'](https://arxiv.org/abs/2506.21551) + +2. MADrive是一个**记忆增强**的**驾驶场景建模**框架,它扩展了现有**3D高斯泼溅**技术的局限,通过从大型外部记忆库中检索和集成相似的**3D车辆资产**,实现了对显著改变或全新**自动驾驶环境**的**照片级真实感合成**。🚗💨这一创新大幅提升了场景重建的灵活性和真实感,为**自动驾驶**模拟提供了更强大的支持。🌐 ['论文地址'](https://arxiv.org/abs/2506.21520) + +### **开源TOP项目** + +1. Black Forest Labs**开源**发布了**FLUX.1Kontext [dev]**图像编辑模型,该模型凭借其**上下文感知图像编辑**能力,能够根据文本指令精准修改现有图像并保持风格一致性,其性能被誉为可媲美**GPT-4o**,且支持消费级硬件运行。🎨✨这一模型旨在降低专业图像编辑门槛,推动开源社区创新。🚀 ['项目地址'](https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev) +
![FLUX.1Kontext图像编辑](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388661124441853705469566.png)
+ +2. **ottomator-agents**是托管在oTTomator Live Agent Studio平台上的**开源AI代理**项目,已获得**2336**颗星,为开发者提供了灵活的AI代理解决方案,可用于构建各种智能应用。🌟💻 ['项目地址'](https://github.com/coleam00/ottomator-agents) + +3. **rl-swarm**是一个完全**开源**的框架,专注于通过互联网创建**RL训练群**,已获得**824**颗星。🌐🧠该项目旨在简化大规模**强化学习**训练过程,为研究和开发提供分布式解决方案。 ['项目地址'](https://github.com/gensyn-ai/rl-swarm) + +4. **microui**是一款拥有**4351**颗星的微小即时模式UI库,致力于提供简洁高效的用户界面解决方案。⚙️📏 ['项目地址'](https://github.com/rxi/microui) + +5. **jsoncrack.com**是一款创新且**开源**的可视化应用,可将JSON、YAML、XML、CSV等多种数据格式转换为交互式图表,当前已获得**38496**颗星。📊✨ ['项目地址'](https://github.com/AykutSarac/jsoncrack.com) + +6. **Best-websites-a-programmer-should-visit**是一个广受欢迎的**程序员实用网站精选集**,拥有高达**69196**颗星,旨在为开发者提供丰富的学习和工具资源。📚🤓 ['项目地址'](https://github.com/sdmg15/Best-websites-a-programmer-should-visit) + +### **社媒分享** + +1. Jiayuan分享了关于**如何构建****Coding Agent**的深入见解,指出当前流行的**Gemini CLI**、**Claude Code**和**Cursor Agent**等产品底层**架构**具有相似性。🧑‍💻💡他推荐了一个早期的视频分享,从宏观视角详细拆解了**Coding Agent**的**构建**方式,为感兴趣的开发者提供了宝贵的学习资源。 + +
![Coding Agent构建分享](https://pbs.twimg.com/media/GucYQlXagAApa22?format=jpg&name=orig)
+ ['更多详情'](https://x.com/tisoga/status/1938545123404783617) + +2. 小邱很行分享了一套结合**Cursor**终端和**Claude Code**的**AI编程**"Vibe Coding”最佳实践方案。🚀✨该方案详细阐述了如何利用Claude Code生成技术实现方案、由Cursor进行审查调整和代码实现,并最终完成代码审查的流程。 + ['更多详情'](https://m.okjike.com/originalPosts/685e6a8d1e38b2a5382ec568) + +3. 栗噔噔分享了**小米AI眼镜**的实际佩戴体验,认为其外观**时尚**且带有"攻”性气质;然而,拍照功能存在**镜片反光**、**像素低**、**无防抖**和**进光量不足**等问题,导致拍摄效果不理想,甚至像"偷拍”。👓📸😅 +
![小米AI眼镜体验](https://cdnv2.ruguoapp.com/FnwSbRO8V-0qQd--BwSMvqm4JYVev3.jpg)
+
![小米AI眼镜佩戴](https://cdnv2.ruguoapp.com/FvxUKr5Zn8Cdd_UHFbVaGd_-N63bv3.jpg)
+ ['更多详情'](https://m.okjike.com/originalPosts/685e414ff432421164e9aeda) + +4. 王煊Leo指出**小米发布会**的一个重要细节:**小米SU7**的**智能驾驶**系统采用了**英伟达Thor系列芯片**。🚗⚡️作者认为,相较于其他品牌使用多颗Orin芯片且结合其价格,**雷总**的这一决策体现了高性价比和先进性。👍 +
![小米SU7智能驾驶](https://cdnv2.ruguoapp.com/Fq778kq_DuRq8S25Pj1eTqBe43_3v3.png)
+ ['更多详情'](https://m.okjike.com/originalPosts/685df372d82bae994a83ab09) + +5. 卡尔的AI沃茨分享了一场**命令行编程AI智能体**的"大混战”实验。🤖💥六位参赛选手(包括**claude-code**、**gemini**等)将**找出并消灭其他进程**,以存活到最后为目标,展现了AI对战的趣味性。🎮 + + ['更多详情'](https://x.com/aiwarts/status/1938331396373967094) + +6. 宝玉分享了cubic联合创始人Paul Sangle-Ferriere的文章,揭示了他们如何通过强制AI给出**推理日志**、精简**工具集**以及使用**专职微型智能体**,成功将**AI代码审查助手**的误报率降低51%,使其更安静、更精准。🛠️💡这些经验为设计高效**AI智能体**提供了重要启示。🎯 ['更多详情'](https://baoyu.io/translations/learnings-from-building-ai-agents) +
![AI代码审查助手优化](https://baoyu.io/uploads/2025-06-26/1750961084743.png)
+ +7. ChatV分享了一种独特的**AI对话技巧**:在与AI深入交流后,会请AI回顾并总结自己的**思维特点**(用10句通俗话描述)和**更好地与AI对话的建议**(用10句通俗话给出)。🤔💬此方法不仅能帮助用户**了解自我**,还能**优化未来的AI交互体验**。✨ ['更多详情'](https://m.okjike.com/originalPosts/685d84ac2b50c68918c64ea9) + +--- + +## **收听语音版AI日报** + +| 🎙️ **小宇宙** | 📹 **抖音** | +| --- | --- | +| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)| +| ![小酒馆](https://s1.imagehub.cc/images/2025/06/24/f959f7984e9163fc50d3941d79a7f262.md.png) | ![情报站](https://s1.imagehub.cc/images/2025/06/24/7fc30805eeb831e1e2baa3a240683ca3.md.png) | + + + diff --git a/content/cn/_index.md b/content/cn/_index.md index 3727c6a..feb0f2c 100644 --- a/content/cn/_index.md +++ b/content/cn/_index.md @@ -2,13 +2,13 @@ linkTitle: Today's Daily title: Today's Daily-AI日报 breadcrumbs: false -next: /2025-06/2025-06-26 -description: "每日精选AI行业要闻、开源热点、学术前沿及大V观点。AI资讯;AI日报;AI知识库;AI教程;AI资讯日报;AI工具;AI Daily News 。出门问问发布AI硬件TicNote,ElevenLabs推语音生成V3。 AI安全公司XBOW漏洞检测超人,大模型高考成绩达985水平。 微软与OpenAI" +next: /2025-06/2025-06-27 +description: "每日精选AI行业要闻、开源热点、学术前沿及大V观点。AI资讯;AI日报;AI知识库;AI教程;AI资讯日报;AI工具;AI Daily News 。多公司AI产品更新频频,OpenAI收购Crossing Minds以强化个性化推荐与AGI应用,Hengbot发布智能机器狗。 谷歌则推出了Gemma 3n" cascade: type: docs --- -## AI洞察日报 2025/6/27 +## AI洞察日报 2025/6/28 > `AI 日报` | `早八更新` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/) @@ -17,55 +17,82 @@ cascade: ### **AI内容摘要** ``` -出门问问发布AI硬件TicNote,ElevenLabs推语音生成V3。 -AI安全公司XBOW漏洞检测超人,大模型高考成绩达985水平。 -微软与OpenAI谈判陷僵局。AI应用将趋向轻量化,强调上下文工程。 +多公司AI产品更新频频,OpenAI收购Crossing Minds以强化个性化推荐与AGI应用,Hengbot发布智能机器狗。 +谷歌则推出了Gemma 3n模型及Doppl虚拟试衣应用。Suno收购WavTool增强音乐编辑功能,应对版权诉讼。 +AI研究揭示大模型预训练中存在"顿悟”现象。同时,AI代理构建与代码审查助手优化经验被广泛分享。 ``` ### **AI产品与功能更新** -1. 出门问问的创始人兼CEO李志飞在北京推出了全新的**AI硬件产品** **TicNote** 💡✨。这款设备仅3mm厚,能磁吸在手机上,它搭载了基于**DeepSeek-R1**等大语言模型的**Shadow AI**技术,具备AI**转写**和**总结**等超实用功能。李志飞还透露,公司未来将避开与科技巨头的正面竞争,转而推出更多搭载**Shadow AI**的智能硬件,以找到独特的市场切入点,并强调**硬件与软件结合**才是公司的发展方向哦! -
![出门问问TicNote](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202304171730169988_2.jpg)
-2. **ElevenLabs** 🎙️🎶最近发布了他们的下一代语音生成神器 **Voice Design v3** 🚀。这个工具超厉害,用户只需输入文本提示词,就能创造出拥有**高音质**且表达力超丰富的**个性化语音**,而且它还支持70多种语言及数百种本地口音呢!它能让你对语音的个性与韵律进行细致入微的控制,目前已向所有用户开放,简直是创意和商业用途的宝藏工具!快去在线体验一下吧:['ElevenLabs Voice Design'](https://elevenlabs.io/voice-design)。 -
![Voice Design v3界面](https://assets-v2.circle.so/vijiutr3y6vtx0je0jj3ck76slvc)
-
![Voice Design v3功能](https://assets-v2.circle.so/ju51ik2e8hzybvd29eehyf5n1rdj)
-
![Voice Design v3支持语言](https://assets-v2.circle.so/pv2uwy79y1zs7okoh09dymer4vpw)
+ +1. **OpenAI** 已宣布收购专注于电子商务AI推荐系统的**Crossing Minds**公司,其团队已加入OpenAI。此举旨在加强OpenAI在**个性化推荐**、**检索增强生成(RAG)**和**实时用户建模**等关键领域的能力,加速**通用人工智能(AGI)**在现实应用中的落地。此次战略性收购也将帮助OpenAI强化其个性化建模与电商领域推荐系统,拓展**ChatGPT**的商业化场景,并推进后训练阶段的用户调优与行为理解系统。🚀✨ ['更多详情'](https://www.crossingminds.com/) +
![OpenAI收购Crossing Minds](https://assets-v2.circle.so/k2bihhhpptnld7s9yjhy5rcklimh)
+ +2. **Hengbot**公司最新发布了**Sirius机器狗**,它不仅具备跳舞、踢球等敏捷运动能力,还集成了**OpenAI**的**大语言模型**,能够进行语音对话并形成独特个性。这款多功能智能机器狗已在官网开启预售,预售价1299美元,预计今年秋季正式上市,有望成为未来家庭的新宠。🐶🤖🎉 +
![Hengbot Sirius机器狗](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388664055657490519988244.png)
+ +3. AI音乐公司**Suno**宣布收购基于浏览器的AI数字音频工作站**WavTool**,旨在增强其歌曲创作与制作的编辑能力,此举正值Suno面临多起**音乐版权诉讼**之际。🤔尽管收购条款未公开,但大部分WavTool员工已加入Suno团队。公司此举可能旨在分散公众对法律诉讼的关注,并向投资者传递发展信心,此前Suno已获得1.25亿美元融资。🎶⚖️ +
![Suno收购WavTool](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202005281122130015_60.jpg)
+ +4. **谷歌实验室**推出了名为**Doppl**的全新虚拟试衣应用,用户可通过上传照片或截图**动态试穿任意服装**,以探索和表达个人风格。目前该应用已在美国的iOS和Android平台上线。这款应用区别于以往的静态、品牌受限的虚拟试衣,能生成动画视频,让用户更直观地看到服装上身效果,从而辅助搭配决策。👗🤳✨ +
![谷歌Doppl虚拟试衣](https://assets-v2.circle.so/4tjlf3vvqk77u07immaxg452so6a)
+ +5. **谷歌**已重启并改进了其由**Gemini AI**驱动的"**Ask Photos**”搜索工具,旨在提升用户查找照片的速度与体验。📸🔍该功能现在能为简单查询提供即时结果,同时在后台处理复杂查询,并逐步向更多美国用户开放。👍 +
![谷歌Ask Photos更新](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388662236368236647884395.png)
+ +6. Google正式推出了新一代**开源轻量级多模态大模型** **Gemma 3n**,专为**移动端和边缘设备**优化,旨在实现接近云端模型的**原生多模态**能力。💡📱它是Gemma系列迄今为止最先进的版本,支持图像、音频、视频、文本输入和文本输出,并在**lmarena.ai**测试中展现出卓越性能,特别是在数学、编程和推理方面有显著增强。🤯 ['更多详情'](https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/) +
![谷歌Gemma 3n模型](https://assets-v2.circle.so/48ph1ou3at97bcecx9v4exbkgh69)
+
![Gemma 3n模型测试](https://assets-v2.circle.so/bx2ljlkm93rf3zulfs5ucia3m3fo)
### **AI前沿研究** -1. **MMSearch-R1** 🔬🔍是一个开创性的**端到端强化学习框架**,旨在让**多模态大模型 (LMMs)** 🧠能够在真实的互联网环境中,根据需求进行多轮搜索,通过巧妙地整合图像与文本搜索工具,实现高效的问题解决!这个模型在**知识密集型**和**信息查询型VQA任务**上表现尤为出色,不仅超越了同等规模的**检索增强生成 (RAG)** 基线模型,甚至能在减少超过30%搜索调用的情况下,匹配更大尺寸RAG模型的性能。太厉害啦!✨ ['论文地址'](https://arxiv.org/abs/2506.20670) -### **AI行业展望与社会影响** -1. **AI安全公司** **XBOW** 🛡️💥凭借其自主研发的AI工具"**XBOW**”,首次超越人类研究员,成功登顶全球知名**漏洞众测平台** **HackerOne** 的美国排行榜第一名!这标志着AI在**漏洞检测**领域取得了里程碑式的突破👏。这款**全自动渗透测试系统**已经在HackerOne提交了近1060个漏洞,并成功获得了7500万美元的B轮融资💰,这预示着AI将彻底重塑**网络安全**格局,加速漏洞的发现与修复。 -
![XBOW漏洞检测界面](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0626/6388654490605766348022671.png)
-
![XBOW排名](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0626/6388654491737208217775020.png)
-2. 最近,字节跳动Seed团队对包括**豆包Seed 1.6-Thinking**和**Gemini 2.5 Pro**在内的五款主流**大模型**进行了评测 🎓✨。它们在2025年**山东高考真题**全科闭卷测评中表现卓越,其中豆包荣获文科第一(683分),Gemini则摘得理科第一(655分)的桂冠,总体成绩已达到冲刺清华北大、保底985大学的水平!仅仅一年时间,大模型的高考成绩就提升了超过百分,展现出强大的**文本理解**、**多模态理解**和**推理能力** 🚀。这表明高考已不再是检验其"智力”的挑战,未来它们应更深入地**融入科学研究**和**艺术创作**等领域,潜力无限呀!🎨 ['更多详情'](https://www.jiqizhixin.com/articles/2025-06-26-12) -
![大模型高考成绩](https://image.jiqizhixin.com/uploads/editor/93a8c682-cd72-4b9e-b193-2de6000ed32e/640.png)
-
![大模型高考分数分布](https://image.jiqizhixin.com/uploads/editor/8c33110c-0bd7-40f4-ae05-e011ef458218/640.png)
+1. 一项研究首次证实,**大型语言模型**(LLM)**预训练**中也存在"**顿悟**”(Grokking)现象,即模型在训练损失收敛后,**通用化性能**仍持续提升,这揭示了从**记忆到泛化**的转化过程。🤯🔍研究者开发了两种新颖且高效的**度量指标**,无需进行下游任务微调或测试,即可准确预测**大型基础模型**的**通用化改进**,为LLM预训练提供了实用的监控工具。🧠 ['论文地址'](https://arxiv.org/abs/2506.21551) + +2. MADrive是一个**记忆增强**的**驾驶场景建模**框架,它扩展了现有**3D高斯泼溅**技术的局限,通过从大型外部记忆库中检索和集成相似的**3D车辆资产**,实现了对显著改变或全新**自动驾驶环境**的**照片级真实感合成**。🚗💨这一创新大幅提升了场景重建的灵活性和真实感,为**自动驾驶**模拟提供了更强大的支持。🌐 ['论文地址'](https://arxiv.org/abs/2506.21520) ### **开源TOP项目** -1. **edit** 📝⭐是一个由微软发布的**开源项目**,旨在满足人们普遍的**编辑**需求,目前已经获得了**10606**颗星。这个项目致力于提供基础的编辑功能,更多详情请访问['项目地址'](https://github.com/microsoft/edit)。 -2. **base-ui** 🧩💻⭐是一个拥有**3623**颗星的**开源项目**,它由Radix、Floating UI和Material UI的创建者们精心打造。这个项目提供**无样式的UI组件**,旨在帮助开发者们更高效地构建**可访问的Web应用程序**和灵活的**设计系统**。更多详情请访问['项目地址'](https://github.com/mui/base-ui)。 -3. **gitleaks** 🔒💡⭐是一个广受欢迎的**开源安全工具**,坐拥**20704**颗星!它的核心功能是自动化地在代码仓库中**检测**并**查找**潜在的**敏感信息**(比如API密钥、密码等),从而有效地规避因泄密而带来的安全风险。更多详情请访问['项目地址'](https://github.com/gitleaks/gitleaks)。 + +1. Black Forest Labs**开源**发布了**FLUX.1Kontext [dev]**图像编辑模型,该模型凭借其**上下文感知图像编辑**能力,能够根据文本指令精准修改现有图像并保持风格一致性,其性能被誉为可媲美**GPT-4o**,且支持消费级硬件运行。🎨✨这一模型旨在降低专业图像编辑门槛,推动开源社区创新。🚀 ['项目地址'](https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev) +
![FLUX.1Kontext图像编辑](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0627/6388661124441853705469566.png)
+ +2. **ottomator-agents**是托管在oTTomator Live Agent Studio平台上的**开源AI代理**项目,已获得**2336**颗星,为开发者提供了灵活的AI代理解决方案,可用于构建各种智能应用。🌟💻 ['项目地址'](https://github.com/coleam00/ottomator-agents) + +3. **rl-swarm**是一个完全**开源**的框架,专注于通过互联网创建**RL训练群**,已获得**824**颗星。🌐🧠该项目旨在简化大规模**强化学习**训练过程,为研究和开发提供分布式解决方案。 ['项目地址'](https://github.com/gensyn-ai/rl-swarm) + +4. **microui**是一款拥有**4351**颗星的微小即时模式UI库,致力于提供简洁高效的用户界面解决方案。⚙️📏 ['项目地址'](https://github.com/rxi/microui) + +5. **jsoncrack.com**是一款创新且**开源**的可视化应用,可将JSON、YAML、XML、CSV等多种数据格式转换为交互式图表,当前已获得**38496**颗星。📊✨ ['项目地址'](https://github.com/AykutSarac/jsoncrack.com) + +6. **Best-websites-a-programmer-should-visit**是一个广受欢迎的**程序员实用网站精选集**,拥有高达**69196**颗星,旨在为开发者提供丰富的学习和工具资源。📚🤓 ['项目地址'](https://github.com/sdmg15/Best-websites-a-programmer-should-visit) ### **社媒分享** -1. Simon的白日梦分享了一篇高质量文章,指出**AI Agent** 🤖🤝已演进至**多智能体协作阶段**,强调其发展趋势为**封装模型**增多、功能增强、灵活性和协议标准化,并最终走向**多Agent协作**。文章详细解析了**AI Agent**的**三段进化论**、**MCP**与**A2A协议**,突出人类在**多Agent系统**中的**核心作用**,并通过**Golang工程实践**展示了构建复杂Agent系统的指南 💡。['更多详情'](https://m.okjike.com/originalPosts/685d58d062739eeda3b9d838) -
![AI Agent协作图](https://cdnv2.ruguoapp.com/Fu9_NrDOl23BPTkVMqCuo11qNhYQv3.jpg)
-
![多Agent系统](https://cdnv2.ruguoapp.com/Fkej5CodNU5eYZ0QvY6GUlRbLWSZv3.jpg)
-
![AI Agent发展](https://cdnv2.ruguoapp.com/FllJQZ_kio0pQNa11CUfnPvOhWbOv3.jpg)
-2. 博主Simon的白日梦分享了**开源多模态生成模型** **OmniGen2** 🎨✨,这款模型具备**文本生成图像**、**图像编辑**、**图像理解**及**多图融合**等"Any-to-Any”全流程能力,而且还支持在低显存设备上运行!博主对其在短时间内就达到了**GPT-4o**约70%的"**用嘴改图**”水平表示惊讶🤯,简直是未来可期啊!['更多详情'](https://m.okjike.com/originalPosts/685d56339c2e39aa22e64bbb) -
![OmniGen2模型演示](https://cdnv2.ruguoapp.com/ltYbExXHHBX6-IiH6poCRt4V6YHWv3.png)
-
![OmniGen2图片生成](https://cdnv2.ruguoapp.com/ljDKpsINlzylflPcueaB7KC5dTqSv3.png)
-
![OmniGen2界面](https://cdnv2.ruguoapp.com/ls34LcFxuRD1Baz2eGvajo2pvO52v3.jpg)
-3. 博主兔撕鸡大老爷兴奋地介绍了**小米AI眼镜** 🕶️💡!这款眼镜简直是科技与时尚的结合,它集**第一人称相机**、**开放式耳机**与**随身AI入口**功能于一身。更棒的是,这款眼镜还支持**百科问答**、**扫码支付**等便捷操作,甚至还有售价1999元起的**电致变色特别版**,简直酷毙了💸!['更多详情'](https://m.okjike.com/originalPosts/685d40dbadecea032f68a102) -
![小米AI眼镜产品图](https://cdnv2.ruguoapp.com/FiYt7G4BWf7RKS6v7g6lhoD0c0CUv3.jpg)
-
![小米AI眼镜功能](https://cdnv2.ruguoapp.com/Fp8KaIdLbsz62uQfat1l48cKg77Kv3.jpg)
-
![小米AI眼镜特写](https://cdnv2.ruguoapp.com/FikgmCpcfMiwXeahMtlwT5OC9oaJv3.jpg)
-4. 博主小互报道称,**微软** ⚔️暗示将放弃与**OpenAI**就**OpenAI**转型为盈利性公司并上市的谈判,这背后是因为双方在条款上未能达成一致🤔。**OpenAI**希望终止**微软**在模型**知识产权**和20%**收入分成**上的现有权益,但他们提出的新报价并未获得**微软**的认可,甚至有传言称,这可能导致**OpenAI**采取指控**反竞争行为**的"核选项”💥。['更多详情'](https://x.com/imxiaohu/status/1938130680636182595) -
![微软与OpenAI](https://pbs.twimg.com/media/GuVB3L_X0AA1A0L?format=jpg&name=orig)
-
![微软与OpenAI](https://pbs.twimg.com/media/GuVB3L9XwAADR9U?format=jpg&name=orig)
-5. Meng Shao分享了Andrej Karpathy的独到观点,他指出在AI应用中,我们更应该强调"**上下文工程**”🧠💡而非简单的"**提示词工程**”。因为"上下文工程”涉及到精心设计**信息窗口**、优化**信息量**及**内容结构**,远比输入几个提示词要复杂得多呢!✨此外,Karpathy还驳斥了AI应用仅仅是"**ChatGPT封装**”的误解,他强调实际开发涵盖了问题拆解、模型选择、UI管理及安全防护等一系列复杂环节,这可不是闹着玩儿的!💪 ['更多详情'](https://x.com/shao__meng/status/1938120617494253712) -6. 博主wwwgoubuli预测,AI将带来一个"**事实生成轻量应用**”的时代🔮🚀,届时用户将能真正实现"**言出法随**”,即时生成并销毁各种应用,而传统大型软件的营销和推广价值将大幅降低。他认为这得益于**高速推理技术**的普遍化以及**Google Gemini**等模型的突破性体验。他预示着未来AI将像水电煤一样成为**基础设施**,但许多应用本身会变得无形无价,甚至可能导致"**魔法世界入口**”的垄断🌌。['更多详情'](https://x.com/wwwgoubuli/status/1938082798973096160) + +1. Jiayuan分享了关于**如何构建****Coding Agent**的深入见解,指出当前流行的**Gemini CLI**、**Claude Code**和**Cursor Agent**等产品底层**架构**具有相似性。🧑‍💻💡他推荐了一个早期的视频分享,从宏观视角详细拆解了**Coding Agent**的**构建**方式,为感兴趣的开发者提供了宝贵的学习资源。 + +
![Coding Agent构建分享](https://pbs.twimg.com/media/GucYQlXagAApa22?format=jpg&name=orig)
+ ['更多详情'](https://x.com/tisoga/status/1938545123404783617) + +2. 小邱很行分享了一套结合**Cursor**终端和**Claude Code**的**AI编程**"Vibe Coding”最佳实践方案。🚀✨该方案详细阐述了如何利用Claude Code生成技术实现方案、由Cursor进行审查调整和代码实现,并最终完成代码审查的流程。 + ['更多详情'](https://m.okjike.com/originalPosts/685e6a8d1e38b2a5382ec568) + +3. 栗噔噔分享了**小米AI眼镜**的实际佩戴体验,认为其外观**时尚**且带有"攻”性气质;然而,拍照功能存在**镜片反光**、**像素低**、**无防抖**和**进光量不足**等问题,导致拍摄效果不理想,甚至像"偷拍”。👓📸😅 +
![小米AI眼镜体验](https://cdnv2.ruguoapp.com/FnwSbRO8V-0qQd--BwSMvqm4JYVev3.jpg)
+
![小米AI眼镜佩戴](https://cdnv2.ruguoapp.com/FvxUKr5Zn8Cdd_UHFbVaGd_-N63bv3.jpg)
+ ['更多详情'](https://m.okjike.com/originalPosts/685e414ff432421164e9aeda) + +4. 王煊Leo指出**小米发布会**的一个重要细节:**小米SU7**的**智能驾驶**系统采用了**英伟达Thor系列芯片**。🚗⚡️作者认为,相较于其他品牌使用多颗Orin芯片且结合其价格,**雷总**的这一决策体现了高性价比和先进性。👍 +
![小米SU7智能驾驶](https://cdnv2.ruguoapp.com/Fq778kq_DuRq8S25Pj1eTqBe43_3v3.png)
+ ['更多详情'](https://m.okjike.com/originalPosts/685df372d82bae994a83ab09) + +5. 卡尔的AI沃茨分享了一场**命令行编程AI智能体**的"大混战”实验。🤖💥六位参赛选手(包括**claude-code**、**gemini**等)将**找出并消灭其他进程**,以存活到最后为目标,展现了AI对战的趣味性。🎮 + + ['更多详情'](https://x.com/aiwarts/status/1938331396373967094) + +6. 宝玉分享了cubic联合创始人Paul Sangle-Ferriere的文章,揭示了他们如何通过强制AI给出**推理日志**、精简**工具集**以及使用**专职微型智能体**,成功将**AI代码审查助手**的误报率降低51%,使其更安静、更精准。🛠️💡这些经验为设计高效**AI智能体**提供了重要启示。🎯 ['更多详情'](https://baoyu.io/translations/learnings-from-building-ai-agents) +
![AI代码审查助手优化](https://baoyu.io/uploads/2025-06-26/1750961084743.png)
+ +7. ChatV分享了一种独特的**AI对话技巧**:在与AI深入交流后,会请AI回顾并总结自己的**思维特点**(用10句通俗话描述)和**更好地与AI对话的建议**(用10句通俗话给出)。🤔💬此方法不仅能帮助用户**了解自我**,还能**优化未来的AI交互体验**。✨ ['更多详情'](https://m.okjike.com/originalPosts/685d84ac2b50c68918c64ea9) ---