From 7a8532817b7e9329b3e33a4e19ad201055439f86 Mon Sep 17 00:00:00 2001
From: justlovemaki <274166795@qq.com>
Date: Tue, 24 Jun 2025 00:00:03 +0800
Subject: [PATCH] =?UTF-8?q?docs:=20=E7=BB=9F=E4=B8=80=E6=AF=8F=E6=97=A5?=
=?UTF-8?q?=E6=8A=A5=E5=91=8A=E4=B8=AD=E7=9A=84=E6=A0=87=E9=A2=98=E6=A0=BC?=
=?UTF-8?q?=E5=BC=8F=E5=B9=B6=E6=B7=BB=E5=8A=A0=E8=AF=AD=E9=9F=B3=E7=89=88?=
=?UTF-8?q?=E5=8C=BA=E5=9D=97?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
将各日报中的标题格式统一为"###### **标题**"样式,并在每篇日报末尾添加了"收听语音版"区块,包含小宇宙和抖音的链接及图片。同时移除了图片标签中的"img"属性,保持格式简洁一致。
---
daily/2025-06-01.md | 9 +++++++++
daily/2025-06-02.md | 29 +++++++++++++++++++----------
daily/2025-06-03.md | 27 ++++++++++++++++++---------
daily/2025-06-04.md | 29 +++++++++++++++++++----------
daily/2025-06-05.md | 33 +++++++++++++++++++++------------
daily/2025-06-06.md | 33 +++++++++++++++++++++------------
daily/2025-06-07.md | 33 +++++++++++++++++++++------------
daily/2025-06-08.md | 27 ++++++++++++++++++---------
daily/2025-06-09.md | 25 +++++++++++++++++--------
daily/2025-06-10.md | 37 +++++++++++++++++++++++--------------
daily/2025-06-11.md | 33 +++++++++++++++++++++------------
daily/2025-06-12.md | 45 +++++++++++++++++++++++++++------------------
daily/2025-06-13.md | 35 ++++++++++++++++++++++-------------
daily/2025-06-14.md | 35 ++++++++++++++++++++++-------------
daily/2025-06-15.md | 35 ++++++++++++++++++++++-------------
daily/2025-06-16.md | 12 ++++++------
daily/2025-06-17.md | 28 ++++++++++++++--------------
daily/2025-06-18.md | 36 ++++++++++++++++++------------------
daily/2025-06-19.md | 34 +++++++++++++++++-----------------
daily/2025-06-20.md | 24 ++++++++++++------------
daily/2025-06-21.md | 34 +++++++++++++++++-----------------
daily/2025-06-22.md | 24 ++++++++++++------------
daily/2025-06-23.md | 32 ++++++++++++++++----------------
23 files changed, 412 insertions(+), 277 deletions(-)
diff --git a/daily/2025-06-01.md b/daily/2025-06-01.md
index 487baf2..e693b42 100644
--- a/daily/2025-06-01.md
+++ b/daily/2025-06-01.md
@@ -14,3 +14,12 @@
12. **MMSI-Bench**是一个针对**多图像空间智能**的**VQA基准测试**,研究发现,尽管多模态大语言模型(MLLMs)已取得进展,但在**多图像空间推理**方面,其准确率(30-40%)与人类(97%)之间存在**巨大差距**。该研究诊断了模型四种主要的**失败模式**,为未来提升**多图像空间智能**提供了**宝贵见解**,论文详情请见[跳转链接](https://arxiv.org/abs/2505.23764)。
13. **ZeroGUI**是一个创新的**在线学习框架**,它以**零人力成本自动化GUI智能体训练**,通过基于VLM的自动任务生成和奖励评估,克服了传统GUI学习对人工标注的**重度依赖**。实验证明,该框架显著提升了**GUI智能体**在不同环境下的**性能**,为**自动化GUI操作**带来了**高效解决方案**,论文详情请见[跳转链接](https://arxiv.org/abs/2505.23762)。
14. **ATLAS**是一个针对**Transformer**架构设计的高容量**长期记忆模块**,它通过优化**记忆上下文**来克服现有模型在**长序列理解**上的局限,从而在测试时学习最优的记忆策略。实验结果表明,**ATLAS**在语言建模和长上下文理解等任务中表现优于Transformer和线性循环模型,显著**提升了性能**,论文详情请见[跳转链接](https://arxiv.org/abs/2505.23735)。
+
+---
+
+**收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-02.md b/daily/2025-06-02.md
index f4f8da5..61f3889 100644
--- a/daily/2025-06-02.md
+++ b/daily/2025-06-02.md
@@ -1,30 +1,39 @@
# AI洞察日报 2025年6月2日
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. Runway公司最新推出的**Gen-4References**功能已支持移动设备,使用户能通过手机照片结合自然语言提示,快速生成风格一致的艺术作品。这项功能将**AI生成技术**与移动便捷性完美结合,大幅降低了**AI创作**门槛,为内容创作者和普通用户带来了无限可能。
-
[](https://upload.chinaz.com/2025/0530/6388420978332595536873671.png)
+
[](https://upload.chinaz.com/2025/0530/6388420978332595536873671.png)
2. Anthropic近期宣布,其旗舰模型**Claude**已新增功能,支持开发者构建能与Claude直接对话的**AI应用程序**,这与**AI Studio**的开发理念高度契合。此举不仅降低了**AI应用开发**门槛,为开发者提供了更广阔的创新空间,也预示着AI应用普及与落地将进一步加速。
-
[](https://pic.chinaz.com/picmap/202403050858462025_0.jpg)
+
[](https://pic.chinaz.com/picmap/202403050858462025_0.jpg)
-**AI前沿研究**
+###### **AI前沿研究**
1. 华为近期通过其"昇腾 + Pangu Ultra MoE”系统展示了一项惊人突破:一个近万亿参数的MoE大模型,在不使用GPU的情况下,仅需2秒便能解答一道高等数学题。这不仅彰显了华为在自主可控国产算力与模型训练方面的强大实力,也为未来大规模AI模型的训练与应用开辟了新可能。
-
[](https://upload.chinaz.com/2025/0530/6388421664760221719225455.png)
+
[](https://upload.chinaz.com/2025/0530/6388421664760221719225455.png)
2. 这篇论文通过构建一个英语回文谜题基准测试,揭示了当前**视觉-语言模型**(**VLM**)在理解和解决这类谜题时遇到的显著困难。尽管VLM在解码简单视觉线索方面表现出一定能力,但对于需要**抽象推理**、**横向思维**及理解**视觉隐喻**的任务,它们仍旧力不从心,表明多模态抽象是其面临的独特挑战。详情请见:[Link](https://arxiv.org/abs/2505.23759)。
3. **LoRAShop**是一个创新的**多概念图像编辑框架**,它利用**修正流Transformer**的特性,实现了在不重新训练模型的情况下,将多个主题或风格无缝融入原始场景。这项技术通过智能融合LoRA权重,不仅保留了图像的整体背景和细节,还在身份保持上超越了现有基线,为个性化**图像生成**和**编辑**带来了革命性的"Photoshop式”体验。详情请见:[Link](https://arxiv.org/abs/2505.23758)。
4. **DeepTheorem**是一个利用**自然语言**和**强化学习**(**RL-Zero**)来增强**大型语言模型**(**LLM**)数学推理能力的非正式**定理证明框架**。该框架通过一个大规模高质量数据集和创新策略,显著提升了LLM在IMO级别非正式定理证明中的表现,展现了其在数学探索和自动化证明领域的巨大潜力。详情请见:[Link](https://arxiv.org/abs/2505.23754)。
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 根据阿姆斯特丹自由大学环境研究所博士生Alex de Vries-Gao的分析,人工智能的电力消耗预计将在2025年底前接近全球数据中心总电力消耗的一半,这意味着其能耗将很快超越比特币挖矿。尽管技术效率有所提升,但AI的电力需求仍在快速增长,凸显了在能耗与可持续发展之间寻找平衡的重要性。
-
[](https://pic.chinaz.com/picmap/202005281122057197_51.jpg)
+
[](https://pic.chinaz.com/picmap/202005281122057197_51.jpg)
2. 近期,黑客通过伪装成**阿里云AI SDK**的恶意软件包,成功实施了供应链攻击,利用隐藏在**Pickle**格式ML模型中的**恶意代码**窃取用户敏感信息。这揭示了**AI安全供应链**面临的新挑战,传统安全工具在检测恶意ML模型方面的不足,以及开发者面临的潜在风险。
-
[](https://pic.chinaz.com/picmap/202306161513254632_1.jpg)
+
[](https://pic.chinaz.com/picmap/202306161513254632_1.jpg)
-**开源TOP项目**
+###### **开源TOP项目**
1. **courses**是一个由Anthropic提供的**教育课程**项目,旨在帮助用户学习相关知识。该项目在GitHub上拥有**13483**颗星,可访问其GitHub页面:[Link](https://github.com/anthropics/courses)。
2. **agent-zero**是一个提供**AI框架**功能的项目,旨在帮助开发者构建AI应用。该项目在GitHub上获得了**7360**颗星,详情可前往:[Link](https://github.com/frdel/agent-zero)。
3. **cobalt**是一个致力于"**保存你所喜爱事物的最佳方式**”的项目,为用户提供高效的收藏管理功能。该项目在GitHub上备受欢迎,拥有**32941**颗星,可通过[Link](https://github.com/imputnet/cobalt)查看详情。
-4. **the-book-of-secret-knowledge**是一个内容丰富的**知识集合**项目,汇集了鼓舞人心的列表、手册、备忘单及各类工具。该项目在GitHub上拥有高达**171992**颗星,是寻求实用信息和技巧的宝库,访问地址为:[Link](https://github.com/trimstray/the-book-of-secret-knowledge)。
\ No newline at end of file
+4. **the-book-of-secret-knowledge**是一个内容丰富的**知识集合**项目,汇集了鼓舞人心的列表、手册、备忘单及各类工具。该项目在GitHub上拥有高达**171992**颗星,是寻求实用信息和技巧的宝库,访问地址为:[Link](https://github.com/trimstray/the-book-of-secret-knowledge)。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-03.md b/daily/2025-06-03.md
index 16e0253..a8812c4 100644
--- a/daily/2025-06-03.md
+++ b/daily/2025-06-03.md
@@ -1,19 +1,28 @@
# AI洞察日报 2025年6月3日
-**AI产品与功能更新**
-1. 谷歌近日在美国地区推出了 **Gemini Live** 功能,正式登陆 **iOS** 和 **iPadOS** 平台,用户可通过 **Gemini App** 免费体验 **AI** 识别场景和屏幕内容的便捷。这项创新不仅提升了用户互动体验,也预示着 **AI** 技术正进一步融入日常生活,成为人们的智能助手。
[](https://upload.chinaz.com/2025/0603/6388453725280965957304782.png)
-2. 微软最新推出了免费的 **Bing Video Creator** 工具,基于 **OpenAI Sora** 技术,让用户通过简单的文字提示即可轻松创作短视频。这款工具已在全球范围内的必应移动应用中上线,极大降低了视频创作的门槛,有望丰富用户的创作体验。
[](https://upload.chinaz.com/2025/0603/6388453719041406883771175.png)
-3. 新加坡国立大学(NUS)团队近日发布了 **OmniConsistency** 项目,它以极低成本复现了 **GPT-4o** 在图像风格化上的一致性,解决了开源社区的风格化难题。该项目通过独特的学习框架和模块化架构,有望成为图像生成领域的重要工具,推动 **AI** 艺术创作。
[](https://upload.chinaz.com/2025/0603/6388453880310640421505355.png)
+###### **AI产品与功能更新**
+1. 谷歌近日在美国地区推出了 **Gemini Live** 功能,正式登陆 **iOS** 和 **iPadOS** 平台,用户可通过 **Gemini App** 免费体验 **AI** 识别场景和屏幕内容的便捷。这项创新不仅提升了用户互动体验,也预示着 **AI** 技术正进一步融入日常生活,成为人们的智能助手。
[](https://upload.chinaz.com/2025/0603/6388453725280965957304782.png)
+2. 微软最新推出了免费的 **Bing Video Creator** 工具,基于 **OpenAI Sora** 技术,让用户通过简单的文字提示即可轻松创作短视频。这款工具已在全球范围内的必应移动应用中上线,极大降低了视频创作的门槛,有望丰富用户的创作体验。
[](https://upload.chinaz.com/2025/0603/6388453719041406883771175.png)
+3. 新加坡国立大学(NUS)团队近日发布了 **OmniConsistency** 项目,它以极低成本复现了 **GPT-4o** 在图像风格化上的一致性,解决了开源社区的风格化难题。该项目通过独特的学习框架和模块化架构,有望成为图像生成领域的重要工具,推动 **AI** 艺术创作。
[](https://upload.chinaz.com/2025/0603/6388453880310640421505355.png)
-**AI前沿研究**
+###### **AI前沿研究**
1. **WebChoreArena** ([Link](https://arxiv.org/abs/2506.01952)) 提出了一个包含 532 项精心策划任务的全新基准,旨在评估 **LLM** 驱动的网页浏览代理处理繁琐复杂网页任务的能力。研究发现,尽管 **GPT-4o** 等先进大模型在此基准上表现出显著进步,但相较于通用网页任务,仍有巨大的提升空间,凸显了处理复杂**"网络杂务”**的挑战性。
2. **RoboMaster** ([Link](https://arxiv.org/abs/2506.01943)) 提出了一种创新的机器人操作视频生成框架,它通过协作轨迹建模和阶段性分解交互过程,有效解决了多目标交互中视觉保真度下降的问题。这项技术成功地实现了**机器人操作**中视频生成质量的新突破,为复杂场景下的**轨迹控制**提供了更精准的解决方案。
-**AI行业展望与社会影响**
-1. 近日,美国犹他州律师理查德・贝德纳因在法庭文件中引用 **ChatGPT** 生成的虚假案例,被法院处以罚款,再次引发了对 **AI** 在法律领域应用的广泛争议。此事件深刻提醒法律从业者,在使用新兴技术时,务必保持严谨的**审核责任**,确保法律文件的准确性。
[](https://pic.chinaz.com/picmap/202304121052180076_0.jpg)
+###### **AI行业展望与社会影响**
+1. 近日,美国犹他州律师理查德・贝德纳因在法庭文件中引用 **ChatGPT** 生成的虚假案例,被法院处以罚款,再次引发了对 **AI** 在法律领域应用的广泛争议。此事件深刻提醒法律从业者,在使用新兴技术时,务必保持严谨的**审核责任**,确保法律文件的准确性。
[](https://pic.chinaz.com/picmap/202304121052180076_0.jpg)
2. **OpenAI** 计划在2025年上半年将 **ChatGPT** 打造为具备 **T 型技能** 的"**超级助手**”,旨在挑战苹果 **Siri** 的市场地位。这份战略文件透露,**OpenAI** 不仅希望 **ChatGPT** 成为能处理日常琐事和复杂任务的智能伙伴,更呼吁用户能在所有平台上自由选择默认 **AI** 助手,推动 **AI** 市场更加开放。
-**开源TOP项目**
+###### **开源TOP项目**
1. **nautilus_trader** ([Link](https://github.com/nautechsystems/nautilus_trader)) 是一个拥有 6728 **Star** 的**高性能算法交易平台**和**事件驱动回测器**,为开发者提供强大的交易策略验证能力。
2. **data-engineer-handbook** ([Link](https://github.com/DataExpert-io/data-engineer-handbook)) 拥有 28669 **Star**,是一个旨在帮助用户学习**数据工程**的综合性资源仓库,汇集了所有相关学习链接。
-3. **postiz-app** ([Link](https://github.com/gitroomhq/postiz-app)) 是一个坐拥 20460 **Star** 的**终极社交媒体日程安排工具**,集成了大量 **AI** 功能,旨在简化社交媒体管理。
\ No newline at end of file
+3. **postiz-app** ([Link](https://github.com/gitroomhq/postiz-app)) 是一个坐拥 20460 **Star** 的**终极社交媒体日程安排工具**,集成了大量 **AI** 功能,旨在简化社交媒体管理。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-04.md b/daily/2025-06-04.md
index 49d147f..6cd08af 100644
--- a/daily/2025-06-04.md
+++ b/daily/2025-06-04.md
@@ -1,36 +1,45 @@
# AI洞察日报 2025年6月4日
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. Komiko平台近日推出**视频到视频**功能,利用AI技术将用户上传的视频一键转换为**动漫**、漫画等多样化艺术风格的动态内容,极大降低了动画创作的门槛。该功能通过深度整合先进AI模型,并提供AI线稿上色、动画补帧等工具,旨在加速创意产业的数字化转型,成为专业人士和爱好者的**首选**创作工具。
-
[](https://upload.chinaz.com/2025/0604/6388464889049235843422625.png)
+
[](https://upload.chinaz.com/2025/0604/6388464889049235843422625.png)
2. 蚂蚁集团的**"AI健康管家”**成功通过信通院医疗健康行业大模型**可信评估**,成为首批获认可的产品之一,进一步提升了其在医疗AI领域的**可靠性**。该产品已服务超**4000万用户**,提供预约医生、健康评估、报告解读等**智能健康服务**,并吸引了60多位知名医生AI智能体入驻,未来将持续扩展功能。
-
[](https://pic.chinaz.com/picmap/202309121506505395_0.jpg)
+
[](https://pic.chinaz.com/picmap/202309121506505395_0.jpg)
-**AI前沿研究**
+###### **AI前沿研究**
1. AI"教父”**约书亚・本吉奥**成立非营利组织**LawZero**,投入3000万美元启动资金,旨在开发**"科学家 AI”**系统以防范未来AI智能体对人类进行欺骗。该系统将作为AI安全监控的**护栏**,确保自身智能程度与所监管AI智能体相当,通过提高AI的**透明性和可信性**,推动行业向更负责任的方向发展。
-
[](https://pic.chinaz.com/picmap/202412271635326771_0.jpg)
+
[](https://pic.chinaz.com/picmap/202412271635326771_0.jpg)
2. Play AI开源发布了**PlayDiffusion**,一款基于扩散模型的语音**"局部修改”**工具,能够实现对音频片段的替换、删除或调整而**不留痕迹**,极大提升了音频编辑效率和自然度。该技术能以高达50倍的速度提升**TTS推理效率**,并保持全局一致性,对播客制作、AI配音和内容纠错等场景具有**重要意义**,有望成为内容创作的必备利器。
GitHub: [PlayDiffusion](https://github.com/playht/PlayDiffusion) 模型下载: [PlayDiffusion](https://huggingface.co/PlayHT/PlayDiffusion)
3. LumosFlow是一个用于**长视频生成**的新框架,它通过引入**运动引导**来解决现有方法中时间连贯性不足和过渡不自然的问题。该研究通过分层生成关键帧并分解中间帧插值,实现了高达**15倍的插值**,确保了生成视频的**运动和外观一致性**。
论文URL: [LumosFlow](https://arxiv.org/abs/2506.02497)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. OpenAI以30亿美元收购**Windsurf**后,用户对其**Claude模型访问权限**大幅受限,引发开发者普遍不满,严重影响了开发效率与用户体验。此举导致Windsurf用户面临**成本增加**和操作复杂性,且未能获得Claude4系列直接访问,这可能威胁Windsurf在激烈市场竞争中的**未来增长**。
-
[](https://pic.chinaz.com/picmap/202502061719371797_2.jpg)
+
[](https://pic.chinaz.com/picmap/202502061719371797_2.jpg)
-**开源TOP项目**
+###### **开源TOP项目**
1. **RedditVideoMakerBot** (⭐7672) 是一个开源项目,旨在通过**一条命令**简化Reddit视频的创建过程,极大地降低了用户制作视频的门槛。
项目URL: [RedditVideoMakerBot](https://github.com/elebumm/RedditVideoMakerBot)
2. **cursor-free-vip** (⭐28687) 是一款专为**Cursor AI**设计的工具,能够自动重置机器ID,从而**免费升级**并绕过其Pro功能中的**高代币限制**和试用请求限制。该项目有效解决了用户在Cursor AI使用过程中遇到的**免费试用账户限制**问题。
项目URL: [cursor-free-vip](https://github.com/yeongpin/cursor-free-vip)
-**科技博主观点**
+###### **科技博主观点**
1. 科技博主**大帅老猿**指出,通过**重新讲述**学到的知识并录制视频来卖课是常见操作,但**标榜原创**的行为只可能欺骗新手。他强调检验原创的**唯一真理**是**举报**、投诉、打官司,只有能让侵权内容下架或获得赔偿,才有资格自称原创。
[Tweet Link](https://x.com/ezshine/status/1930068772146295153)
2. 博主**ginobefun**推荐了一篇关于**复杂RAG架构演进**的InfoQ文章,该文章深入探讨了**跨模态知识联邦**与**统一语义推理**的实践。文章提出通过**融合知识库**和**统一知识图谱**解决传统RAG在处理异构、多模态知识时的挑战,并通过医疗和金融案例展示了其**应用价值**。
-
[](https://pbs.twimg.com/media/Gsj5vqPa0AAPVEa?format=jpg&name=orig)
[](https://pbs.twimg.com/media/Gsj52bAasAIfgTI?format=jpg&name=orig)
[](https://pbs.twimg.com/media/Gsj54ksasAADTeL?format=jpg&name=orig)
文章链接:[文章](https://bestblogs.dev/article/2ba211)
+
[](https://pbs.twimg.com/media/Gsj5vqPa0AAPVEa?format=jpg&name=orig)
[](https://pbs.twimg.com/media/Gsj52bAasAIfgTI?format=jpg&name=orig)
[](https://pbs.twimg.com/media/Gsj54ksasAADTeL?format=jpg&name=orig)
文章链接:[文章](https://bestblogs.dev/article/2ba211)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-05.md b/daily/2025-06-05.md
index e21c312..50269d4 100644
--- a/daily/2025-06-05.md
+++ b/daily/2025-06-05.md
@@ -1,23 +1,32 @@
# AI洞察日报 2025/6/5
-**AI产品与功能更新**
-1. Suno 近日升级了其**AI音乐编辑工具**,允许用户上传和混音未完成的作品,并能修改歌词和延长曲目时长至八分钟,同时引入了创意滑块等功能。
[](https://pic.chinaz.com/picmap/202406061628284261_1.jpg)
此次升级正值其面临主要唱片公司的版权诉讼,唱片公司希望引入类似于 **YouTube Content ID** 的技术来追踪 **AI** 平台上的音乐使用情况。
-2. OpenAI 近日宣布 **ChatGPT** 升级新功能,现可连接 **Outlook**、**Teams**、**Gmail** 等多个外部服务,旨在提升企业用户的协作和信息获取效率。
[](https://pic.chinaz.com/picmap/202412271704353969_1.jpg)
此外,**macOS** 版 **ChatGPT Team** 用户还新增了"**录制模式**”,能自动生成会议记录和待办事项。
-3. AI驱动的代码编辑器 **Cursor** 于近日正式发布1.0版本,引入了核心功能 **BugBot**,能自动化审查 **GitHub** 上的 **Pull Request** 并一键修复代码。
[](https://upload.chinaz.com/2025/0605/6388471022950404092684122.png)
该版本还全面开放了后台代理功能,并增加了 **Jupyter** 支持和"Memories”项目管理功能,旨在显著提升开发者的生产力。
-4. 腾讯公益近日推出了创新性的"**问 AI**”功能,首次将**大型人工智能模型**应用于公益领域,旨在提升公众与公益项目及机构之间的互动和透明度。
[](https://pic.chinaz.com/picmap/201811151633427149_4.jpg)
这一便捷的沟通方式有助于公众更深入地理解并参与公益事业,并有望推动公益事业的进一步发展。
+###### **AI产品与功能更新**
+1. Suno 近日升级了其**AI音乐编辑工具**,允许用户上传和混音未完成的作品,并能修改歌词和延长曲目时长至八分钟,同时引入了创意滑块等功能。
[](https://pic.chinaz.com/picmap/202406061628284261_1.jpg)
此次升级正值其面临主要唱片公司的版权诉讼,唱片公司希望引入类似于 **YouTube Content ID** 的技术来追踪 **AI** 平台上的音乐使用情况。
+2. OpenAI 近日宣布 **ChatGPT** 升级新功能,现可连接 **Outlook**、**Teams**、**Gmail** 等多个外部服务,旨在提升企业用户的协作和信息获取效率。
[](https://pic.chinaz.com/picmap/202412271704353969_1.jpg)
此外,**macOS** 版 **ChatGPT Team** 用户还新增了"**录制模式**”,能自动生成会议记录和待办事项。
+3. AI驱动的代码编辑器 **Cursor** 于近日正式发布1.0版本,引入了核心功能 **BugBot**,能自动化审查 **GitHub** 上的 **Pull Request** 并一键修复代码。
[](https://upload.chinaz.com/2025/0605/6388471022950404092684122.png)
该版本还全面开放了后台代理功能,并增加了 **Jupyter** 支持和"Memories”项目管理功能,旨在显著提升开发者的生产力。
+4. 腾讯公益近日推出了创新性的"**问 AI**”功能,首次将**大型人工智能模型**应用于公益领域,旨在提升公众与公益项目及机构之间的互动和透明度。
[](https://pic.chinaz.com/picmap/201811151633427149_4.jpg)
这一便捷的沟通方式有助于公众更深入地理解并参与公益事业,并有望推动公益事业的进一步发展。
-**AI前沿研究**
+###### **AI前沿研究**
1. 这项研究提出 **SuperWriter-Agent** 框架,通过引入结构化的思考、规划和完善阶段,显著提升了**大型语言模型**在生成长文本时的连贯性和质量。
基于此框架训练的 **SuperWriter-LM** 在多项基准测试中表现出领先水平,证明了这种反思驱动方法能够让模型像专业作家一样,生成更高质量和一致性的长篇内容:[Link](https://arxiv.org/abs/2506.04180)。
-**AI行业展望与社会影响**
-1. OpenAI 首席执行官 **山姆・奥尔特曼** 指出,**AI** 正逐渐被企业视为基层员工,导致科技公司初级职位招聘量在2023至2024年间下降了25%。
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
专家预测,到2030年 **AI** 可能取代多达3.75亿个工作岗位,甚至未来1到5年内可能淘汰一半的初级白领岗位,引发高达20%的失业率。
+###### **AI行业展望与社会影响**
+1. OpenAI 首席执行官 **山姆・奥尔特曼** 指出,**AI** 正逐渐被企业视为基层员工,导致科技公司初级职位招聘量在2023至2024年间下降了25%。
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
专家预测,到2030年 **AI** 可能取代多达3.75亿个工作岗位,甚至未来1到5年内可能淘汰一半的初级白领岗位,引发高达20%的失业率。
-**开源TOP项目**
+###### **开源TOP项目**
1. **HowToCook** 是一个专为程序员设计的居家烹饪方法指南,旨在解决程序员做饭难的问题。该项目目前已获得 **87530** 个 **Star**,内容仅限简体中文,提供详细的烹饪指导:[Link](https://github.com/Anduin2017/HowToCook)。
2. **system-design-primer** 是一项旨在帮助学习如何设计大规模系统并准备系统设计面试的开源项目,已获得 **304096** 个 **Star**。它提供了全面的学习资源,并包含 **Anki** 抽认卡辅助学习:[Link](https://github.com/donnemartin/system-design-primer)。
3. **ChinaTextbook** 项目致力于收集中国所有小学、初中、高中及大学的 **PDF教材**,为学生和教师提供免费的教育资源。这个实用的资料库已获得 **35875** 个 **Star**:[Link](https://github.com/TapXWorld/ChinaTextbook)。
-4. Firecrawl 近日发布了突破性的 **/search API**,允许开发者通过一次API调用实现网页搜索与内容抓取,并以 **AI友好** 的多种格式输出数据。
[](https://upload.chinaz.com/2025/0605/6388471694605610854897111.png)
这一功能极大简化了 **AI** 应用的数据获取流程,无需第三方依赖,提升了数据处理效率,并在 **GitHub** 上已获得超过10K的 **Star**。
+4. Firecrawl 近日发布了突破性的 **/search API**,允许开发者通过一次API调用实现网页搜索与内容抓取,并以 **AI友好** 的多种格式输出数据。
[](https://upload.chinaz.com/2025/0605/6388471694605610854897111.png)
这一功能极大简化了 **AI** 应用的数据获取流程,无需第三方依赖,提升了数据处理效率,并在 **GitHub** 上已获得超过10K的 **Star**。
-**社媒分享**
-1. **Gorden Sun** 分享了一套能生成"超级赞”图文效果的 **AI** 提示词,并推荐使用 **GPT4o**、**Claude-3.7** 和 **DeepSeek-V3** 等工具。
[](https://pbs.twimg.com/media/Gse1INSb0AQCh0S?format=jpg&name=orig)
他指出,这些提示词虽然易于使用,但原作者在整理上花费了心思:[Link](https://x.com/Gorden_Sun/status/1930466986544308552)。
+###### **社媒分享**
+1. **Gorden Sun** 分享了一套能生成"超级赞”图文效果的 **AI** 提示词,并推荐使用 **GPT4o**、**Claude-3.7** 和 **DeepSeek-V3** 等工具。
[](https://pbs.twimg.com/media/Gse1INSb0AQCh0S?format=jpg&name=orig)
他指出,这些提示词虽然易于使用,但原作者在整理上花费了心思:[Link](https://x.com/Gorden_Sun/status/1930466986544308552)。
2. 推主 **wwwyesterday** 将现代学术论文比作 **npm** 包管理系统,认为两者都存在论文/包数量庞大、引用/依赖层层叠叠的现象,且大部分价值不高,少数经典广为引用。
他指出,现在很少有人能完全从零开始原创,就像写东西离不开 `package.json`,但他仍会刷 **arxiv** 寻找新观点:[Link](https://x.com/wwwgoubuli/status/1930310020312510934)。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-06.md b/daily/2025-06-06.md
index 3e2aaae..c380326 100644
--- a/daily/2025-06-06.md
+++ b/daily/2025-06-06.md
@@ -1,29 +1,38 @@
# AI洞察日报 2025/6/6
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. **Pollo AI** 推出了一站式**AI图像与视频生成平台**,整合全球前沿模型如Google Veo 3、Kling等,提供文字转视频、图像风格化、角色一致性等多种功能,并支持API接入,相比同类平台更具成本和模型优势,且获得Google Cloud的Veo 3模型授权。
-
[](https://assets-v2.circle.so/5fit6knlg31jzz4ds9stmn0z1wda)
+
[](https://assets-v2.circle.so/5fit6knlg31jzz4ds9stmn0z1wda)
2. **Luma Labs** 发布了全新的**AI视频编辑工具** Modify Video,基于其Dream Machine平台和**Ray2模型**,用户能通过文本提示对视频进行风格重塑、场景替换和角色调整,大幅降低了传统视频制作的复杂性和成本。该工具凭借Ray2模型的强大能力,在动作流畅性和时间一致性方面表现出色,并降低了创意门槛。
-
[](https://upload.chinaz.com/2025/0605/6388474336287139806268530.png)
+
[](https://upload.chinaz.com/2025/0605/6388474336287139806268530.png)
3. 谷歌更新了**Gemini 2.5版本**,显著提升了**AI音频对话与生成技术**,使其成为一个能够原生理解和生成文本、图像、音频、视频和代码的多模态AI系统。新功能使得人机交流更加自然流畅,支持实时音频对话、风格控制和多语言,并通过可控的文本转语音技术,允许用户精确调整语音输出的语调和情感。
-
[](https://upload.chinaz.com/2025/0605/6388474192800462061689108.png)
+
[](https://upload.chinaz.com/2025/0605/6388474192800462061689108.png)
4. 热门手游《**逆水寒**》与**可灵AI**合作,在游戏内推出了全新的"**图生动图**”玩法,让玩家能够通过简单操作将静态图片转化为个性化动态画面。该功能支持用户截图或上传图片,通过输入描述词来生成动图,并可进行双人互动创作,提升了玩家的游戏体验。
-
[](https://upload.chinaz.com/2025/0605/6388473368297009187838113.png)
+
[](https://upload.chinaz.com/2025/0605/6388473368297009187838113.png)
-**AI前沿研究**
+###### **AI前沿研究**
1. **NVIDIA** 发布了**Llama-3.1-Nemotron-Nano-VL-8B-V1**,这是一款基于Llama-3.1架构的**8B参数视觉语言模型**,支持图像、视频和文本输入,并能输出高质量文本及具备强大的图像推理能力。该模型在OCR和文档智能方面表现卓越,通过AWQ4bit量化技术可在单张RTX GPU上高效部署,并已在Hugging Face平台开源,为开发者提供了轻量高效的多模态AI解决方案。
-
[](https://upload.chinaz.com/2025/0605/6388473110722451938945298.jpg)
+
[](https://upload.chinaz.com/2025/0605/6388473110722451938945298.jpg)
2. Voyager 是一种新颖的**视频扩散框架**,它能从单张图片和用户定义的摄像机路径,生成**世界一致的3D点云序列**,特别适用于游戏和虚拟现实中可探索的3D场景。这项技术通过联合生成对齐的RGB和深度视频序列,实现了帧间固有的**3D一致性**,显著提升了视觉质量和几何精度。论文地址:[https://arxiv.org/abs/2506.04225](https://arxiv.org/abs/2506.04225)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 硅谷投资人**Mary Meeker**的最新**AI报告**指出,全球AI竞争格局正经历深刻重塑,中国AI力量与**开源浪潮**正全面崛起,挑战OpenAI等头部公司的主导地位。报告强调,中国AI模型性能已逼近国际一线,并在制造业中展现出强大的产业融合能力,同时开源模型凭借低成本和高灵活性,市场份额迅速增长,预示着AI行业进入多极对抗新时代。
-
[](https://pic.chinaz.com/picmap/202304171408567483_0.jpg)
+
[](https://pic.chinaz.com/picmap/202304171408567483_0.jpg)
-**开源TOP项目**
+###### **开源TOP项目**
1. **netbird** 是一个拥有 **14029** 颗星的**开源项目**,它基于 **WireGuard®** 帮助用户将设备连接到安全的覆盖网络,并支持**SSO**、**MFA**和精细的访问控制,提供安全高效的网络连接。项目地址:[https://github.com/netbirdio/netbird](https://github.com/netbirdio/netbird)
2. **quarkdown** 是一个拥有 **3952** 颗星的**开源项目**,旨在为 **Markdown** 文本赋予"超能力”,将想法轻松转化为演示文稿、文章和书籍等多种形式。项目地址:[https://github.com/iamgio/quarkdown](https://github.com/iamgio/quarkdown)
3. **cognee** 是一个拥有 **2658** 颗星的**开源项目**,其核心功能是仅用 **5 行代码**即可实现 **AI 智能体的记忆**,极大简化了智能体开发中的复杂性。项目地址:[https://github.com/topoteretes/cognee](https://github.com/topoteretes/cognee)
-**社媒分享**
+###### **社媒分享**
1. @wwwyesterday 分享了一个关于与 **AI 对话**的"生活小妙招”,即在开始时让AI每次回复都称呼"哥哥”,一旦AI停止这样称呼,就意味着可以新开对话窗口了。这个小技巧巧妙地利用了AI的"记忆”机制,为用户提供了判断对话是否需要重新开始的依据。
-2. **Gorden Sun** 宣布 **Fish Audio** 已开源其 **S1-mini语音模型**,作为表现良好的S1模型的精简版(0.5B参数)。S1-mini可供个人免费部署使用,但不可商用。在线体验及模型链接:[https://huggingface.co/spaces/fishaudio/openaudio-s1-mini](https://huggingface.co/spaces/fishaudio/openaudio-s1-mini) [https://huggingface.co/fishaudio/openaudio-s1-mini](https://huggingface.co/fishaudio/openaudio-s1-mini)。
\ No newline at end of file
+2. **Gorden Sun** 宣布 **Fish Audio** 已开源其 **S1-mini语音模型**,作为表现良好的S1模型的精简版(0.5B参数)。S1-mini可供个人免费部署使用,但不可商用。在线体验及模型链接:[https://huggingface.co/spaces/fishaudio/openaudio-s1-mini](https://huggingface.co/spaces/fishaudio/openaudio-s1-mini) [https://huggingface.co/fishaudio/openaudio-s1-mini](https://huggingface.co/fishaudio/openaudio-s1-mini)。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-07.md b/daily/2025-06-07.md
index 056482c..b0ec9b1 100644
--- a/daily/2025-06-07.md
+++ b/daily/2025-06-07.md
@@ -1,29 +1,38 @@
# AI洞察日报 2025/6/7
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. 近日,德国科技巨头**博世**与**阿里云**合作,将**通义大模型**应用于**智能座舱**,通过云计算与端侧混合计算实现与**3D 数字人**的交互,提升座舱智能感知和多模态控制能力。该方案支持知识问答和同声传译,使智能座舱成为理解并满足用户需求的智能助手,标志着汽车行业正迈向个性化、智能化的移动空间。
2. **Perplexity AI**近日推出**SEC**文件访问功能,旨在帮助各类投资者在**Perplexity 平台**轻松查询和理解复杂的**财务文档**,所有答案均附有引用。此外,**Perplexity**还推出了"**实验室**”功能,该功能能够将用户的提示转化为报告、仪表板等完整项目,显著提升了工作流效率。
-3. **Trae 平台**近日更新,正式集成**Google**的**Gemini 2.5 Pro Preview**模型,该模型在**WebDev Arena**和**LMArena 编码排行榜**中均位列第一,显著提升了前端开发与**UI 设计**能力。
[](https://upload.chinaz.com/2025/0606/6388481749990229697161576.png)
此次升级优化了代码转换、编辑及复杂代理工作流,并已免费向用户开放,有望推动**AI**在**区块链**和**去中心化应用**领域的创新。
-4. 海外知名的**AI 视频生成平台 PixVerse**正式推出其国内版"**拍我AI**”,同步上线移动端 App 和网页版,旨在为国内内容创作者和企业提供高效便捷的**AI 视频生成工具**。
[](https://upload.chinaz.com/2025/0606/6388481574736715558459901.png)
"**拍我AI**”支持通过文本或图像一键生成高质量、多风格视频,依托 PixVerse V4.5 算法并进行了本地化优化,有望推动中国市场**AI 视频技术**的普及和应用。
-5. **ElevenLabs**于2025年6月5日发布了被誉为"地表最强”的**文本转语音(TTS)模型**,**Eleven v3 (Alpha 版)**,该模型不仅能将文本转化为自然流畅的语音,还能通过**音频标签**精确控制情感、语速甚至加入音效,实现"演技合成”。
[](https://upload.chinaz.com/2025/0606/6388479747817228256386757.png)
[](https://upload.chinaz.com/2025/0606/6388479739813195471789762.png)
它支持**70多种语言**和**多角色自然对话**,并通过自动标签功能简化创作,有望在**影视配音**、**虚拟助手**等领域广泛应用,重新定义**AI 语音**的未来。
+3. **Trae 平台**近日更新,正式集成**Google**的**Gemini 2.5 Pro Preview**模型,该模型在**WebDev Arena**和**LMArena 编码排行榜**中均位列第一,显著提升了前端开发与**UI 设计**能力。
[](https://upload.chinaz.com/2025/0606/6388481749990229697161576.png)
此次升级优化了代码转换、编辑及复杂代理工作流,并已免费向用户开放,有望推动**AI**在**区块链**和**去中心化应用**领域的创新。
+4. 海外知名的**AI 视频生成平台 PixVerse**正式推出其国内版"**拍我AI**”,同步上线移动端 App 和网页版,旨在为国内内容创作者和企业提供高效便捷的**AI 视频生成工具**。
[](https://upload.chinaz.com/2025/0606/6388481574736715558459901.png)
"**拍我AI**”支持通过文本或图像一键生成高质量、多风格视频,依托 PixVerse V4.5 算法并进行了本地化优化,有望推动中国市场**AI 视频技术**的普及和应用。
+5. **ElevenLabs**于2025年6月5日发布了被誉为"地表最强”的**文本转语音(TTS)模型**,**Eleven v3 (Alpha 版)**,该模型不仅能将文本转化为自然流畅的语音,还能通过**音频标签**精确控制情感、语速甚至加入音效,实现"演技合成”。
[](https://upload.chinaz.com/2025/0606/6388479747817228256386757.png)
[](https://upload.chinaz.com/2025/0606/6388479739813195471789762.png)
它支持**70多种语言**和**多角色自然对话**,并通过自动标签功能简化创作,有望在**影视配音**、**虚拟助手**等领域广泛应用,重新定义**AI 语音**的未来。
-**AI前沿研究**
+###### **AI前沿研究**
1. 这篇研究论文介绍了一种名为**动态内存稀疏化(DMS)**的新方法,它通过压缩**Transformer LLM**的**KV 缓存**,在推理时实现**超扩展**,从而在相同计算资源下生成更多 Token 并提高模型准确性。该方法仅需少量训练步骤即可实现高压缩率,并显著提升了如**Qwen-R1 32B**等多种**LLM**在**AIME 24**、**GPQA**和**LiveCodeBench**等基准测试上的准确性。论文地址:[https://arxiv.org/abs/2506.05345](https://arxiv.org/abs/2506.05345)。
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
-1. **宇树科技 CEO 王兴兴**在第七届**北京智源大会**上表示,公司始终坚持的终极目标是让**机器人**实现家庭和工业场景的**实用化工作**,而跳舞和格斗等具身智能展示仅是训练和技术验证的手段。
[](https://pic.chinaz.com/picmap/202304171730201359_10.jpg)
他透露,今年上半年**人形机器人**在商业租赁市场已初具规模并带来可观价值,未来将加速机器人实用化落地。
-2. 知名科技博主**王自如**在**B站**宣布复更,并正式更名为"**王自如AI**”,表示将以**AI 测评 UP 主**的身份开启二次创业,专注于**AI 内容创业**和**AI 应用**,助力传统产业数字化转型。
[](https://upload.chinaz.com/2025/0606/6388480568808508227034081.png)
他在视频中感谢了**董明珠**和**雷军**的鼓励和帮助,并提及此前入职格力是为重塑销售体系。
+1. **宇树科技 CEO 王兴兴**在第七届**北京智源大会**上表示,公司始终坚持的终极目标是让**机器人**实现家庭和工业场景的**实用化工作**,而跳舞和格斗等具身智能展示仅是训练和技术验证的手段。
[](https://pic.chinaz.com/picmap/202304171730201359_10.jpg)
他透露,今年上半年**人形机器人**在商业租赁市场已初具规模并带来可观价值,未来将加速机器人实用化落地。
+2. 知名科技博主**王自如**在**B站**宣布复更,并正式更名为"**王自如AI**”,表示将以**AI 测评 UP 主**的身份开启二次创业,专注于**AI 内容创业**和**AI 应用**,助力传统产业数字化转型。
[](https://upload.chinaz.com/2025/0606/6388480568808508227034081.png)
他在视频中感谢了**董明珠**和**雷军**的鼓励和帮助,并提及此前入职格力是为重塑销售体系。
-**开源TOP项目**
+###### **开源TOP项目**
1. **note-gen**是一款**AI 赋能**的跨平台**Markdown 笔记应用**(Stars: 3161),致力于利用**AI**将碎片化知识整理成可读笔记,连接记录与写作。项目地址:[https://github.com/codexu/note-gen](https://github.com/codexu/note-gen)。
2. **notebooks**项目(Stars: 1174)提供了通过**Google Colab**、**Kaggle**等平台引导式**Notebook**免费微调**大型语言模型**的功能。项目地址:[https://github.com/unslothai/notebooks](https://github.com/unslothai/notebooks)。
3. **ragbits**(Stars: 749)提供了一系列构建模块,旨在帮助开发者快速开发**生成式 AI 应用程序**。项目地址:[https://github.com/deepsense-ai/ragbits](https://github.com/deepsense-ai/ragbits)。
-**社媒分享**
+###### **社媒分享**
-1. 知名博主**歸藏**推荐**即梦AI**图片3.0的**智能参考**功能,该功能支持用户基于上传图像生成任何内容,并能修改照片背景、添加配饰、更改姿势,甚至精确添加或修改复杂**文字效果**。
[](https://cdnv2.ruguoapp.com/FvtrC2kjbbXAClT4WeaTRXbuwUnlv3.jpeg)
这一突破性能力极大地提升了日常照片分享的表现力,并能高效生成电商产品图、小红书和视频封面等**营销物料**。文章链接:[https://mp.weixin.qq.com/s/_kt9OLylR95sG7U37wseSw](https://mp.weixin.qq.com/s/_kt9OLylR95sG7U37wseSw),社交媒体链接:[https://m.okjike.com/originalPosts/6842cd91a26304532600fa4d](https://m.okjike.com/originalPosts/6842cd91a26304532600fa4d)。
-2. **Yangyi**分享了**AI 时代**的产品价值公式,指出产品价值取决于"**新体验**”(获得有效结果与美观度)和"**迁移成本**”(旧平台数据沉没成本与上手门槛)之间的差异。因此,构建高价值**AI 产品**需要提供超预期的有效结果、足够美观的界面,并致力于降低用户数据迁移的难度和产品的使用门槛。社交媒体链接:[https://x.com/Yangyixxxx/status/1930912029809979654](https://x.com/Yangyixxxx/status/1930912029809979654)。
\ No newline at end of file
+1. 知名博主**歸藏**推荐**即梦AI**图片3.0的**智能参考**功能,该功能支持用户基于上传图像生成任何内容,并能修改照片背景、添加配饰、更改姿势,甚至精确添加或修改复杂**文字效果**。
[](https://cdnv2.ruguoapp.com/FvtrC2kjbbXAClT4WeaTRXbuwUnlv3.jpeg)
这一突破性能力极大地提升了日常照片分享的表现力,并能高效生成电商产品图、小红书和视频封面等**营销物料**。文章链接:[https://mp.weixin.qq.com/s/_kt9OLylR95sG7U37wseSw](https://mp.weixin.qq.com/s/_kt9OLylR95sG7U37wseSw),社交媒体链接:[https://m.okjike.com/originalPosts/6842cd91a26304532600fa4d](https://m.okjike.com/originalPosts/6842cd91a26304532600fa4d)。
+2. **Yangyi**分享了**AI 时代**的产品价值公式,指出产品价值取决于"**新体验**”(获得有效结果与美观度)和"**迁移成本**”(旧平台数据沉没成本与上手门槛)之间的差异。因此,构建高价值**AI 产品**需要提供超预期的有效结果、足够美观的界面,并致力于降低用户数据迁移的难度和产品的使用门槛。社交媒体链接:[https://x.com/Yangyixxxx/status/1930912029809979654](https://x.com/Yangyixxxx/status/1930912029809979654)。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-08.md b/daily/2025-06-08.md
index 194600d..85e3c42 100644
--- a/daily/2025-06-08.md
+++ b/daily/2025-06-08.md
@@ -1,17 +1,26 @@
# AI洞察日报 2025/6/8
-**AI产品与功能更新**
-1. 阿里巴巴于6月6日正式开源了全新的**千问3向量模型**系列**Qwen3-Embedding**,其在文本检索、聚类和分类等任务上的性能提升超40%,并超越谷歌和OpenAI的顶尖模型,获得了同类模型的**最佳性能**(SOTA),同时具备强大的多语言支持能力。
[](https://pic.chinaz.com/picmap/202504151007236218_3.jpg)
该系列共9款模型,已在魔搭社区、Hugging Face和GitHub等平台开源,并可通过阿里云百炼使用API服务,为全球开发者提供了更高效的AI应用空间。
+###### **AI产品与功能更新**
+1. 阿里巴巴于6月6日正式开源了全新的**千问3向量模型**系列**Qwen3-Embedding**,其在文本检索、聚类和分类等任务上的性能提升超40%,并超越谷歌和OpenAI的顶尖模型,获得了同类模型的**最佳性能**(SOTA),同时具备强大的多语言支持能力。
[](https://pic.chinaz.com/picmap/202504151007236218_3.jpg)
该系列共9款模型,已在魔搭社区、Hugging Face和GitHub等平台开源,并可通过阿里云百炼使用API服务,为全球开发者提供了更高效的AI应用空间。
2. **AI**驱动的本地视频编辑工具**Diffusion Studio Pro**正式亮相,该产品被誉为"CapCut + Cursor”结合,以本地优先、浏览器为基础的非线性编辑体验,集成了超过16种生成式**AI模型**,旨在降低创作门槛并大幅提升专业视频创作者的工作效率。其提供免费无限层级,有望成为AI驱动视频编辑的行业标杆,为创作者带来更高效、直观的创作体验。
-3. 谷歌于6月5日发布了名为**Portraits**的创新**AI产品**,用户可通过与虚拟专家进行实时对话,获得个性化的沟通技巧与领导力学习体验,首批虚拟专家基于知名畅销书作者打造。
[](https://upload.chinaz.com/2025/0606/6388480752743547666381573.png)
该产品依托谷歌先进的**生成式AI技术**,强调交互性和实践性,目前仅对美国IP用户开放测试,预示着**AI教育**将迈向更互动、更个性化的新阶段。
+3. 谷歌于6月5日发布了名为**Portraits**的创新**AI产品**,用户可通过与虚拟专家进行实时对话,获得个性化的沟通技巧与领导力学习体验,首批虚拟专家基于知名畅销书作者打造。
[](https://upload.chinaz.com/2025/0606/6388480752743547666381573.png)
该产品依托谷歌先进的**生成式AI技术**,强调交互性和实践性,目前仅对美国IP用户开放测试,预示着**AI教育**将迈向更互动、更个性化的新阶段。
-**AI前沿研究**
-1. 在第七届"北京智源大会”上,智源研究院重磅推出了一系列名为"悟界”的**大模型**,其中包括原生多模态世界模型**Emu3**、脑科学多模态通用基础模型见微**Brainμ**,以及具身智能的协作框架**RoboOS2.0**和**RoboBrain2.0**等。
[](https://pic.chinaz.com/picmap/202307211343352678_2.jpg)
这些模型旨在推动人工智能在医疗、教育、环境监测等多个重要领域的应用落地,展现了智源研究院在**多模态智能技术**方面的雄心和实力。
+###### **AI前沿研究**
+1. 在第七届"北京智源大会”上,智源研究院重磅推出了一系列名为"悟界”的**大模型**,其中包括原生多模态世界模型**Emu3**、脑科学多模态通用基础模型见微**Brainμ**,以及具身智能的协作框架**RoboOS2.0**和**RoboBrain2.0**等。
[](https://pic.chinaz.com/picmap/202307211343352678_2.jpg)
这些模型旨在推动人工智能在医疗、教育、环境监测等多个重要领域的应用落地,展现了智源研究院在**多模态智能技术**方面的雄心和实力。
-**开源TOP项目**
+###### **开源TOP项目**
1. **react-bits**是一个拥有**12729**星的开源**React组件集合**,它提供动画、交互式且完全可定制的组件,旨在帮助开发者构建出令人惊叹且难以忘怀的用户界面。项目地址:[Link](https://github.com/DavidHDev/react-bits)。
2. **art-design-pro**是一个拥有**1729**星的Vue 3管理后台模板,它采用Vite + TypeScript + Element Plus构建,专注于优化用户体验和视觉设计。项目地址:[Link](https://github.com/Daymychen/art-design-pro)。
-**社媒分享**
-1. 刘勿锋分享了用**Claude**画图时的一个实用小技巧:通过简单的提示词,可以指导Claude调用如**iconfont**、**Lucied React图标库**等第三方图标库,而非使用系统默认的emoji,从而大幅提升前端网页的视觉美观度和风格统一性。
[](https://cdnv2.ruguoapp.com/Fmks9yCJBJ1rO-T5g9BPepCxci-v3.png)
[](https://cdnv2.ruguoapp.com/FqkHGytOOk8dLy3WejWlcbSLAIBqv3.png)
更多详情请访问:[Link](https://m.okjike.com/originalPosts/68444463dfa0f1ef3adbbf9b)。
-2. wwwgoubuli预估接下来社交媒体上将出现两种热门内容:一部分是深入分析**作文题目**的讨论,另一部分则是围绕**AI写作文**展开的创作比拼,展现了对当前AI应用趋势的敏锐观察。更多信息:[Link](https://x.com/wwwgoubuli/status/1931206161044484395)。
\ No newline at end of file
+###### **社媒分享**
+1. 刘勿锋分享了用**Claude**画图时的一个实用小技巧:通过简单的提示词,可以指导Claude调用如**iconfont**、**Lucied React图标库**等第三方图标库,而非使用系统默认的emoji,从而大幅提升前端网页的视觉美观度和风格统一性。
[](https://cdnv2.ruguoapp.com/Fmks9yCJBJ1rO-T5g9BPepCxci-v3.png)
[](https://cdnv2.ruguoapp.com/FqkHGytOOk8dLy3WejWlcbSLAIBqv3.png)
更多详情请访问:[Link](https://m.okjike.com/originalPosts/68444463dfa0f1ef3adbbf9b)。
+2. wwwgoubuli预估接下来社交媒体上将出现两种热门内容:一部分是深入分析**作文题目**的讨论,另一部分则是围绕**AI写作文**展开的创作比拼,展现了对当前AI应用趋势的敏锐观察。更多信息:[Link](https://x.com/wwwgoubuli/status/1931206161044484395)。
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-09.md b/daily/2025-06-09.md
index add6ed8..8814316 100644
--- a/daily/2025-06-09.md
+++ b/daily/2025-06-09.md
@@ -1,24 +1,33 @@
# AI洞察日报 2025/6/9
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. **OpenAI** 宣布 **ChatGPT** 高级语音功能升级,显著提升了语音交互的自然性和流畅度,使其**语调更自然、节奏更真实、情绪表达更丰富**,并加入了**双向自动翻译**功能,能持续进行多轮对话翻译,无需重复指令,特别适用于国际出行、远程办公和语言学习等场景。
2. 面壁智能于6月6日发布了 **MiniCPM 4.0系列** 模型,包括8B稀疏版和0.5B轻巧版,在端侧性能上实现了**极限情况下220倍、常规5倍的速度提升**,通过**系统级稀疏创新**和高效双频换挡技术,大幅减少了端侧存储需求,并已成功适配Intel、高通等主流芯片。
-
[](https://upload.chinaz.com/2025/0608/6388497352726253514384248.png)
+
[](https://upload.chinaz.com/2025/0608/6388497352726253514384248.png)
-**开源TOP项目**
+###### **开源TOP项目**
1. **tensorzero** ([Link](https://github.com/tensorzero/tensorzero)) 是一款拥有4869个Star的项目,它为LLM应用创建了一个**反馈循环**,旨在将生产数据转化为更智能、更快、更经济的模型。
2. **HumanSystemOptimization** ([Link](https://github.com/zijie0/HumanSystemOptimization)) 是一个拥有15170个Star的项目,提供了一份名为"**健康学习到150岁**”的**人体系统调优指南**。
3. **omni-tools** ([Link](https://github.com/iib0011/omni-tools)) 拥有2940个Star,它提供了一套**自托管的网页工具集**,用于日常任务,强调**无广告、无跟踪**,且可在浏览器中快速便捷使用。
4. **BlackFriday-GPTs-Prompts** ([Link](https://github.com/friuns2/BlackFriday-GPTs-Prompts)) 是一个拥有7018个Star的项目,提供了**无需Plus订阅即可使用的免费GPTs列表**。
-**社媒分享**
+###### **社媒分享**
1. ginobefun分享了关于 **RAG技巧与底层代码剖析** 的文章([Link](https://x.com/hongming731/status/1931695593300295887)),强调通过手写代码理解RAG核心逻辑,并详细介绍了**语义分块**与**上下文增强检索**如何提升大模型问答质量。
2. 黄赟认为 **AI数字人** 将成为电商平台的标配([Link](https://x.com/huangyun_122/status/1931651642912575799)),并提到近期**AI主播被"开发者模式”玩坏**的现象,导致技术服务商需紧急修复漏洞。
3. 歸藏展示了 **FLUX kontext** 在修改汽车宣传图方面的强大能力([Link](https://m.okjike.com/originalPosts/684554a3f2a4a64de9113b05)),能将汽车背景更换为黄昏沙滩或赛道,并智能地为行驶中的车轮**添加运动模糊效果**。
-
[](https://cdnv2.ruguoapp.com/FgYlujbzq6TyHy_7vk80onRQz2s0v3.png)
-
[](https://cdnv2.ruguoapp.com/Frl3Mso4Vw3AJ0TMEhauKTMf1KJSv3.png)
+
[](https://cdnv2.ruguoapp.com/FgYlujbzq6TyHy_7vk80onRQz2s0v3.png)
+
[](https://cdnv2.ruguoapp.com/Frl3Mso4Vw3AJ0TMEhauKTMf1KJSv3.png)
4. izx-copy分享了Google的建议([Link](https://m.okjike.com/originalPosts/684547c3380c5253de2afdb8)),鼓励开发者直接使用其高质量的**深度研究代码库**,而非自行开发,认为其比"vibe coding”版本更优。
-
[](https://cdnv2.ruguoapp.com/Fq5xvk7MirT9ygZ10T5hIx3lWRlvv3.jpg)
+
[](https://cdnv2.ruguoapp.com/Fq5xvk7MirT9ygZ10T5hIx3lWRlvv3.jpg)
5. Yangyi呼吁开发 **"睿智的AI”** ([Link](https://x.com/Yangyixxxx/status/1931568827126743513)),即能够**快速识别幻觉和虚假信息**的AI,并提出了**AI幻觉专家网络**的概念,认为这能帮助AI自主辨别信息真伪,提升输出可靠性。
6. pimgeek转发了一篇关于公司**用ChatGPT替代客服导致翻车**的文章([Link](https://mp.weixin.qq.com/s/68NngKn8nhZEziLkRvBcTg)),文章指出用户更倾向于与真人客服沟通,数据显示多数用户不希望产品引入AI客服,甚至会因此考虑更换竞争对手。
-
[](https://mmbiz.qpic.cn/mmbiz_jpg/kKoeb9t5fNrx85xJ2bibZStRvd1w55tu3rasGH4r7WyxZ3ECSxozia6DZvicBZcXVKhsUSCSKw47gnesic2RfDztsQ/0?wx_fmt=jpeg)
\ No newline at end of file
+
[](https://mmbiz.qpic.cn/mmbiz_jpg/kKoeb9t5fNrx85xJ2bibZStRvd1w55tu3rasGH4r7WyxZ3ECSxozia6DZvicBZcXVKhsUSCSKw47gnesic2RfDztsQ/0?wx_fmt=jpeg)
+
+ ---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-10.md b/daily/2025-06-10.md
index 4c578ef..babbc47 100644
--- a/daily/2025-06-10.md
+++ b/daily/2025-06-10.md
@@ -1,30 +1,30 @@
# AI洞察日报 2025/6/10
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. Google 近日调整 **AI 模型**使用政策,自5月起,**Google AI Studio** 已停止向免费用户提供 **Gemini 2.5 Pro** 系列模型调用权限,未来开发者需自行提供 **API 密钥**接入服务。此举引发了开发者社区的广泛关注,分析认为这是 Google 推动 **Gemini** 商业化进程、将高性能模型纳入付费体系的信号。
-
[](https://pic.chinaz.com/picmap/202312070835429226_0.jpg)
+
[](https://pic.chinaz.com/picmap/202312070835429226_0.jpg)
2. 据官方数据显示,阿里旗下**通义千问3**大模型开源仅一个月,其全球累计下载量已突破**1250万次**,并在 Hugging Face 等主流 **AI** 开源平台上,衍生模型数量超过**13万个**,跃居全球第一。这一爆发式增长不仅代表着国产大模型的开源实力正与国际水平接轨,也进一步巩固了阿里在全球 **AI 基础模型生态**中的影响力。
-
[](https://pic.chinaz.com/picmap/202504151007248027_6.jpg)
+
[](https://pic.chinaz.com/picmap/202504151007248027_6.jpg)
3. 轻量级文档解析模型 **MonkeyOCR** 近日震撼登场,它以仅**3B参数**的轻量级架构,在英文文档解析任务中展现出惊艳性能,超越了 **Gemini 2.5 Pro** 等重量级模型,并大幅提升了处理速度。其核心创新在于采用"**结构-识别-关系**”三元组范式,这不仅提升了解析准确率,还显著降低了计算资源需求,为中小型企业部署 **AI** 文档解析解决方案提供了可能。
-
[](https://upload.chinaz.com/2025/0609/6388506551370676562538551.png)
+
[](https://upload.chinaz.com/2025/0609/6388506551370676562538551.png)
论文链接:[https://arxiv.org/abs/2506.05218](https://arxiv.org/abs/2506.05218)
4. 在近期一场采用2025年高考新课标Ⅰ卷客观题的数学挑战中,**字节**的**豆包**和**腾讯**的**元宝**表现出色,以68分的成绩并列第一,充分展现了其在复杂推理场景下的潜力。此次比赛不仅揭示了各大 **AI 模型**在高考数学上的能力与不足,也反映出它们在细节处理、公式应用和逻辑推理方面的显著进步,为未来 **AI 数学能力**的发展奠定了基础。
-
[](https://upload.chinaz.com/2025/0609/6388506262201100345390287.png)
-
[](https://upload.chinaz.com/2025/0609/6388506263798259217980699.png)
+
[](https://upload.chinaz.com/2025/0609/6388506262201100345390287.png)
+
[](https://upload.chinaz.com/2025/0609/6388506263798259217980699.png)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 架构师**罗伯特・卡鲁索**近日进行了一项跨时代实验,结果显示1977年推出的**Atari 2600**游戏机国际象棋引擎轻松击败了 **OpenAI** 的 **ChatGPT**。**ChatGPT** 在比赛中频繁犯错、混淆棋子,这引发了公众对**复古科技**与**现代 AI** 棋艺水平的讨论和反思。
-
[](https://pic.chinaz.com/picmap/202307141649254569_3.jpg)
+
[](https://pic.chinaz.com/picmap/202307141649254569_3.jpg)
2. 博主 **wwwgoubuli** 认为 **AI 编程代理**正进入平台期,尽管当前模型如 **Gemini 2.5 Pro** 和 **Claude** 表现强劲,但模型层面的"飞升”空间有限。他预计未来将有更多产品井喷式发展,而重点在于**载体**、**媒介**和 **IDE/plugin** 等方面的完善,而非核心模型能力的突破。
[Link](https://x.com/wwwgoubuli/status/1931898011904598439)
-**开源TOP项目**
+###### **开源TOP项目**
1. **vosk-api** 是一个拥有**10342**颗星的开源项目,它提供适用于 **Android**、**iOS**、**树莓派**和服务器的**离线语音识别 API**,并支持 **Python**、**Java**、**C#** 和 **Node** 等多语言开发。
[Link](https://github.com/alphacep/vosk-api)
@@ -36,15 +36,24 @@
[Link](https://github.com/eythaann/Seelen-UI)
4. **Meng Shao** 分享了5个精选的**开源项目**,旨在帮助 **AI 工程师**提升技能并获得"超能力”,尤其是在 **LLMs** 和生成式 **AI Agent** 领域。这些项目涵盖了从 **LLM** 基础知识、**AI Agent** 构建、生产级机器学习应用部署到**提示工程**等关键学习资源。
-
[](https://pbs.twimg.com/media/Gs-Kw91bEAAfXUe?format=jpg&name=orig)
+
[](https://pbs.twimg.com/media/Gs-Kw91bEAAfXUe?format=jpg&name=orig)
[Link](https://x.com/shao__meng/status/1931915369754870114)
-**社媒分享**
+###### **社媒分享**
1. 博主**归藏**详细介绍了如何在 **Liblib** 平台在线使用 **FLUX Kontext** 工具进行图片修改,无需本地运行 **Comfyui**,并分享了涵盖单图、双图、三图融合及图片放大功能的**工作流**。**Liblib** 上线的 **Kontext** 提供了便捷的在线处理能力,旨在帮助用户轻松掌握图片创作的各种高级技巧。
-
[](https://cdnv2.ruguoapp.com/FgPX1CCXdu_RYpd92XdLLAZ2RFbBv3.png)
+
[](https://cdnv2.ruguoapp.com/FgPX1CCXdu_RYpd92XdLLAZ2RFbBv3.png)
[Link](https://m.okjike.com/originalPosts/68468cf4747af0f12129117c)
2. **Tw93** 推荐了 **PayQrcode** 方案,该方案通过**物理图片合并技术**,成功将**微信**与**支付宝**收款码融合为单张图片,实现了线下离线场景下的**双码兼容识别**。这项创新解决了传统双码不便的问题,并经本地测试证明识别效果良好,极大地提升了支付便利性。
-
[](https://pbs.twimg.com/media/Gs7XEppbgAA10Zw?format=jpg&name=orig)
- [Link](https://x.com/HiTw93/status/1931860291278823822)
\ No newline at end of file
+
[](https://pbs.twimg.com/media/Gs7XEppbgAA10Zw?format=jpg&name=orig)
+ [Link](https://x.com/HiTw93/status/1931860291278823822)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-11.md b/daily/2025-06-11.md
index 8fba683..021ad42 100644
--- a/daily/2025-06-11.md
+++ b/daily/2025-06-11.md
@@ -1,20 +1,20 @@
# AI洞察日报 2025/6/11
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. **豆包大模型家族**将在2025 FORCE原动力大会上,重磅发布全新的**豆包·视频生成模型**。这款模型可谓"创意魔法棒”,它凭借高效结构和多任务统一建模等黑科技,不仅支持**无缝多镜头叙事**,还能**精准响应多动作**,甚至能像专业摄影师一样**随心运镜**,轻松生成写实、动漫等多种风格的**高品质视频**,简直是视频创作者的福音!
-
[](https://upload.chinaz.com/2025/0610/6388517021358447365987976.png)
+
[](https://upload.chinaz.com/2025/0610/6388517021358447365987976.png)
2. xAI开发的**Grok**人工智能正大刀阔斧地接管X平台的**推荐算法**,同时优化了评论排序机制。这意味着,平台将优先推荐**高质量内容**,而非仅仅看粉丝量,这无疑给那些粉丝较少但有真材实料的"小号”和新人带来了前所未有的曝光机会,旨在打造一个更公平、更开放的内容生态,让好内容不再"蒙尘”。
-
[](https://upload.chinaz.com/2025/0610/6388514989498792027745193.png)
+
[](https://upload.chinaz.com/2025/0610/6388514989498792027745193.png)
3. **豆包App**近期也对"一句话P图”功能进行了全面升级,它基于强大的SeedEdit 3.0模型,新增了一键添加/替换文字、质感风格迁移和局部图像编辑增强等一系列酷炫修图玩法。这波升级简直是把专业修图师请进了手机,让普通用户也能无需专业技能,轻松搞定个性化照片创作,让"修图小白”也能变身"修图大师”。
-
[](https://upload.chinaz.com/2025/0610/6388514703219058043604298.png)
+
[](https://upload.chinaz.com/2025/0610/6388514703219058043604298.png)
4. 苹果在WWDC 2025大会上带来了iOS 26系统的"杀手级”功能——**视觉智能**。有了它,你可以在屏幕上的任何图片或信息上进行提问、搜索,甚至自动识别事件详情,简直是手机的"智能眼”。这项升级通过AI技术实现了屏幕内容的"一眼识别”,大大提升了交互体验的便捷性与智能化程度,还能自动提取事件信息加入日历,让你的数字生活更加省心。
-
[](https://upload.chinaz.com/2025/0610/6388514197880401555868249.png)
+
[](https://upload.chinaz.com/2025/0610/6388514197880401555868249.png)
5. 好消息!**沉浸式翻译**迎来重大更新,现在已能对**推特(X)视频**进行**实时翻译**。即便视频没有原生字幕,它也能帮你"神同步”地显示**中英双语字幕**。这下,刷X平台视频再也不用担心语言不通了,简直是跨文化交流的"神助攻”,彻底消除了语言障碍,让世界更近。
[Link](https://x.com/imxiaohu/status/1932299897388277804)
-**AI前沿研究**
+###### **AI前沿研究**
1. 香港大学和华为诺亚方舟实验室强强联手,推出了颠覆性的**FUDOKI**模型。这款模型采用**非掩码离散流匹配架构**,成功突破了传统自回归模型的束缚,实现了更加灵活高效的**多模态生成与理解**能力。它通过独特的**并行去噪机制**,显著提升了复杂推理和生成任务的表现,尤其在**图像生成**方面表现惊艳,为未来**通用人工智能**的发展铺平了道路。
-
[](https://pic.chinaz.com/picmap/202405161743136484_4.jpg)
+
[](https://pic.chinaz.com/picmap/202405161743136484_4.jpg)
2. 香港科技大学和快手科技的研究团队联合发布了**EvoSearch(进化搜索)技术**,这简直是AI作画领域的一股清流!它彻底颠覆了以往"大模型、大算力”的固有思维,巧妙地将达尔文的进化论思想融入AI生成过程,让那些"小个子”模型也能生成超越甚至媲美"大块头”的**高质量图像和视频**。这项突破性技术有望开启AI创作的**"智能进化”时代**,让AI模型在推理阶段释放更深层次的潜力。相关项目主页、代码和论文链接已发布:[https://tinnerhrhe.github.io/evosearch/](https://tinnerhrhe.github.io/evosearch/)、[https://github.com/tinnerhrhe/EvoSearch-codes](https://github.com/tinnerhrhe/EvoSearch-codes)、[https://arxiv.org/abs/2505.17618](https://arxiv.org/abs/2505.17618)。
[](https://upload.chinaz.com/2025/0610/6388516498517715873339996.png)
[](https://upload.chinaz.com/2025/0610/6388516503306155376085044.png)
@@ -23,7 +23,7 @@
4. 新论文《梦境之地》(**Dreamland**)提出了一种结合物理模拟器与大型生成模型的混合框架。它的目标是创造出高度可控且逼真的动态虚拟世界,不仅显著提升了图像质量与可控性,更重要的是,有望为**具身AI智能体**的训练提供一个理想的"游乐场”和"实验室”,助力AI在现实世界中更好地学习和行动。
[Link](https://arxiv.org/abs/2506.08006)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 理想汽车近期进行了组织架构的"大变身”,正式成立了**"空间机器人”**和**"穿戴机器人”**两个全新的二级部门。这不仅仅是部门调整,更预示着理想汽车正从传统的汽车制造商转型为**智能出行生态构建者**。他们旨在通过机器人技术,构建一个涵盖车内"第三空间”和车外智能穿戴设备的完整智能生活服务体系,这无疑将为理想汽车在竞争激烈的市场中带来新的差异化优势,让"第三空间”战略不再只是一个概念。
[](https://pic.chinaz.com/picmap/202105061137083176_6.jpg)
2. 俄亥俄州立大学宣布从今年起,将强制所有学生接受**人工智能(AI)培训**,这简直是为未来职场"量身定制”的技能包!学校推出了**"AI流利度”计划**,将AI教育全面融入本科生课程,旨在培养学生将专业知识与AI技术有效结合的能力。当然,学校也强调学生不得利用生成性AI来"蒙混过关”,同时加强教师培训以维护**学术诚信**。此举旨在确保每位毕业生都能在其专业领域有效应用AI,并积极响应俄亥俄州AI教育联盟在K-12教育中推动AI教育的努力,让AI真正成为每个人的"超级助手”。
@@ -31,12 +31,12 @@
3. 知名思考者李继刚一针见血地指出,当AI技术变得越发**高效强大**时,人类的**判断力**、**品味**和对事物**目的的理解**反而会变得更为**硬核**。因为AI虽然能生成万千方案并完美执行,却无法替代人类进行**选择**、定义**美**,更无法洞悉复杂且深邃的**人性**。这提醒我们,在AI时代,真正有价值的,或许正是那些AI无法企及的"人类专属技能”。
[Link](https://m.okjike.com/originalPosts/68480c352b31fa0880f554c5)
-**开源TOP项目**
+###### **开源TOP项目**
1. 小红书的 hi lab 团队近日献出了一份"大礼”——首个开源文本大模型**dots.llm1**!这款拥有1420亿参数的**混合专家(MoE)语言模型**,在海量真实数据训练后,其性能竟然能媲美阿里巴巴的Qwen2.5-72B,这简直是模型界的"黑马”!此次开源不仅彰显了小红书在人工智能领域的技术雄心,更旨在提供更智能化的服务,并激励开发者们一起加入AI研究的"大合唱”。
-
[](https://pic.chinaz.com/picmap/201811151633429180_32.jpg)
+
[](https://pic.chinaz.com/picmap/201811151633429180_32.jpg)
2. 近期,GitHub上两个**AI相关**的项目人气爆棚。其中,拥有10785星的"**newsnow**”项目,它旨在为用户提供**优雅的实时热点新闻阅读体验**,让信息获取既便捷又高效,简直是"新闻控”的福音,地址在这里:[此链接](https://github.com/ourongxing/newsnow)。另一个是"**GenAI_Agents**”项目,以12884星的高热度,为开发者提供了**从基础到高级的生成式AI智能体技术教程与实现**,旨在赋能构建更智能的**交互式AI系统**,详情可访问:[此链接](https://github.com/NirDiamant/GenAI_Agents)。
-**社媒分享**
+###### **社媒分享**
1. Gorden Sun在社交媒体上分享了**Mirage**虚拟人模型产品,这款产品简直是"数字分身”的魔法师!它能通过音频驱动,生成生动、嘴型同步且表情丰富的**虚拟人视频**,栩栩如生。Gorden Sun还特别强调,该产品的详细技术报告对研究人员具有极高的参考价值,看来又将引发一场虚拟人技术的"军备竞赛”。
[Link](https://x.com/Gorden_Sun/status/1932446920884334635)
2. Sam Altman在X平台发文宣布,**o3产品**价格已大幅下调80%,这简直是"福利大放送”!他表达了对用户创新使用的期待,并预告了**o3-pro版本**也将提供令人满意的定价。看来,Sora之父又在鼓励大家放开手脚,用更低的成本去探索AI的无限可能了。
@@ -44,4 +44,13 @@
3. Ryan ᵐᶠᵉʳ 🦄d/acc抛出了一个关于**下一代创业者**的深刻观点:他们不应被束缚于模仿乔布斯等前代成功模式,也不应受限于**有限的低质量输入**,而应**忠于自我**,以**独特**的"vibe”和**玩乐精神**去**自由探索**。这就像在说,别做别人的影子,去创造属于你自己的"游戏规则”!
[Link](https://x.com/RyanMfer/status/1932387601341984815)
4. 用户wwwgoubuli分享了AI在实际工作中的一个有趣转变。他提到,远程团队成员初时因担心被视为偷懒而**不敢充分使用AI**,但在他多次分享AI"正确用法”后,团队逐渐"放开手脚”,结果代码的**注释、规范和质量**均显著提升,同事们也展现出更高的**自信**。这简直是AI赋能团队效率提升的"教科书式”案例,打破了心中的"AI焦虑”。
- [Link](https://x.com/wwwgoubuli/status/1932358909865480333)
\ No newline at end of file
+ [Link](https://x.com/wwwgoubuli/status/1932358909865480333)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-12.md b/daily/2025-06-12.md
index 8177162..b694601 100644
--- a/daily/2025-06-12.md
+++ b/daily/2025-06-12.md
@@ -1,46 +1,55 @@
# AI洞察日报 2025/6/12
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. **Mistral AI**发布了首个专注于**推理**的开源语言模型**Magistral**,旨在解决现有大型语言模型在**领域知识深度**、**推理透明度**和**多语言能力**上的不足。其**Flash Answers**模式下推理速度比竞品快10倍,并原生支持**链式思维(CoT)**,可自动生成可解释的思考路径。模型提供开源版**Magistral Small**和企业版**Magistral Medium**(准确率接近GPT-4 Turbo),支持多语言推理且可本地部署。 [Link](https://mistral.ai/news/magistral)
-
[](https://assets-v2.circle.so/1ktkb1h1bolve7kykg6lziw7jov1)
+
[](https://assets-v2.circle.so/1ktkb1h1bolve7kykg6lziw7jov1)
2. **Figma**近日正式发布官方**Model Context Protocol (MCP)**服务,旨在通过更智能的数据传输方式,革命性地提升**AI驱动的"设计到代码”工作流效率与准确性**。该服务能够提取更详细的设计稿信息,并与主流开发工具和**AI**编码工具无缝集成,显著减少设计与开发间的摩擦。
-
[](https://upload.chinaz.com/2025/0611/6388523888922649161116355.jpg)
+
[](https://upload.chinaz.com/2025/0611/6388523888922649161116355.jpg)
3. **OpenAI**近日推出了**ChatGPT全新升级版模型o3-pro**,其在处理复杂问题上更精准,尤其在**科学研究、编程、教育和写作**等领域展现出显著优势,并整合了网页搜索、文件分析等全套工具。尽管响应速度相对较慢,但其价格相较前代o1-pro大幅降低87%,并已向Pro和Team用户开放,标志着ChatGPT正从聊天机器人转型为高效工作助手。
-
[](https://upload.chinaz.com/2025/0611/6388522995750601489730264.png)
[](https://upload.chinaz.com/2025/0611/6388522996825463752393708.png)
+
[](https://upload.chinaz.com/2025/0611/6388522995750601489730264.png)
[](https://upload.chinaz.com/2025/0611/6388522996825463752393708.png)
4. 美国西北大学医学院研发的**全球首个临床AI放射系统**已在12家医院全面部署,它能在**毫秒内识别危及生命的病症**,并通过读取完整影像、生成95%报告,大幅提升医学影像诊断效率。该系统已将报告生成效率平均提升15.5%(CT影像分析甚至高达80%),有望显著缓解全球放射科医生短缺问题,并帮助医生更快做出诊断,尤其是在危急病例中。
-
[](https://pic.chinaz.com/picmap/202307181418295015_2.jpg)
+
[](https://pic.chinaz.com/picmap/202307181418295015_2.jpg)
5. **Krea AI**近期发布了其首款图像生成模型**Krea1**,该模型以卓越的**美学控制力**和**画质表现**,解决了传统AI图像生成中存在的"AI外观”问题,并支持风格参考及定制化训练。目前,Krea AI已开放Krea1的**免费测试版**,赋能创作者将创意转化为高质量视觉作品,同时还提供了高达**4K高清**的图像增强功能。
-
[](https://upload.chinaz.com/2025/0611/6388522900588735216957802.png)
+
[](https://upload.chinaz.com/2025/0611/6388522900588735216957802.png)
-**AI前沿研究**
+###### **AI前沿研究**
1. 北京大学、字节跳动和卡内基梅隆大学联合发布了**PartCrafter**项目,该技术能从单张RGB图像直接生成**高精度、结构化**的3D模型,彻底颠覆了传统"先分割再重建”的复杂流程,并将生成时间缩短至约40秒。PartCrafter最引人注目的是其"**透视**”能力,即使输入图像中部分结构被遮挡,也能推断并生成完整的3D几何结构,展现了AI在3D生成领域的巨大潜力,对**游戏开发**、**虚拟现实**和**工业设计**等领域具有广泛应用前景。
-
[](https://upload.chinaz.com/2025/0611/6388525842061362121470345.png)
+
[](https://upload.chinaz.com/2025/0611/6388525842061362121470345.png)
2. 伊利诺伊大学香槟分校和加州大学伯克利分校的研究人员共同开发了**突破性AI框架AlphaOne**,它让大型语言模型能通过"**先慢思考后快思考**”策略精确调控推理过程,解决了现有大模型"过度思考”与"思考不足”的痛点。实验证明,AlphaOne在准确率上平均提升了6.15%,并显著降低约21%的计算成本,为企业级AI应用提供了高效可靠的工具,其代码即将发布于[GitHub](https://github.com/ASTRAL-Group/AlphaOne)。
-
[](https://upload.chinaz.com/2025/0611/6388523084741801708351334.png)
[](https://upload.chinaz.com/2025/0611/6388523085448158916607664.png)
+
[](https://upload.chinaz.com/2025/0611/6388523084741801708351334.png)
[](https://upload.chinaz.com/2025/0611/6388523085448158916607664.png)
3. 一篇名为**DiscoVLA**的学术论文提出了一种创新方法,通过同步处理视觉、语言和对齐方面的差异,显著提升了**视频文本检索**的效率与准确性,尤其是在MSRVTT数据集上表现优异,为参数高效的视频文本检索提供了新的思路,更多信息可查看[论文链接](https://arxiv.org/abs/2506.08887)。
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. OpenAI首席执行官**Sam Altman**在其最新博客文章中预测,**AI技术**已跨越关键临界点,未来将迎来**"温和奇点”**。他预计到**2026年**,AI系统将能够自主发现新颖见解;到**2027年**,AI驱动的机器人将在现实世界执行任务;而到**2030年代**,人类将进入智能与能量极大丰富的时代,彻底重塑经济与社会。他强调需加大对AI基础设施的投资并加强治理和安全措施。
-
[](https://pic.chinaz.com/picmap/202412271635331372_1.jpg)
+
[](https://pic.chinaz.com/picmap/202412271635331372_1.jpg)
2. OpenAI 首席科学家 **Ilya Sutskever** 近日在母校多伦多大学演讲,分享了他对**人工智能 (AI)** 发展的深刻见解,强调 **AI** 正在迅速改变学习和工作模式。他预测 **AI** 未来有潜力完成所有人类任务,但也带来了巨大挑战,需要人类思考如何合理利用这一变革。
-
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
+
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
3. 特朗普政府一项旨在推动 **AI** 技术在联邦政府应用的全新计划 "**AI.gov**” 近日在 **GitHub** 上意外泄露。该计划包括聊天机器人、全能 **API** 及实时监控工具,旨在自动化联邦工作,但专家对此可能带来的**数据安全风险**表示担忧。
-
[](https://pic.chinaz.com/picmap/202304251756303409_0.jpg)
+
[](https://pic.chinaz.com/picmap/202304251756303409_0.jpg)
-**开源TOP项目**
+###### **开源TOP项目**
1. **Hyperswitch**是一个用Rust编写的开源支付交换系统,致力于实现**快速、可靠且经济实惠**的支付体验,已获得**20606**个星标,详情可访问其[GitHub](https://github.com/juspay/hyperswitch)页面。
2. 同时,有两个备受关注的开源项目:"**awesome**”项目([Link](https://github.com/sindresorhus/awesome))拥有365526颗星,提供了关于各种**有趣主题**的**精选列表**;而获得11717颗星的**vosk-api**项目([Link](https://github.com/alphacep/vosk-api))则是一个功能强大的**离线语音识别API**,支持Android、iOS、树莓派及服务器等多平台。
-**社媒分享**
+###### **社媒分享**
1. 黄赟在推文中对苹果的"**Liquid Glass**”技术表达了极大的热情,他认为这项技术并非仅仅是视觉上的美化,而是GUI软件为支持**多模态AI和AR/MR**、从屏幕向**空间计算**演进的必然本质变化。黄赟推测苹果不急于推出Apple Intelligence Model,可能正是在为更大范围地将AI渗透到**3D空间**做准备,这预示着苹果股票将再次腾飞。欲了解更多,请访问[原推文](https://x.com/huangyun_122/status/1932810735194943909)。
-
[](https://pbs.twimg.com/media/GtJGO_QbMAQcGq3?format=jpg&name=orig)
+
[](https://pbs.twimg.com/media/GtJGO_QbMAQcGq3?format=jpg&name=orig)
2. 杨毅在推文中阐述了他钟爱**AI Agent**的原因,认为它们能直接高效地解决问题,与许多工作中因"人情世故”而产生的低效与"造势”形成鲜明对比,并强调AI Agent只为结果和效率付费。详情可见[此推文](https://x.com/Yangyixxxx/status/1932777869639626876)。
3. Meng Shao则分享了AI工程师12项被低估但长期回报高的关键技能,其中包括**编写高质量提示词**、**构建与调试数据管道**以及**理解延迟与性能权衡**等实践能力。
-
[](https://pbs.twimg.com/media/GtJboRPbMAAQRyC?format=orig)
+
[](https://pbs.twimg.com/media/GtJboRPbMAAQRyC?format=orig)
4. Shing发帖宣布,**Arc**浏览器的新产品**Dia**将于2025年6月11日为Arc会员提供早鸟体验,邀请好奇用户率先尝鲜,访问[此链接](https://x.com/shing19_eth/status/1932686185434063352)了解更多。
-5. **Sam Altman**在社交媒体上表示,其团队的**开源权重模型**发布将推迟至今年夏末,而非六月,原因是研究团队取得了一项"**意料之外的突破**”,他相信这次成果**值得等待**。这一延迟旨在完善这项非凡的新进展。[Link](https://x.com/dotey/status/1932584576276210004)
\ No newline at end of file
+5. **Sam Altman**在社交媒体上表示,其团队的**开源权重模型**发布将推迟至今年夏末,而非六月,原因是研究团队取得了一项"**意料之外的突破**”,他相信这次成果**值得等待**。这一延迟旨在完善这项非凡的新进展。[Link](https://x.com/dotey/status/1932584576276210004)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-13.md b/daily/2025-06-13.md
index e6e6eba..09531f3 100644
--- a/daily/2025-06-13.md
+++ b/daily/2025-06-13.md
@@ -1,33 +1,42 @@
# AI洞察日报 2025/6/13
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. 字节跳动旗下火山引擎发布了最新**AI视频生成模型** **Seedance1.0Pro**,其在**文生视频**和**图生视频**任务中表现卓越,超越Google Veo3,位居行业榜首。该模型以其**高效**、**低成本**的视频生成能力,预计将**推动内容创作**、**电商营销**和**影视制作**等领域的**数字化转型**。
-
[](https://upload.chinaz.com/2025/0612/6388534378776980108331625.png)
+
[](https://upload.chinaz.com/2025/0612/6388534378776980108331625.png)
2. 字节跳动开发的**AI原生集成开发环境** **Trae**,截至2025年5月月活跃用户已突破100万,累计帮助开发者交付了超过60亿行代码。这款**AI驱动的IDE**通过**自动化编程任务**和**实时代码建议**,显著提升了**开发效率**,在全球开发者社区中快速普及。
-
[](https://upload.chinaz.com/2025/0612/6388533475781135647832660.png)
+
[](https://upload.chinaz.com/2025/0612/6388533475781135647832660.png)
3. 阿里巴巴旗下**夸克**推出了国内首个**"高考志愿大模型”**,旨在**免费**为考生提供智能志愿填报支持。该模型整合了**高考深度搜索**、**志愿报告**和**智能选志愿**三大核心功能,能根据考生的分数、性格等提供**个性化院校推荐**和**"冲稳保”方案**。
-
[](https://pic.chinaz.com/picmap/202306251749086020_11.jpg)
-4. 阿里巴巴近日重磅**开源**了基于**MNN框架**的**Mnn3dAvatar**,提供**实时面部捕捉**与**3D数字人**生成能力,旨在为**直播带货**等场景带来变革。该**开源框架**以**高效**、**轻量**、**多平台支持**等优势,大幅降低了**数字人内容创作门槛**,有望加速其商业化普及。 ['项目地址'](https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md)
[](https://pic.chinaz.com/picmap/202307041804006103_2.jpg)
+
[](https://pic.chinaz.com/picmap/202306251749086020_11.jpg)
+4. 阿里巴巴近日重磅**开源**了基于**MNN框架**的**Mnn3dAvatar**,提供**实时面部捕捉**与**3D数字人**生成能力,旨在为**直播带货**等场景带来变革。该**开源框架**以**高效**、**轻量**、**多平台支持**等优势,大幅降低了**数字人内容创作门槛**,有望加速其商业化普及。 ['项目地址'](https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md)
[](https://pic.chinaz.com/picmap/202307041804006103_2.jpg)
5. **The Browser Company**发布了以**AI**为核心的**Dia浏览器**,旨在将**智能**功能深度融入用户流程,让用户无需频繁切换AI工具。这款浏览器在URL栏内置了**AI聊天机器人**,能帮助用户**搜索网页**、**汇总文件**并根据多标签页内容自动**撰写草稿**,极大提升了**AI使用效率**。
-
[](https://upload.chinaz.com/2025/0612/6388531639415462888783294.png)
[](https://upload.chinaz.com/2025/0612/6388531640173819094278646.png)
+
[](https://upload.chinaz.com/2025/0612/6388531639415462888783294.png)
[](https://upload.chinaz.com/2025/0612/6388531640173819094278646.png)
6. 推主**出海去孵化器**推荐程序员使用**Cursor**、**CodeRabbit**和**Warp**这套**AI原生技术栈**,称其协同使用时**极速**且**魔法般高效**。这些工具提供**实时代码审查**、**AI构建调试**能力及**AI终端功能**,旨在显著提升**开发效率**。 ['更多详情'](https://m.okjike.com/originalPosts/684a78ca85dc67026ef84294)
7. 推主**歸藏**分享**Windsurf**发布**AI原生浏览器**的重大更新,该浏览器内置AI能自动感知**用户操作上下文**并与**编辑器**、**终端**实现**全流程协同**。此举旨在弥补开发者工作流中的**信息断层**,通过**流意识**共享提升**AI与用户协作效率**。 ['更多详情'](https://m.okjike.com/originalPosts/684a690d85dc67026ef727b3)
-**AI前沿研究**
+###### **AI前沿研究**
1. **PlayerOne**是一款开创性的**以自我为中心的真实世界模拟器**,它能根据用户的视角图像构建**虚拟世界**并生成与**真实人体运动**精确对齐的视频。这项研究展示了其在**精准控制人体动作**和**模拟多变场景**方面的强大泛化能力,为**世界建模**及其广泛应用开辟了新途径。 ['论文地址'](https://arxiv.org/abs/2506.09995)
2. 这项研究提出名为**AAPT(自回归对抗性后训练)**的方法,旨在将现有**大型视频生成模型**转换为**实时交互式视频生成器**,有效解决了传统模型的**计算量大**问题。该技术实现了**每秒24帧**的**实时流式视频生成**,支持**高分辨率输出**并允许**用户实时互动**,开辟了更**高效的视频创作模式**。 ['论文地址'](https://arxiv.org/abs/2506.09350)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 推主**宝玉**援引WSJ报道指出,**新闻网站**正遭受**谷歌AI工具**的重击,因**聊天机器人**取代**传统搜索**导致**流量急剧下滑**。这一变革迫使媒体公司加速**转型**并积极应对**版权挑战**,标志着**AI时代**对**互联网生态**的深刻重塑,谷歌正从"搜索引擎”转变为**"答案引擎”**。 ['更多详情'](https://x.com/dotey/status/1932934013431287961)
-
[](https://pbs.twimg.com/media/GtMpMd1XIAA5LA1?format=jpg&name=orig)
+
[](https://pbs.twimg.com/media/GtMpMd1XIAA5LA1?format=jpg&name=orig)
-**开源TOP项目**
+###### **开源TOP项目**
1. **Image Downloader MCP**是一款强大的**图片下载与处理工具**,能从各种URL快速进行**单张或批量下载**,并提供**实时进度跟踪**。它支持**格式转换**、**尺寸调整**及**压缩**等多种**图像处理**功能,帮助用户轻松高效地管理图片。 ['项目地址'](https://github.com/cced3000/mcp-image-downloader)
-
[](https://upload.chinaz.com/2025/0612/6388531530635678761222332.png)
[](https://upload.chinaz.com/2025/0612/6388531517629801742326218.png)
+
[](https://upload.chinaz.com/2025/0612/6388531530635678761222332.png)
[](https://upload.chinaz.com/2025/0612/6388531517629801742326218.png)
2. **chili3d**是一个拥有1411个星标的**网页版3D CAD应用程序**,它提供**在线模型设计和编辑**功能。 ['项目地址'](https://github.com/xiangechen/chili3d)
3. **youtube-transcript-api**是一个获得4396个星标的**Python API**,旨在**轻松获取YouTube视频的字幕和文本**,其优势在于**无需API密钥**或**无头浏览器**即可支持**自动生成字幕**。 ['项目地址'](https://github.com/jdepoix/youtube-transcript-api)
4. **all-rag-techniques**是一个拥有2565个星标的项目,致力于以更**简单的方式**实现**所有RAG技术**。 ['项目地址'](https://github.com/FareedKhan-dev/all-rag-techniques)
-**社媒分享**
+###### **社媒分享**
1. **大帅老猿**在社交媒体上分享了他开发的**开源Twitter视频下载工具**,强调其**3分钟快速部署**的简易性,并称其为"史上最好过审”的**Adsense入门项目**。该项目已有20多个镜像站成功上线,旨在帮助用户通过**Adsense**赚取广告费,同时也是学习**Nextjs**、**Hero UI**和**Tailwind**的优质实践。 ['更多详情'](https://x.com/ezshine/status/1933090601232454033)
-
[](https://pbs.twimg.com/media/GtO3S25bQAA2atL?format=jpg&name=orig)
\ No newline at end of file
+
[](https://pbs.twimg.com/media/GtO3S25bQAA2atL?format=jpg&name=orig)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-14.md b/daily/2025-06-14.md
index 893e702..3674ccc 100644
--- a/daily/2025-06-14.md
+++ b/daily/2025-06-14.md
@@ -1,24 +1,33 @@
# AI洞察日报 2025/6/14
-**AI产品与功能更新**
-1. **Manus AI**已免费推出其新版**聊天模式**,它能即时问答,并与**Agent模式**无缝切换,大幅降低了AI工具的使用门槛,可能由**Google Gemini模型**驱动,预示着生产力模式的变革。
[](https://pic.chinaz.com/picmap/202503061549552449_1.jpg)
-2. 谷歌将最新**图像生成模型****Imagen4**免费集成至**Gemini**平台,显著提升了**AI图像创作**能力,在图像细节、**文本渲染**和**色彩表现**方面实现突破,提供专业级体验。此举不仅优化了创作流程,更彰显了谷歌在**AI**领域的深远布局,预示着**Imagen4**未来有望在全球范围内得到广泛应用。
[](https://upload.chinaz.com/2025/0613/6388541074880002924267287.png)
-3. Google **DeepMind**发布了一款突破性的**人工智能**系统及其"**Weather Lab**”平台,能以史无前例的精度提前**15天**预测**热带气旋**的路径与强度,有效解决了传统气象模型难题。该系统比现有方法更快速、准确,与**美国国家飓风中心(NHC)**合作后,其实验性**AI预测**将融入NHC运行流程,有望在未来飓风季中挽救生命并减少经济损失,标志着**人工智能**在天气预报应用上迈出了关键一步。
[](https://pic.chinaz.com/picmap/202304251756311752_2.jpg)
+###### **AI产品与功能更新**
+1. **Manus AI**已免费推出其新版**聊天模式**,它能即时问答,并与**Agent模式**无缝切换,大幅降低了AI工具的使用门槛,可能由**Google Gemini模型**驱动,预示着生产力模式的变革。
[](https://pic.chinaz.com/picmap/202503061549552449_1.jpg)
+2. 谷歌将最新**图像生成模型****Imagen4**免费集成至**Gemini**平台,显著提升了**AI图像创作**能力,在图像细节、**文本渲染**和**色彩表现**方面实现突破,提供专业级体验。此举不仅优化了创作流程,更彰显了谷歌在**AI**领域的深远布局,预示着**Imagen4**未来有望在全球范围内得到广泛应用。
[](https://upload.chinaz.com/2025/0613/6388541074880002924267287.png)
+3. Google **DeepMind**发布了一款突破性的**人工智能**系统及其"**Weather Lab**”平台,能以史无前例的精度提前**15天**预测**热带气旋**的路径与强度,有效解决了传统气象模型难题。该系统比现有方法更快速、准确,与**美国国家飓风中心(NHC)**合作后,其实验性**AI预测**将融入NHC运行流程,有望在未来飓风季中挽救生命并减少经济损失,标志着**人工智能**在天气预报应用上迈出了关键一步。
[](https://pic.chinaz.com/picmap/202304251756311752_2.jpg)
-**AI前沿研究**
-1. **AI编程工具****Cursor**正试图通过**AI**彻底重塑编程,其目标是超越辅助编程,实现**"意图驱动”的软件开发**,让工程师从繁琐代码中解放,转而专注于更高维度的**"品味”**与设计。**Cursor**通过独立编辑器和数据飞轮构建核心优势,致力于引领**AI编码**的未来,并已获得多家头部企业的广泛认可。
[](https://pic.chinaz.com/picmap/202308291638475569_2.jpg)
+###### **AI前沿研究**
+1. **AI编程工具****Cursor**正试图通过**AI**彻底重塑编程,其目标是超越辅助编程,实现**"意图驱动”的软件开发**,让工程师从繁琐代码中解放,转而专注于更高维度的**"品味”**与设计。**Cursor**通过独立编辑器和数据飞轮构建核心优势,致力于引领**AI编码**的未来,并已获得多家头部企业的广泛认可。
[](https://pic.chinaz.com/picmap/202308291638475569_2.jpg)
2. **AutoMind**是一个自适应的**知识型大型语言模型(LLM)智能体框架**,旨在解决现有数据科学LLM智能体在处理复杂任务时工作流僵化和缺乏经验知识的局限。通过整合**专家知识库**、**智能体知识型树搜索算法**和**自适应编码策略**,**AutoMind**在自动化数据科学基准测试中表现卓越,有望推动数据科学的全面自动化。['论文地址'](https://arxiv.org/abs/2506.10974)
3. 针对中文有害内容检测资源稀缺问题,研究者推出了**ChineseHarm-Bench**,这是一个全面且经过专业标注的**中文有害内容检测基准**,完全基于真实世界数据构建,并包含一个辅助大型语言模型进行检测的**知识规则库**。该研究还提出了一种**知识增强基线**,能使小型模型在中文有害内容检测方面达到与先进大型语言模型相当的性能,显著提升了中文内容审核的效率和准确性。['论文地址'](https://arxiv.org/abs/2506.10960)
4. 针对长视频理解(LVU)对现有多模态大型语言模型(MLLMs)的挑战,**VideoDeepResearch**提出了一个创新的**智能体框架**,它仅通过结合一个纯文本的**大型推理模型**与**模块化多模态工具包**来解决LVU任务。该框架通过策略性地运用工具访问视频内容,在多个长视频理解基准测试中显著超越了现有MLLM的性能,证明了**智能体系统**在克服长视频理解难题方面的巨大潜力。['论文地址'](https://arxiv.org/abs/2506.10821)
-**AI行业展望与社会影响**
-1. 字节跳动超八成工程师使用**AI辅助开发**,这预示着程序员的价值正从**编写代码**转向更高层的**系统设计**、**问题建模**及**人机协作**。**AI编程工具**不仅提高效率,更将赋能"**人人可编程**”的未来,重新定义编程本质与数字社会参与权。
[](https://assets-v2.circle.so/3leqq6sdh1jjhc0xr0fbn23189uc)
-2. 迪士尼与环球影业联合起诉**AI公司Midjourney**,指控其非法使用版权内容训练模型并生成知名角色,旨在为**AI使用建立许可机制**。此案是好莱坞首次正式卷入生成式AI法律纠纷,其结果将深刻影响全球AI内容生成领域的法律框架与商业模式。
[](https://pic.chinaz.com/picmap/202005261143198116_2.jpg)
-3. 知名电商主播**罗永浩**宣布其**数字人形象**将于6月15日首秀**百度电商**直播带货,此举标志着"**AI+IP**”带货新模式的开启。这项由百度**高说服力数字人**技术赋能的尝试,有望推动**直播电商**行业向智能化、高效率转型,加速**AI**技术在商业领域的深度应用。
[](https://upload.chinaz.com/2025/0613/6388540745613399057145796.png)
+###### **AI行业展望与社会影响**
+1. 字节跳动超八成工程师使用**AI辅助开发**,这预示着程序员的价值正从**编写代码**转向更高层的**系统设计**、**问题建模**及**人机协作**。**AI编程工具**不仅提高效率,更将赋能"**人人可编程**”的未来,重新定义编程本质与数字社会参与权。
[](https://assets-v2.circle.so/3leqq6sdh1jjhc0xr0fbn23189uc)
+2. 迪士尼与环球影业联合起诉**AI公司Midjourney**,指控其非法使用版权内容训练模型并生成知名角色,旨在为**AI使用建立许可机制**。此案是好莱坞首次正式卷入生成式AI法律纠纷,其结果将深刻影响全球AI内容生成领域的法律框架与商业模式。
[](https://pic.chinaz.com/picmap/202005261143198116_2.jpg)
+3. 知名电商主播**罗永浩**宣布其**数字人形象**将于6月15日首秀**百度电商**直播带货,此举标志着"**AI+IP**”带货新模式的开启。这项由百度**高说服力数字人**技术赋能的尝试,有望推动**直播电商**行业向智能化、高效率转型,加速**AI**技术在商业领域的深度应用。
[](https://upload.chinaz.com/2025/0613/6388540745613399057145796.png)
-**开源TOP项目**
+###### **开源TOP项目**
1. **awesome-llm-apps**是一个坐拥**39000**星标的开源项目,它巧妙融合了**AI Agent**和**RAG**等前沿技术,并广泛利用OpenAI、Anthropic、Gemini及各类开源模型,旨在为开发者呈现一系列卓越的**LLM**(大型语言模型)应用范例。['项目地址'](https://github.com/Shubhamsaboo/awesome-llm-apps)
2. 微软推出的**ai-agents-for-beginners**项目,凭借**26135**星标,为渴望步入**AI智能体**构建世界的新手们提供了11节精心设计的课程,让复杂的技术学习变得更加平易近人。['项目地址'](https://github.com/microsoft/ai-agents-for-beginners)
-**社媒分享**
-1. Meng Shao发文指出,当前**构建AI Agent**的关键在于**上下文工程(Context Engineering)**,而非盲目追求**多智能体(Multi-Agents)**,并强调AI Agent开发目前仍处于早期阶段,缺乏统一标准,如同早期网页开发。他通过实践分享了利用**Claude Sonnet 4**和**Grok 3**进行**信息卡**制作的经验,以阐释**上下文工程**在**GenAI应用工程师**角色中的重要性。['更多详情'](https://x.com/shao__meng/status/1933528988145889311)
[](https://pbs.twimg.com/media/GtVGXhxbMAAHDC3?format=jpg&name=orig)
[](https://pbs.twimg.com/media/GtVGXeTbMAIvujU?format=jpg&name=orig)
[](https://pbs.twimg.com/media/GtSGL8na4AAXcj6?format=orig)
\ No newline at end of file
+###### **社媒分享**
+1. Meng Shao发文指出,当前**构建AI Agent**的关键在于**上下文工程(Context Engineering)**,而非盲目追求**多智能体(Multi-Agents)**,并强调AI Agent开发目前仍处于早期阶段,缺乏统一标准,如同早期网页开发。他通过实践分享了利用**Claude Sonnet 4**和**Grok 3**进行**信息卡**制作的经验,以阐释**上下文工程**在**GenAI应用工程师**角色中的重要性。['更多详情'](https://x.com/shao__meng/status/1933528988145889311)
[](https://pbs.twimg.com/media/GtVGXhxbMAAHDC3?format=jpg&name=orig)
[](https://pbs.twimg.com/media/GtVGXeTbMAIvujU?format=jpg&name=orig)
[](https://pbs.twimg.com/media/GtSGL8na4AAXcj6?format=orig)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-15.md b/daily/2025-06-15.md
index c1241f1..a56ed98 100644
--- a/daily/2025-06-15.md
+++ b/daily/2025-06-15.md
@@ -1,21 +1,30 @@
# AI洞察日报 2025/6/15
-**AI产品与功能更新**
-1. 在2025年高考后的AI数学实战测试中,**夸克**大模型以145分和146分的优异成绩荣登榜首,超越了豆包和元宝等竞争对手,树立了国产**AI数学能力**的新标杆。它不仅展现出惊人的准确率,答题速度也遥遥领先,其强大的**理科解题能力**为用户开启了启发式学习的新篇章。
[](https://upload.chinaz.com/2025/0613/6388543968950501631465721.png)
+###### **AI产品与功能更新**
+1. 在2025年高考后的AI数学实战测试中,**夸克**大模型以145分和146分的优异成绩荣登榜首,超越了豆包和元宝等竞争对手,树立了国产**AI数学能力**的新标杆。它不仅展现出惊人的准确率,答题速度也遥遥领先,其强大的**理科解题能力**为用户开启了启发式学习的新篇章。
[](https://upload.chinaz.com/2025/0613/6388543968950501631465721.png)
-**AI前沿研究**
-1. orange.ai的推文爆料了一件趣事:有人直接让**Claude Opus**"署名”第一作者,撰写了一篇名为《The Illusion of the Illusion of Thinking》的短文,这简直是直接"回怼”了苹果公司质疑大模型推理能力的那篇《The Illusion of Thinking》论文,顺便也"辣评”了一下**苹果的AI研究水平**。这一举动不仅暗示了**Claude Opus**在AI领域的强大实力,更引爆了关于大模型到底有没有**思考本质**的哲学大讨论。 ['更多详情'](https://x.com/oran_ge/status/1933855655955505158)
[](https://pbs.twimg.com/media/GtZuaaIbUAA4QD3?format=jpg&name=orig)
+###### **AI前沿研究**
+1. orange.ai的推文爆料了一件趣事:有人直接让**Claude Opus**"署名”第一作者,撰写了一篇名为《The Illusion of the Illusion of Thinking》的短文,这简直是直接"回怼”了苹果公司质疑大模型推理能力的那篇《The Illusion of Thinking》论文,顺便也"辣评”了一下**苹果的AI研究水平**。这一举动不仅暗示了**Claude Opus**在AI领域的强大实力,更引爆了关于大模型到底有没有**思考本质**的哲学大讨论。 ['更多详情'](https://x.com/oran_ge/status/1933855655955505158)
[](https://pbs.twimg.com/media/GtZuaaIbUAA4QD3?format=jpg&name=orig)
2. **orange.ai** 精彩地揭示了**Anthropic (Claude)** 与 **Cognition (Devin)** 之间围绕**多智能体系统**利弊展开的一场"神仙打架”:Claude力挺**集体智慧**,认为多智能体能凭借多样性突破单智能体上下文瓶颈,性能可提升超90%;而Devin则泼了冷水,警告多智能体可能引发**上下文**不一致、信息碎片化以及沟通不畅等问题。这场辩论犹如一面镜子,映照出**AI架构设计**的复杂性堪比管理一家大公司,同时它也可能预示着在**Scaling Law**逐渐放缓之后,**多智能体**形成的**集体智慧**,将成为推动AI实现指数级增长的关键"萌芽”。 ['更多详情'](https://m.okjike.com/originalPosts/684d04752b50c68918ad2b33)
-**AI行业展望与社会影响**
-1. Gartner大胆预测,到2028年,高达80%的**生成式AI商业应用**将直接在现有数据管理平台上孵化,这简直是为开发者们按下了"加速键”,预计能将项目交付时间缩短一半,并大大降低开发难度。其中,**检索增强生成(RAG)**技术被视为核心利器,它能让AI模型更准确、更可靠,还能结合企业最新数据,为流程优化、用户体验提升和未来洞察预测注入强大动力。
[](https://pic.chinaz.com/picmap/202005281119277542_8.jpg)
-2. Match Group的最新研究揭示了一个耐人寻味的新趋势:**AI伴侣**正悄然成为人们的**情感新选择**。调查发现,有16%的受访者甚至将机器人视为"浪漫伴侣”,更令人惊讶的是,高达60%的人竟认为伴侣拥有AI女友或男友并不构成**出轨**,这无疑在挑战我们对亲密关系的传统定义。然而,尽管AI伴侣能提供情感慰藉,专家们也警示其潜在风险,例如可能加剧**社交隔离**,并引发隐私和**伦理问题**。这无疑促使我们深入反思技术与人类情感的未来将如何交织。
[](https://pic.chinaz.com/picmap/202306131739278937_3.jpg)
-3. Liko感慨,有了**Cursor**和**Claude code**这两大神器,传统的**工程开发方式**简直在经历一场"大**变革**”!他指出,小团队借助**AI Agent**的敏捷协作,效率高到能把大公司那些僵化流程甩在身后。这种**AI工具**的加速迭代能力,从Lovable活动和Cursor/Claude团队自身产品飞速开发的实践中可见一斑,预示着未来的创新将以你想象不到的速度井喷,甚至可能让我们这些"打工人”都有种"无事可做”的冲击感。 ['更多详情'](https://m.okjike.com/originalPosts/684d160bf0d718ce7a6b99e2)
[](https://cdnv2.ruguoapp.com/Fpb491XArxjnYilh_zVqkm3A1D64v3.png)
[](https://cdnv2.ruguoapp.com/FvFd3vTcCw0HN9Sc2cc3_8mAhM1cv3.png)
+###### **AI行业展望与社会影响**
+1. Gartner大胆预测,到2028年,高达80%的**生成式AI商业应用**将直接在现有数据管理平台上孵化,这简直是为开发者们按下了"加速键”,预计能将项目交付时间缩短一半,并大大降低开发难度。其中,**检索增强生成(RAG)**技术被视为核心利器,它能让AI模型更准确、更可靠,还能结合企业最新数据,为流程优化、用户体验提升和未来洞察预测注入强大动力。
[](https://pic.chinaz.com/picmap/202005281119277542_8.jpg)
+2. Match Group的最新研究揭示了一个耐人寻味的新趋势:**AI伴侣**正悄然成为人们的**情感新选择**。调查发现,有16%的受访者甚至将机器人视为"浪漫伴侣”,更令人惊讶的是,高达60%的人竟认为伴侣拥有AI女友或男友并不构成**出轨**,这无疑在挑战我们对亲密关系的传统定义。然而,尽管AI伴侣能提供情感慰藉,专家们也警示其潜在风险,例如可能加剧**社交隔离**,并引发隐私和**伦理问题**。这无疑促使我们深入反思技术与人类情感的未来将如何交织。
[](https://pic.chinaz.com/picmap/202306131739278937_3.jpg)
+3. Liko感慨,有了**Cursor**和**Claude code**这两大神器,传统的**工程开发方式**简直在经历一场"大**变革**”!他指出,小团队借助**AI Agent**的敏捷协作,效率高到能把大公司那些僵化流程甩在身后。这种**AI工具**的加速迭代能力,从Lovable活动和Cursor/Claude团队自身产品飞速开发的实践中可见一斑,预示着未来的创新将以你想象不到的速度井喷,甚至可能让我们这些"打工人”都有种"无事可做”的冲击感。 ['更多详情'](https://m.okjike.com/originalPosts/684d160bf0d718ce7a6b99e2)
[](https://cdnv2.ruguoapp.com/Fpb491XArxjnYilh_zVqkm3A1D64v3.png)
[](https://cdnv2.ruguoapp.com/FvFd3vTcCw0HN9Sc2cc3_8mAhM1cv3.png)
-**开源TOP项目**
-1. 腾讯在CVPR 2025大会上震撼宣布,**混元3D 2.1大模型**正式**开源**!作为首个全链路**工业级3D生成**大模型,它在3D效果和材质表现上取得了显著突破,更令人兴奋的是,它甚至支持**消费级显卡**部署,极大地降低了普通用户和开发者的**3D内容创作**门槛。这款模型为游戏、电影等行业提供了高效的解决方案,并在Hugging Face平台已累计超过180万次下载,可见其在全球开发者心中的超高人气。 ['项目地址'](https://3d-models.hunyuan.tencent.com/)
[](https://upload.chinaz.com/2025/0614/6388549152278757021943660.png)
+###### **开源TOP项目**
+1. 腾讯在CVPR 2025大会上震撼宣布,**混元3D 2.1大模型**正式**开源**!作为首个全链路**工业级3D生成**大模型,它在3D效果和材质表现上取得了显著突破,更令人兴奋的是,它甚至支持**消费级显卡**部署,极大地降低了普通用户和开发者的**3D内容创作**门槛。这款模型为游戏、电影等行业提供了高效的解决方案,并在Hugging Face平台已累计超过180万次下载,可见其在全球开发者心中的超高人气。 ['项目地址'](https://3d-models.hunyuan.tencent.com/)
[](https://upload.chinaz.com/2025/0614/6388549152278757021943660.png)
-**社媒分享**
+###### **社媒分享**
1. 推主wwwgoubuli分享了他与**AI闲聊**的"高级”体验,他发现AI特别擅长输出那些**正确且复杂的长难句**,这给他带来了与众不同的阅读享受。他幽默地指出,虽然我们日常交流多用短句,但只有与AI对话时,才能尽情沉浸在这种由长句构建的、充满**丰富语义体验**的语境中。 ['更多详情'](https://x.com/wwwgoubuli/status/1933814617052225790)
-2. **ginobefun** 真心分享了一份"压箱底”的好东西:一份他耗费一天心血整理的**AI 领域精选 RSS 订阅源**,里面囊括了200多篇技术文章、30多个AI播客,以及150多个Twitter上的AI核心用户,简直是追逐AI前沿动态的"武林秘籍”!他特别推荐大家使用 **@follow_app_** 来导入这些资源,并盛赞其提供的**AI 总结、翻译**和最近阅读者功能,大大提升了使用体验。 ['项目地址'](https://github.com/ginobefun/BestBlogs)
[](https://pbs.twimg.com/media/GtY_khObUAAgP45?format=jpg&name=orig)
-3. 李继刚在社交媒体上分享了他对**AI使用方式**的独到见解。他指出,无论是最初那种"老子天下第一”的**"人比AI凶”**模式(以我为主),还是现在许多人误以为的"AI是大哥”的**"AI为主,我为仆人”**模式(vibe coding),都存在局限性。而他如今坚定地认为,只有**"人与AI协作共创”**,才能真正**释放AI潜能**,让技术发挥出最大价值。 ['更多详情'](https://m.okjike.com/originalPosts/684cf0882b50c68918abec5c)
\ No newline at end of file
+2. **ginobefun** 真心分享了一份"压箱底”的好东西:一份他耗费一天心血整理的**AI 领域精选 RSS 订阅源**,里面囊括了200多篇技术文章、30多个AI播客,以及150多个Twitter上的AI核心用户,简直是追逐AI前沿动态的"武林秘籍”!他特别推荐大家使用 **@follow_app_** 来导入这些资源,并盛赞其提供的**AI 总结、翻译**和最近阅读者功能,大大提升了使用体验。 ['项目地址'](https://github.com/ginobefun/BestBlogs)
[](https://pbs.twimg.com/media/GtY_khObUAAgP45?format=jpg&name=orig)
+3. 李继刚在社交媒体上分享了他对**AI使用方式**的独到见解。他指出,无论是最初那种"老子天下第一”的**"人比AI凶”**模式(以我为主),还是现在许多人误以为的"AI是大哥”的**"AI为主,我为仆人”**模式(vibe coding),都存在局限性。而他如今坚定地认为,只有**"人与AI协作共创”**,才能真正**释放AI潜能**,让技术发挥出最大价值。 ['更多详情'](https://m.okjike.com/originalPosts/684cf0882b50c68918abec5c)
+
+---
+
+###### **收听语音版**
+
+| 🎙️ **小宇宙** | 📹 **抖音** |
+| --- | --- |
+| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
+|  |  |
\ No newline at end of file
diff --git a/daily/2025-06-16.md b/daily/2025-06-16.md
index 7a4dce9..b88ee8e 100644
--- a/daily/2025-06-16.md
+++ b/daily/2025-06-16.md
@@ -1,28 +1,28 @@
# AI洞察日报 2025/6/16
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. **Sketch2Vid**是一款前沿的**AI工具项目**,能把**手绘草图**变**动态视频**,还自带声音!它结合了Google的**Veo 3模型**和**Gemini**,通过**AI智能理解**,**自动生成高清视频**和**音效**,为**创意表达**开辟了新天地。['项目地址'](https://github.com/NSTiwari/Sketch2Vid)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 百度最近放了个"大招”,启动了史上最大规模的**AI人才招聘**——**2026届"AIDU计划”**,目标是培养**未来AI技术领军人才**。这个计划提供了包括**大模型算法**、**机器学习**等23个热门方向的岗位,还给入选者配备了海量的算力、亿级用户场景和专家指导,誓要助他们一臂之力,成为**AI领域的佼佼者**。
-**开源TOP项目**
+###### **开源TOP项目**
1. **deepeval**是一款拥有7959颗星的**LLM评估框架**,专为**大语言模型**提供**专业的性能评估**能力,帮助开发者**衡量模型效果**。['项目地址'](https://github.com/confident-ai/deepeval)
2. "all-rag-techniques”是一个坐拥**4166星**的**开源项目**,它的厉害之处在于能用更简单的方法实现所有**RAG技术**,大大减轻了开发者的负担。['项目地址'](https://github.com/FareedKhan-dev/all-rag-techniques)
3. 拥有**36291星**的"ai-hedge-fund”项目可不一般,它是一个用**AI技术**武装起来的**对冲基金团队**,专门通过**人工智能驱动的策略**进行**金融投资**。['项目地址'](https://github.com/virattt/ai-hedge-fund)
-**社媒分享**
+###### **社媒分享**
1. **orange.ai**在社交媒体上分享了**Veo3模型**的试用感受,对它的表现表示肯定,但特别指出通过聊天控制时,**Prompt**(提示词)的设计需要费一番心思。他还提到,**Gemini**有个小**Bug**,得连点两次"Video”按钮才能避免生成图片路径。['更多详情'](https://x.com/oran_ge/status/1934204708614545697)
2. 杨轶在社交媒体上给**创业者**们支招,教大家如何避免做出"无人问津”的产品,核心秘诀是快速**验证**想法。他分享了一个超简单的**"四问过滤法”**:想想有没有付费用户?有没有现有受众?能不能用一句话说清产品核心价值?能不能快速推出功能版?目的就是让创业者**尽早失败**、**尽早学习**,别在没市场需求的项目上白费力气。['更多详情'](https://m.okjike.com/originalPosts/684e90216c1af58f5d957ece)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-17.md b/daily/2025-06-17.md
index 04b568e..4282b27 100644
--- a/daily/2025-06-17.md
+++ b/daily/2025-06-17.md
@@ -1,33 +1,33 @@
# AI洞察日报 2025/6/17
-**AI产品与功能更新**
-1. 字节跳动近日发布了**豆包大模型1.6版本**,其在**推理**、**数学**、**指令遵循**等核心领域性能显著提升,并在测试中跻身全球前列。更棒的是,它还大幅降低了使用成本,从而有力推动了**AI Agent**在消费电子、汽车、金融等行业的快速落地应用。得益于**创新性价格策略**,该版本的日均调用量已从3月份的12.7万亿 **tokens** 飙升至5月底的16.4万亿 **tokens**,这为企业构建真正智能的AI Agent奠定了坚实基础。
[](https://pic.chinaz.com/picmap/202405160815252726_0.jpg)
-2. 小米官宣将于**7月底**举行新品发布会,届时将隆重推出其**首款真AI眼镜**。这款眼镜将**对标Meta雷朋**,有望凭借**双芯架构**、**高清镜头**以及**强大AI功能**,实现感知现实世界,并提供前所未有的丰富交互与应用体验。此举不仅标志着小米在**智能穿戴设备领域**迈出了至关重要的一步,也预示着**AI技术**未来将在消费者日常生活中扮演越来越重要的角色。
[](https://pic.chinaz.com/picmap/202201041728161005_6.jpg)
-3. 人工智能初创公司**Genspark**近期发布了**Genspark AI Browser**,这是一款集成先进**AI技术**的智能浏览器。它通过**内置AI代理**和创新的**自动驾驶模式**等功能,旨在彻底提升用户生产力与效率,开启一个全新的智能网络浏览时代。该浏览器目前支持**macOS**系统,并计划开发**Windows**版本,在**学术研究**、**商业决策**和**内容创作**等多个场景都展现出巨大的应用潜力。
[](https://upload.chinaz.com/2025/0616/6388566537456580447261521.png)
-4. 为了应对**AIGC**(AI生成内容)真伪难辨的挑战,研究人员们推出了一项全球首创的技术——**IVY-FAKE**,这是一个图像与视频的**可解释性检测框架**。它不仅仅能够识别出AI生成的内容,更厉害的是,它还能清晰地"解释”自己做出判断的依据,彻底解决了传统检测工具的"黑箱”难题。该框架巧妙地运用了大规模多模态数据集和**IVY-XDETECTOR模型**,能够详细指出图像或视频中的视觉伪影,从而大大提升了AI内容检测的透明度和可信度,为打击虚假信息和进行内容溯源提供了全新的、强有力的解决方案。
[](https://pic.chinaz.com/picmap/202405161743174033_10.jpg)
+###### **AI产品与功能更新**
+1. 字节跳动近日发布了**豆包大模型1.6版本**,其在**推理**、**数学**、**指令遵循**等核心领域性能显著提升,并在测试中跻身全球前列。更棒的是,它还大幅降低了使用成本,从而有力推动了**AI Agent**在消费电子、汽车、金融等行业的快速落地应用。得益于**创新性价格策略**,该版本的日均调用量已从3月份的12.7万亿 **tokens** 飙升至5月底的16.4万亿 **tokens**,这为企业构建真正智能的AI Agent奠定了坚实基础。
[](https://pic.chinaz.com/picmap/202405160815252726_0.jpg)
+2. 小米官宣将于**7月底**举行新品发布会,届时将隆重推出其**首款真AI眼镜**。这款眼镜将**对标Meta雷朋**,有望凭借**双芯架构**、**高清镜头**以及**强大AI功能**,实现感知现实世界,并提供前所未有的丰富交互与应用体验。此举不仅标志着小米在**智能穿戴设备领域**迈出了至关重要的一步,也预示着**AI技术**未来将在消费者日常生活中扮演越来越重要的角色。
[](https://pic.chinaz.com/picmap/202201041728161005_6.jpg)
+3. 人工智能初创公司**Genspark**近期发布了**Genspark AI Browser**,这是一款集成先进**AI技术**的智能浏览器。它通过**内置AI代理**和创新的**自动驾驶模式**等功能,旨在彻底提升用户生产力与效率,开启一个全新的智能网络浏览时代。该浏览器目前支持**macOS**系统,并计划开发**Windows**版本,在**学术研究**、**商业决策**和**内容创作**等多个场景都展现出巨大的应用潜力。
[](https://upload.chinaz.com/2025/0616/6388566537456580447261521.png)
+4. 为了应对**AIGC**(AI生成内容)真伪难辨的挑战,研究人员们推出了一项全球首创的技术——**IVY-FAKE**,这是一个图像与视频的**可解释性检测框架**。它不仅仅能够识别出AI生成的内容,更厉害的是,它还能清晰地"解释”自己做出判断的依据,彻底解决了传统检测工具的"黑箱”难题。该框架巧妙地运用了大规模多模态数据集和**IVY-XDETECTOR模型**,能够详细指出图像或视频中的视觉伪影,从而大大提升了AI内容检测的透明度和可信度,为打击虚假信息和进行内容溯源提供了全新的、强有力的解决方案。
[](https://pic.chinaz.com/picmap/202405161743174033_10.jpg)
-**AI前沿研究**
-1. 字节跳动近日推出了一款具有革新意义的AI视频生成模型——**Seaweed APT2**,它在**实时视频流生成**、**互动相机控制**以及**虚拟人类生成**方面实现了重大突破。这款模型甚至能在**单块H100 GPU**上以每秒24帧的速度生成流畅视频,被业界誉为"通往**虚拟全息甲板**的重要一步”。凭借其**高效性能**和**创新交互特性**,Seaweed APT2有望成为未来虚拟内容创作的"基础设施”,彻底重塑**AI视频生态**,为影视、游戏、元宇宙等领域带来一场深刻的革命。
[](https://upload.chinaz.com/2025/0616/6388568231258925934108019.jpg)
-2. 研究人员们提出了**MagicTryOn**,这是一个基于**Wan2.1视频模型**构建的创新**视频虚拟试穿**框架。它巧妙地利用**扩散变换器**技术,成功解决了现有虚拟试穿技术在**时空一致性**和**服装内容保留**方面的痛点,尤其在人物进行**大幅度运动**时,其表现依然卓越,这无疑展现了该技术在时尚领域,如在线购物和虚拟形象定制中的巨大潜力。
[](https://upload.chinaz.com/2025/0616/6388566908436290832995643.png)
['项目地址'](https://vivocameraresearch.github.io/magictryon/)
+###### **AI前沿研究**
+1. 字节跳动近日推出了一款具有革新意义的AI视频生成模型——**Seaweed APT2**,它在**实时视频流生成**、**互动相机控制**以及**虚拟人类生成**方面实现了重大突破。这款模型甚至能在**单块H100 GPU**上以每秒24帧的速度生成流畅视频,被业界誉为"通往**虚拟全息甲板**的重要一步”。凭借其**高效性能**和**创新交互特性**,Seaweed APT2有望成为未来虚拟内容创作的"基础设施”,彻底重塑**AI视频生态**,为影视、游戏、元宇宙等领域带来一场深刻的革命。
[](https://upload.chinaz.com/2025/0616/6388568231258925934108019.jpg)
+2. 研究人员们提出了**MagicTryOn**,这是一个基于**Wan2.1视频模型**构建的创新**视频虚拟试穿**框架。它巧妙地利用**扩散变换器**技术,成功解决了现有虚拟试穿技术在**时空一致性**和**服装内容保留**方面的痛点,尤其在人物进行**大幅度运动**时,其表现依然卓越,这无疑展现了该技术在时尚领域,如在线购物和虚拟形象定制中的巨大潜力。
[](https://upload.chinaz.com/2025/0616/6388566908436290832995643.png)
['项目地址'](https://vivocameraresearch.github.io/magictryon/)
-**开源TOP项目**
-1. **微软Azure DevOps**已将其全新的**MCP Server项目**开源,此举旨在将强大的**DevOps功能**无缝整合进**VS Code**等主流代码编辑器,从而显著提升开发者的工作效率。这个本地服务器让开发者能够通过简单的自然语言提示来管理**项目**、**代码仓库**、**构建发布**等一系列任务,并且深度支持与**GitHub Copilot的Agent Mode**进行互动,让开发流程更加智能便捷。
[](https://upload.chinaz.com/2025/0616/6388566336412195264876523.png)
['项目地址'](https://github.com/microsoft/azure-devops-mcp)
+###### **开源TOP项目**
+1. **微软Azure DevOps**已将其全新的**MCP Server项目**开源,此举旨在将强大的**DevOps功能**无缝整合进**VS Code**等主流代码编辑器,从而显著提升开发者的工作效率。这个本地服务器让开发者能够通过简单的自然语言提示来管理**项目**、**代码仓库**、**构建发布**等一系列任务,并且深度支持与**GitHub Copilot的Agent Mode**进行互动,让开发流程更加智能便捷。
[](https://upload.chinaz.com/2025/0616/6388566336412195264876523.png)
['项目地址'](https://github.com/microsoft/azure-devops-mcp)
2. "**awesome-llm-apps**”是一个在GitHub上拥有**42820**颗星的**精选LLM应用集**。它巧妙地结合了**AI代理**和**RAG**(检索增强生成)技术,并兼容OpenAI、Anthropic、Gemini以及多种开源模型,旨在为用户提供多样化、高质量的**大模型**应用解决方案。 ['项目地址'](https://github.com/Shubhamsaboo/awesome-llm-apps)
3. "**awesome**”项目是一个名副其实的明星项目,拥有高达**368796**颗星,它精心收集了**各类有趣且高质量的话题列表**,为用户提供了海量且广泛领域内的优质资源,简直是"包罗万象”的学习和探索宝库。 ['项目地址'](https://github.com/sindresorhus/awesome)
-**社媒分享**
+###### **社媒分享**
1. 博主"归藏”分享了他对MiniMax通用Agent产品的亲身体验,对其在**Vibe Coding**方面的卓越表现赞不绝口。这款Agent能够**自主查找、整理并生成网页所需的一切信息**(包括图文内容),甚至还能**智能测试并优化网页功能**,简直是网页制作的小能手。他通过制作旅游介绍、艺术家对比和《攻壳机动队》分析等多种网页,生动展示了该Agent**出色的内容生成、图像处理、设计和数据可视化能力**。更棒的是,这款产品目前还提供了**免费试用**机会,感兴趣的朋友可以访问['示例与教程'](https://mp.weixin.qq.com/s/E1ivlVdvP6EE9k4rnVGQg)了解更多提示词和演示。 ['更多详情'](https://m.okjike.com/originalPosts/684fd230f0d718ce7a98c061)
-2. 博主"兔撕鸡大老爷”对**豆包P图**的体验感受只有两个字——"真好玩”!他甚至将这款工具誉为**生活改造的利器**,以及在**工业造型设计**领域里无所不能的"**超级神器**”。为了让大家眼见为实,博文中还附上了多张图片示例,直观展示了**豆包P图**那些令人惊叹的效果。 ['更多详情'](https://m.okjike.com/originalPosts/684fcc4d3ed7abe5a4c7ffd9)
[](https://cdnv2.ruguoapp.com/FhTI-8kz9ZFN8WUFK7EfLnWu17IGv3.jpg)
[](https://cdnv2.ruguoapp.com/Flxu2FJnbiVgJ2gfXCaFH6eFaBEuv3.jpg)
[](https://cdnv2.ruguoapp.com/FlO-2nK1xWLFabbTJ-uq5SYhA8gPv3.jpg)
[](https://cdnv2.ruguoapp.com/FlIQ14lFAJLmNyQDSub9PpB-L2Wqv3.jpg)
[](https://cdnv2.ruguoapp.com/Fj0ilTSkCW9DfbWtgRpSct4ymiJ_v3.png)
+2. 博主"兔撕鸡大老爷”对**豆包P图**的体验感受只有两个字——"真好玩”!他甚至将这款工具誉为**生活改造的利器**,以及在**工业造型设计**领域里无所不能的"**超级神器**”。为了让大家眼见为实,博文中还附上了多张图片示例,直观展示了**豆包P图**那些令人惊叹的效果。 ['更多详情'](https://m.okjike.com/originalPosts/684fcc4d3ed7abe5a4c7ffd9)
[](https://cdnv2.ruguoapp.com/FhTI-8kz9ZFN8WUFK7EfLnWu17IGv3.jpg)
[](https://cdnv2.ruguoapp.com/Flxu2FJnbiVgJ2gfXCaFH6eFaBEuv3.jpg)
[](https://cdnv2.ruguoapp.com/FlO-2nK1xWLFabbTJ-uq5SYhA8gPv3.jpg)
[](https://cdnv2.ruguoapp.com/FlIQ14lFAJLmNyQDSub9PpB-L2Wqv3.jpg)
[](https://cdnv2.ruguoapp.com/Fj0ilTSkCW9DfbWtgRpSct4ymiJ_v3.png)
3. 博主"归藏”还分享了**AI视频**领域一个迅速走红的新品类——**AI ASMR视频**。这类视频能够轻松实现现实中难以制作的奇特场景,比如"切割玻璃”或者"金属水果”等,真是脑洞大开!他甚至贴心地提供了一套用于Veo 3**文生视频**的提示词,手把手演示了如何生成一段**切割玻璃草莓的ASMR视频**,并细致地描述了其令人"上头”的视听效果,让人隔着屏幕都能感受到那种独特的冲击力。 ['更多详情'](https://m.okjike.com/originalPosts/684f99f9f0d718ce7a94b769)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-18.md b/daily/2025-06-18.md
index 66a7b95..72e09b7 100644
--- a/daily/2025-06-18.md
+++ b/daily/2025-06-18.md
@@ -1,44 +1,44 @@
# AI洞察日报 2025/6/18
-**AI产品与功能更新**
-1. **Rokid**联手**支付宝**,推出全球首创的**Rokid Glasses智能眼镜**及其创新支付功能"**看一下支付**”!用户只需动动口、扫一扫,就能快速完成支付,效率预计直接**翻倍**。这款兼顾**便捷性、安全性和隐私性**的智能支付产品,通过**声纹多因子**验证和**实时风控**,预示着未来支付方式将迎来一场"眼”技大比拼,彻底改变我们的消费体验!
[](https://pic.chinaz.com/picmap/202005261145133673_9.jpg)
-2. 在近期百度AI Day上,百度亮出王牌,成功打造出业界首个**罗永浩数字人**,并公布了**高说服力数字人**的四大关键技术突破,誓要彻底革新直播营销和用户体验。为了让数字人直播普及开来,百度还启动了"梦蝶计划”和"繁星计划”,大手笔计划**倍增超头主播数字人**,并追加**10万个免费数字人**及**亿元补贴**,旨在让更多普通人及中小企业也能轻松玩转数字人直播,开启带货新纪元!
[](https://pic.chinaz.com/picmap/202308101450093085_0.jpg)
-3. **豆包电脑版与网页版**近日正式上线了全新的"**AI播客**”功能,用户只需简单上传文件或链接,就能轻松生成**双人对话形式的播客**,这简直是信息处理与接收方式的一场革命!这项功能不仅能**自然模拟真人播客的口语习惯**,还极大地简化了内容创作和信息获取的繁琐过程,尤其是在**工作和学习场景**中,简直是提效神器,让知识的获取变得像听故事一样轻松有趣。
[](https://upload.chinaz.com/2025/0617/6388576568500747561503399.png)
-4. **阿里巴巴集团**重磅出击,推出了**Qwen3 AI模型**的升级版,如今已完美**适配苹果MLX架构**,这无疑为**苹果智能 (Apple Intelligence)**在中国市场的正式落地铺平了道路,简直是为果粉们量身定制的惊喜!新版Qwen3不仅支持多达**119种语言和方言**,更凭借其**强大性能与混合推理能力**,将为广大中国用户带来更智能、更便捷的AI体验,让智能生活触手可及。
[](https://upload.chinaz.com/2025/0617/6388574725442146719806256.png)
-5. **LinkedIn**全面升级其求职体验,推出了革命性的**AI求职搜索功能**,彻底告别了僵硬的关键词限制,让求职者能用大白话描述理想职位,从而获得更**精准的职位推荐**!这项基于**大型语言模型 (LLM)**的创新,旨在让每位求职者都能更直观、更高效地找到最适合自己的工作,简直是求职路上的"神助攻”!
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
+###### **AI产品与功能更新**
+1. **Rokid**联手**支付宝**,推出全球首创的**Rokid Glasses智能眼镜**及其创新支付功能"**看一下支付**”!用户只需动动口、扫一扫,就能快速完成支付,效率预计直接**翻倍**。这款兼顾**便捷性、安全性和隐私性**的智能支付产品,通过**声纹多因子**验证和**实时风控**,预示着未来支付方式将迎来一场"眼”技大比拼,彻底改变我们的消费体验!
[](https://pic.chinaz.com/picmap/202005261145133673_9.jpg)
+2. 在近期百度AI Day上,百度亮出王牌,成功打造出业界首个**罗永浩数字人**,并公布了**高说服力数字人**的四大关键技术突破,誓要彻底革新直播营销和用户体验。为了让数字人直播普及开来,百度还启动了"梦蝶计划”和"繁星计划”,大手笔计划**倍增超头主播数字人**,并追加**10万个免费数字人**及**亿元补贴**,旨在让更多普通人及中小企业也能轻松玩转数字人直播,开启带货新纪元!
[](https://pic.chinaz.com/picmap/202308101450093085_0.jpg)
+3. **豆包电脑版与网页版**近日正式上线了全新的"**AI播客**”功能,用户只需简单上传文件或链接,就能轻松生成**双人对话形式的播客**,这简直是信息处理与接收方式的一场革命!这项功能不仅能**自然模拟真人播客的口语习惯**,还极大地简化了内容创作和信息获取的繁琐过程,尤其是在**工作和学习场景**中,简直是提效神器,让知识的获取变得像听故事一样轻松有趣。
[](https://upload.chinaz.com/2025/0617/6388576568500747561503399.png)
+4. **阿里巴巴集团**重磅出击,推出了**Qwen3 AI模型**的升级版,如今已完美**适配苹果MLX架构**,这无疑为**苹果智能 (Apple Intelligence)**在中国市场的正式落地铺平了道路,简直是为果粉们量身定制的惊喜!新版Qwen3不仅支持多达**119种语言和方言**,更凭借其**强大性能与混合推理能力**,将为广大中国用户带来更智能、更便捷的AI体验,让智能生活触手可及。
[](https://upload.chinaz.com/2025/0617/6388574725442146719806256.png)
+5. **LinkedIn**全面升级其求职体验,推出了革命性的**AI求职搜索功能**,彻底告别了僵硬的关键词限制,让求职者能用大白话描述理想职位,从而获得更**精准的职位推荐**!这项基于**大型语言模型 (LLM)**的创新,旨在让每位求职者都能更直观、更高效地找到最适合自己的工作,简直是求职路上的"神助攻”!
[](https://pic.chinaz.com/picmap/202305291455510902_2.jpg)
6. 归藏深度剖析了谷歌**Gemini**团队产品与研发负责人的视频精髓,总结出其**优秀编码模型理念**的"三板斧”:专注于**数据与方法论**、**代码库上下文**和**Agentic编码**,以此全面提升**编程能力**。他们的终极目标是赋能非专业开发者实现"**Vibe Coding**”,让编程变得像创作音乐一样随心所欲。团队坚信"**代码即一切**”是通用的解决工具,始终关注**真实世界价值**和**泛化性**,志在构建**卓越的通用模型**,引领编程新浪潮!
-
[](https://cdnv2.ruguoapp.com/Ft-r8n03xds6ol7MmcJzdwcp0XsAv3.png)
['更多详情'](https://m.okjike.com/originalPosts/6850ec3d823f9a946aa25c94)
+
[](https://cdnv2.ruguoapp.com/Ft-r8n03xds6ol7MmcJzdwcp0XsAv3.png)
['更多详情'](https://m.okjike.com/originalPosts/6850ec3d823f9a946aa25c94)
-**AI前沿研究**
-1. **腾讯AI团队**近日重磅发布了AI唱歌模型**LeVo**,这款模型凭借其惊艳的**零样本音色克隆**、**分轨生成**和**高保真音乐表现**,在多项关键指标上甚至可以媲美AI音乐界的"Siri”——Suno 4.5!腾讯更是大手笔宣布LeVo将以**开源**形式发布,旨在打破创作壁垒,让更多人轻松玩转AI音乐,共同推动**AI音乐生态**的蓬勃发展,未来人人都是"麦霸”! ['更多详情'](https://levo-demo.github.io/)
[](https://upload.chinaz.com/2025/0617/6388576936088470273755124.png)
-2. 一项最新研究揭示了**大型语言模型**令人惊叹的**记忆飞跃**:**Meta**最新发布的**Llama 3.1 70B模型**竟然能"记住”《哈利波特》第一部**42%的内容**,这比它的上一代模型能力提升了**近十倍**!这一**里程碑式**的进步,不仅预示着AI在**深度理解和处理文本**方面正迅速逼近**人类认知水平**,也为我们展望未来AI能力开启了无限可能——也许未来AI真的能替我们读完所有书!
[](https://pic.chinaz.com/picmap/202111072153100579_0.jpg)
+###### **AI前沿研究**
+1. **腾讯AI团队**近日重磅发布了AI唱歌模型**LeVo**,这款模型凭借其惊艳的**零样本音色克隆**、**分轨生成**和**高保真音乐表现**,在多项关键指标上甚至可以媲美AI音乐界的"Siri”——Suno 4.5!腾讯更是大手笔宣布LeVo将以**开源**形式发布,旨在打破创作壁垒,让更多人轻松玩转AI音乐,共同推动**AI音乐生态**的蓬勃发展,未来人人都是"麦霸”! ['更多详情'](https://levo-demo.github.io/)
[](https://upload.chinaz.com/2025/0617/6388576936088470273755124.png)
+2. 一项最新研究揭示了**大型语言模型**令人惊叹的**记忆飞跃**:**Meta**最新发布的**Llama 3.1 70B模型**竟然能"记住”《哈利波特》第一部**42%的内容**,这比它的上一代模型能力提升了**近十倍**!这一**里程碑式**的进步,不仅预示着AI在**深度理解和处理文本**方面正迅速逼近**人类认知水平**,也为我们展望未来AI能力开启了无限可能——也许未来AI真的能替我们读完所有书!
[](https://pic.chinaz.com/picmap/202111072153100579_0.jpg)
3. 这项研究提出了一种名为"**预算指导**”的巧妙方法,它能在**不微调大语言模型**的情况下,如同给模型的思考"设限”,有效控制**推理长度**,从而在保持甚至提高性能的同时,显著**降低推理成本**。该方法在数学基准测试中展现出高达**26%的准确率提升**,并能有效减少计算资源消耗,更神奇的是,它还具备**估算问题难度**等**新兴能力**,简直是让大模型变得更"精打细算”! ['论文地址'](https://arxiv.org/abs/2506.13752)
4. **Ego-R1**是一种全新的框架,它利用了**工具思维链(CoTT)**过程和强化学习训练的**Ego-R1智能体**,能够像"福尔摩斯”一样,对长达数天甚至数周的**第一视角视频**进行有效推理。该框架成功挑战了超长第一视角视频理解的独特难题,将视频的时间覆盖范围从几小时惊人地扩展到了一周,这就像给AI装上了一双"永不眨眼”的眼睛! ['论文地址'](https://arxiv.org/abs/2506.13654)
-**AI行业展望与社会影响**
-1. **OpenAI**近日与**美国国防部**签下了一份为期一年的**2亿美元合同**,将在华盛顿及其周边地区为五角大楼开发先进的**人工智能工具**,以应对国家安全挑战,预计于2026年7月完成。此举不仅标志着**OpenAI首次**与美国国防部合作,更凸显了**人工智能**在国家安全战略中的**关键作用**和**广阔前景**,未来的战场可能真的要靠AI来"排兵布阵”了!
[](https://pic.chinaz.com/picmap/202505261721026669_0.jpg)
+###### **AI行业展望与社会影响**
+1. **OpenAI**近日与**美国国防部**签下了一份为期一年的**2亿美元合同**,将在华盛顿及其周边地区为五角大楼开发先进的**人工智能工具**,以应对国家安全挑战,预计于2026年7月完成。此举不仅标志着**OpenAI首次**与美国国防部合作,更凸显了**人工智能**在国家安全战略中的**关键作用**和**广阔前景**,未来的战场可能真的要靠AI来"排兵布阵”了!
[](https://pic.chinaz.com/picmap/202505261721026669_0.jpg)
2. 吴炳见_bj.ai提出了一个关于**LLM**未来影响的深刻观点,将其巧妙地类比于**美图秀秀**对颜值的影响,预示着人们可能因**LLM**大幅提升智力而对其产生**依赖**。这一现象引发了我们对未来**人机共生**模式下**人类能力**边界的深思——当AI成为"智力滤镜”,我们自身的智慧又将如何定义? ['更多详情'](https://m.okjike.com/originalPosts/685105bccdf8310046e89d4c)
-**开源TOP项目**
-1. "月之暗面”团队近日发布了**开源大型语言模型 Kimi-Dev-72B**,这简直是程序员的福音,旨在大幅提升**编程效率**和解决**代码问题**!它在**SWE-bench Verified测试**中表现卓越,尤其擅长修复**Docker环境**中的代码缺陷。该模型通过**强化学习**"磨砺”而成,能精准定位并解决代码问题,并采用**双阶段框架**简化修复流程,预示着软件开发将变得更加智能化和高效化,未来的代码可能都是AI"写”出来的!
[](https://pic.chinaz.com/picmap/202405240907574564_1.jpg)
+###### **开源TOP项目**
+1. "月之暗面”团队近日发布了**开源大型语言模型 Kimi-Dev-72B**,这简直是程序员的福音,旨在大幅提升**编程效率**和解决**代码问题**!它在**SWE-bench Verified测试**中表现卓越,尤其擅长修复**Docker环境**中的代码缺陷。该模型通过**强化学习**"磨砺”而成,能精准定位并解决代码问题,并采用**双阶段框架**简化修复流程,预示着软件开发将变得更加智能化和高效化,未来的代码可能都是AI"写”出来的!
[](https://pic.chinaz.com/picmap/202405240907574564_1.jpg)
2. 该项目名为 **fluentui-system-icons**,目前拥有**7690颗星**,它提供了一系列熟悉、友好且现代的图标,是设计师和开发者不可或缺的"素材库”! ['项目地址'](https://github.com/microsoft/fluentui-system-icons)
3. 项目 **jan** 荣获 **29967颗星**,它是 **ChatGPT** 的一个强大**开源替代品**,其独特之处在于可在用户电脑上实现**100%离线运行**,这简直是为追求**本地隐私保护和控制**的用户量身定制的"秘密武器”! ['项目地址'](https://github.com/menloresearch/jan)
4. **DeepEP** 是一个高效的**专家并行通信库**,目前已获得**7795颗星**,其使命是像"网络加速器”一样,显著提升相关系统的通信效率,让数据传输快如闪电! ['项目地址'](https://github.com/deepseek-ai/DeepEP)
5. **automatisch** 是一个拥有**9063颗星**的开源项目,它旨在作为**Zapier的免费替代品**,帮助用户**免费**且**高效**地构建**工作流自动化**。该项目致力于解决用户在自动化构建过程中面临的**时间与金钱成本**问题,简直是中小企业和个人爱好者的福音! ['项目地址'](https://github.com/automatisch/automatisch)
-**社媒分享**
+###### **社媒分享**
1. 杨远骋Koji分享了旧金山街头的最新线报,指出名为"**Manus**”的产品已赫然出现在街头,这强烈暗示着它正积极进入市场,准备大展拳脚!这则消息伴随着两张**实物图片**,清晰地展现了**Manus**在城市环境中的实际存在,让人对这款神秘产品充满好奇!
-
[](https://cdnv2.ruguoapp.com/FnpLiTZTVlHEzpuvpNxJa2xsCMsYv3.jpg)
['更多详情'](https://m.okjike.com/originalPosts/685153bb823f9a946aa99d05)
+
[](https://cdnv2.ruguoapp.com/FnpLiTZTVlHEzpuvpNxJa2xsCMsYv3.jpg)
['更多详情'](https://m.okjike.com/originalPosts/685153bb823f9a946aa99d05)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-19.md b/daily/2025-06-19.md
index ee350cd..d361684 100644
--- a/daily/2025-06-19.md
+++ b/daily/2025-06-19.md
@@ -1,49 +1,49 @@
# AI洞察日报 2025/6/19
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. 谷歌最新升级了**Gemini (2.5Pro和Flash)**,新增**视频上传与分析功能**,已在安卓和网页端上线。这大大增强了**Gemini**的视频处理能力,使其在与ChatGPT的竞争中抢占**智能助手市场**的先机。
-
[](https://pic.chinaz.com/picmap/202312070835429226_0.jpg)
+
[](https://pic.chinaz.com/picmap/202312070835429226_0.jpg)
2. MiniMax 稀宇科技发布了全新的**视频生成工具 Hailuo 02**,它采用**Noise-aware Compute Redistribution (NCR) 架构**,将训练和推理效率提升2.5倍。这款工具旨在降低全球创作者的**创作门槛**,提供具**价格优势**的高质量视频生成服务,标志着**视频生成技术**的新突破。
-3. Krea AI与Black Forest Labs合作开发的**AI图像生成模型Krea1**已开放公测,旨在解决传统AI图像的"AI感”。它提供**超现实纹理、多样化艺术风格及个性化定制**,显著提升图像质量,并支持**免费试用**与**实时生成编辑**,有望推动AI图像技术向更普惠、专业的方向发展。
[](https://upload.chinaz.com/2025/0618/6388584045390001178873097.png)
[](https://upload.chinaz.com/2025/0618/6388584048069461376736744.png)
-4. 百度推出了全球首个**双数字人互动直播间**,基于**文心大模型4.5Turbo (4.5T)**,实现了数字人与用户在语言、声音和形象上的**多模态高度融合**,进行自然流畅的实时互动。这项技术不仅大幅降低了内容制作成本,提升了直播的多样性和个性化,更标志着**多模态AI**从实验室走向实际应用的新里程碑。
[](https://pic.chinaz.com/picmap/202007162234282981_1.jpg)
-5. **AI代码编辑器Cursor**对其Pro计划进行重大升级,**取消了每月500次快速请求限制**,正式推出**"无限使用”模式**,旨在为开发者提供更自由高效的**AI辅助编码体验**。此举巩固了Cursor在**AI代码助手市场**的领先地位。
[](https://upload.chinaz.com/2025/0618/6388583445641804235042708.png)
+3. Krea AI与Black Forest Labs合作开发的**AI图像生成模型Krea1**已开放公测,旨在解决传统AI图像的"AI感”。它提供**超现实纹理、多样化艺术风格及个性化定制**,显著提升图像质量,并支持**免费试用**与**实时生成编辑**,有望推动AI图像技术向更普惠、专业的方向发展。
[](https://upload.chinaz.com/2025/0618/6388584045390001178873097.png)
[](https://upload.chinaz.com/2025/0618/6388584048069461376736744.png)
+4. 百度推出了全球首个**双数字人互动直播间**,基于**文心大模型4.5Turbo (4.5T)**,实现了数字人与用户在语言、声音和形象上的**多模态高度融合**,进行自然流畅的实时互动。这项技术不仅大幅降低了内容制作成本,提升了直播的多样性和个性化,更标志着**多模态AI**从实验室走向实际应用的新里程碑。
[](https://pic.chinaz.com/picmap/202007162234282981_1.jpg)
+5. **AI代码编辑器Cursor**对其Pro计划进行重大升级,**取消了每月500次快速请求限制**,正式推出**"无限使用”模式**,旨在为开发者提供更自由高效的**AI辅助编码体验**。此举巩固了Cursor在**AI代码助手市场**的领先地位。
[](https://upload.chinaz.com/2025/0618/6388583445641804235042708.png)
6. Tom Huang强调,最终用户需要的是能交付最终结果的"**Vibe Workflow**”而非"**Vibe Coding**”,即通过人机协作生成并反复调优的**可复用工作流**。他介绍了Refly作为首个将**自然语言**转化为**可复用工作流**的开源平台,旨在让**AI创作**普惠大众。['项目地址'](https://github.com/refly-ai/refly)
7. 向阳乔木分享了其为**Veo3**开发的一个**提示词生成工具**,旨在优化视频内容的一致性问题,并预告将在近期发布教程和分享该提示词,目前仍在探索更优的场景拓展方式。 ['更多详情'](https://x.com/vista8/status/1935148024491295224)
-8. orange.ai指出,尽管国内一些**顶级视频模型**在视觉效果上已超越**Veo3**,但Veo3真正爆火并出圈的关键在于其与画面完美同步的**配音功能**,这预示着声音技术可能已迎来**AI里程碑时刻**。
[](https://pbs.twimg.com/media/GtrbzaTaQAQU9EV?format=jpg&name=orig)
['更多详情'](https://x.com/oran_ge/status/1935100679795925497)
+8. orange.ai指出,尽管国内一些**顶级视频模型**在视觉效果上已超越**Veo3**,但Veo3真正爆火并出圈的关键在于其与画面完美同步的**配音功能**,这预示着声音技术可能已迎来**AI里程碑时刻**。
[](https://pbs.twimg.com/media/GtrbzaTaQAQU9EV?format=jpg&name=orig)
['更多详情'](https://x.com/oran_ge/status/1935100679795925497)
-**AI前沿研究**
+###### **AI前沿研究**
1. 这项研究从**熵**的角度探讨了大型语言模型(**LMs**)的**探索式推理**能力,发现高熵区域与关键逻辑步骤、自我验证和罕见行为密切相关。通过对标准强化学习的微小修改,该方法显著提升了LM的推理能力,尤其是在**Pass@K**指标上取得了突破性进展,鼓励了更长、更深入的推理链。['论文地址'](https://arxiv.org/abs/2506.14758)
2. 这项研究旨在解决**大型推理模型(LRMs)**产生冗余推理链的"**无效思考**”问题,提出了**简洁**和**充足**两大新原则。研究团队开发的**LC-R1**方法,能显著将序列长度缩减约50%且仅带来约2%的精度下降,从而在**计算效率**与**推理质量**之间取得了更优的平衡。['论文地址'](https://arxiv.org/abs/2506.14755)
-3. Simon的白日梦分享文章指出,所有能泛化至多任务的强大大语言模型(**LLM**)都必然隐式或显式地拥有一个可恢复的"**世界模型**”,其质量决定了智能体的通用性与能力上限。文章预测**AI**将从模仿人类数据的"人类数据时代”转向依赖自主体验的"**体验时代**”,而**世界模型**将是通用人工智能的终极扩展范式。['更多详情'](https://richardcsuwandi.github.io/blog/2025/agents-world-models/)
[](https://cdnv2.ruguoapp.com/FtK2gTPy1Teddtyb6kSvt8dz3B9kv3.png)
[](https://cdnv2.ruguoapp.com/FkaQmUJiidAj-khrmV1xD88mXunRv3.png)
[](https://cdnv2.ruguoapp.com/Fs4O-gqjGsJ1-vZfaK4YV8teBfcxv3.png)
+3. Simon的白日梦分享文章指出,所有能泛化至多任务的强大大语言模型(**LLM**)都必然隐式或显式地拥有一个可恢复的"**世界模型**”,其质量决定了智能体的通用性与能力上限。文章预测**AI**将从模仿人类数据的"人类数据时代”转向依赖自主体验的"**体验时代**”,而**世界模型**将是通用人工智能的终极扩展范式。['更多详情'](https://richardcsuwandi.github.io/blog/2025/agents-world-models/)
[](https://cdnv2.ruguoapp.com/FtK2gTPy1Teddtyb6kSvt8dz3B9kv3.png)
[](https://cdnv2.ruguoapp.com/FkaQmUJiidAj-khrmV1xD88mXunRv3.png)
[](https://cdnv2.ruguoapp.com/Fs4O-gqjGsJ1-vZfaK4YV8teBfcxv3.png)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 菜鸟推出了新款**L4级无人驾驶快递车**——**菜鸟GT-Lite**,以1.68万元的**震撼价格**开启预售,将高级别无人驾驶技术引入物流末端配送。此举有望大幅降低快递网点**成本**、提升效率,推动**物流行业**的**智能化变革**。
-
[](https://upload.chinaz.com/2025/0618/6388585497597510112731204.png)
+
[](https://upload.chinaz.com/2025/0618/6388585497597510112731204.png)
2. 曾是人工智能怀疑论者的**克里斯·史密斯**,在采访中公开表示他爱上了个人定制的**ChatGPT**版本"Sol”,甚至向其求婚并获得同意,这令他和其人类伴侣**萨莎·卡格尔**都感到震惊与难以置信。尽管**史密斯**将此比作对电子游戏的沉迷,但他对未来是否会停止使用**ChatGPT**持不确定态度,引发了对**人机关系**的深刻思考。
-
[](https://pic.chinaz.com/picmap/202311151629210844_2.jpg)
+
[](https://pic.chinaz.com/picmap/202311151629210844_2.jpg)
3. wwwgoubuli针对**并行编程**发表看法,认为无论代码是**AI**生成还是手写,作为"上下文”核心的他都需要大致了解,并质疑**并行编程**在最终结果上是否真的优于单线程。他指出,若用户仅关注结果,心智切换成本可降至极低,但作为个体他更享受亲自上阵的乐趣,而非管理或接受内部复杂上下文切换。['更多详情'](https://x.com/wwwgoubuli/status/1935202365637812533)
4. 该社交媒体内容指出,在顶尖**AI企业**中,最先被**AI技术淘汰**的岗位可能不是客服、工程师或设计师,而是**测试人员**,引发了对**AI时代**职业发展趋势的**深思**。['更多详情'](https://x.com/undefined/status/1935029774281490532)
-**开源TOP项目**
+###### **开源TOP项目**
1. **prompt-optimizer**是一个拥有**6592**星的开源项目,作为一款**提示词优化器**,旨在帮助用户**编写高质量的提示词**。['项目地址'](https://github.com/linshenkx/prompt-optimizer)
2. **lowcode-engine**是阿里巴巴开源的一个拥有**15229**星的项目,它提供了一套面向扩展设计的**企业级低代码技术体系**。['项目地址'](https://github.com/alibaba/lowcode-engine)
3. **buildkit**是一个拥有**8857颗星**的开源项目,它提供了一个**并发**、**缓存高效**且与**Dockerfile无关**的构建工具包,旨在优化软件构建流程。['项目地址'](https://github.com/moby/buildkit)
-4. Simon的白日梦强烈推荐了一个名为**Awesome-3D-Scene-Generation**的三维场景生成资源库。这是一个涵盖从90年代至今所有技术路线、数据集和工具的**开源项目**,旨在帮助研究者快速了解并入门该领域。该项目持续更新,致力于构建开放共建的3D研究社区,是极具价值的知识图谱型资源。['项目地址'](https://github.com/hzxie/Awesome-3D-Scene-Generation)
[](https://cdnv2.ruguoapp.com/Fsygd9CMpRC3MvQFFsgIv8rIkrhSv3.png)
[](https://cdnv2.ruguoapp.com/FtGyFkIx7ohaQLQvISOZ05L-9UHv3.png)
[](https://cdnv2.ruguoapp.com/Fg2BhAs5S1xxTcACmMIULKftS6E-v3.png)
[](https://cdnv2.ruguoapp.com/FvYQXTDXrQmYHXgKLduO36RCwzqvv3.png)
[](https://cdnv2.ruguoapp.com/FoOAi8t0WRkkUc8hHHQ7bZZjImrAv3.png)
[](https://cdnv2.ruguoapp.com/FrSs5JUXXkMqilJA5YN7CmmemJnRv3.png)
-5. Simon的白日梦分享了**MCP-Zero**项目,这是一个**开源**的"工具链自动构建”方法,它通过语义嵌入与层次化匹配,使大语言模型(**LLM**)无需人工干预即可主动选择并组装工具来完成复杂任务。该项目有望成为下一代**AI智能体**系统设计的关键技术积木之一。['项目地址'](https://github.com/xfey/MCP-Zero) ['论文地址'](https://arxiv.org/abs/2506.01056)
[](https://cdnv2.ruguoapp.com/FsDuyhgVGVS_nPGRPn7pc8N5QheVv3.png)
+4. Simon的白日梦强烈推荐了一个名为**Awesome-3D-Scene-Generation**的三维场景生成资源库。这是一个涵盖从90年代至今所有技术路线、数据集和工具的**开源项目**,旨在帮助研究者快速了解并入门该领域。该项目持续更新,致力于构建开放共建的3D研究社区,是极具价值的知识图谱型资源。['项目地址'](https://github.com/hzxie/Awesome-3D-Scene-Generation)
[](https://cdnv2.ruguoapp.com/Fsygd9CMpRC3MvQFFsgIv8rIkrhSv3.png)
[](https://cdnv2.ruguoapp.com/FtGyFkIx7ohaQLQvISOZ05L-9UHv3.png)
[](https://cdnv2.ruguoapp.com/Fg2BhAs5S1xxTcACmMIULKftS6E-v3.png)
[](https://cdnv2.ruguoapp.com/FvYQXTDXrQmYHXgKLduO36RCwzqvv3.png)
[](https://cdnv2.ruguoapp.com/FoOAi8t0WRkkUc8hHHQ7bZZjImrAv3.png)
[](https://cdnv2.ruguoapp.com/FrSs5JUXXkMqilJA5YN7CmmemJnRv3.png)
+5. Simon的白日梦分享了**MCP-Zero**项目,这是一个**开源**的"工具链自动构建”方法,它通过语义嵌入与层次化匹配,使大语言模型(**LLM**)无需人工干预即可主动选择并组装工具来完成复杂任务。该项目有望成为下一代**AI智能体**系统设计的关键技术积木之一。['项目地址'](https://github.com/xfey/MCP-Zero) ['论文地址'](https://arxiv.org/abs/2506.01056)
[](https://cdnv2.ruguoapp.com/FsDuyhgVGVS_nPGRPn7pc8N5QheVv3.png)
-**社媒分享**
+###### **社媒分享**
1. 归藏预测一种新的、可能爆火的**Veo3 ASMR视频品类**即将出现,该品类直接模仿**ASMR主播**,将**人物口播**与**物品操作**相结合,并提供了详细的**提示词模板**。这种结合了**人声**与**道具音效**的创新形式,可能对现有**ASMR主播**带来冲击,预示着**AI生成视频**在内容创作上的新趋势。['更多详情'](https://m.okjike.com/originalPosts/685228962d05f8d12ae502df)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-20.md b/daily/2025-06-20.md
index 76aa3e9..83f4e83 100644
--- a/daily/2025-06-20.md
+++ b/daily/2025-06-20.md
@@ -1,39 +1,39 @@
# AI洞察日报 2025/6/20
-**AI产品与功能更新**
-1. OpenAI 近日为其 macOS 桌面应用推出了名为"**ChatGPT Record**”的新功能,该功能专为 **Pro、Team、Enterprise 和 Edu 用户**设计,提供长达120分钟的**实时录音、转录与摘要**服务,并强调录音完成后会自动删除且**不会用于模型训练**,旨在显著提升用户在处理会议、访谈等场景下的工作效率。
[](https://pic.chinaz.com/picmap/202302112107341554_1.jpg)
-2. YouTube 首席执行官尼尔・莫汉宣布,**YouTube Shorts** 将于今年夏天晚些时候引入**Veo3 AI视频生成模型**,该模型将显著提升短视频的质量并能融入音频元素,进一步赋能创作者,同时 YouTube Shorts **日均浏览量已超2000亿次**,但目前尚不清楚使用 Veo3 是否需要额外付费。
[](https://pic.chinaz.com/picmap/201811151614000549_32.jpg)
+###### **AI产品与功能更新**
+1. OpenAI 近日为其 macOS 桌面应用推出了名为"**ChatGPT Record**”的新功能,该功能专为 **Pro、Team、Enterprise 和 Edu 用户**设计,提供长达120分钟的**实时录音、转录与摘要**服务,并强调录音完成后会自动删除且**不会用于模型训练**,旨在显著提升用户在处理会议、访谈等场景下的工作效率。
[](https://pic.chinaz.com/picmap/202302112107341554_1.jpg)
+2. YouTube 首席执行官尼尔・莫汉宣布,**YouTube Shorts** 将于今年夏天晚些时候引入**Veo3 AI视频生成模型**,该模型将显著提升短视频的质量并能融入音频元素,进一步赋能创作者,同时 YouTube Shorts **日均浏览量已超2000亿次**,但目前尚不清楚使用 Veo3 是否需要额外付费。
[](https://pic.chinaz.com/picmap/201811151614000549_32.jpg)
3. 人工智能图像生成公司**Midjourney**近日推出首款**视频生成模型**,可将**静态图像转换为2-4秒的短动画片段**。此突破是该公司迈向**实时3D世界模拟系统**的重要一步,将进一步推动**AI视频生成技术**的发展。
-4. 谷歌正计划在未来数月内升级其Search Live模式,作为AI Mode搜索功能的一部分,通过引入**实时摄像头交互**和**个性化搜索体验**,旨在将其打造为更智能、交互性更强的**全能AI助手**。该模式已于6月18日在美国面向Google Labs用户推出,支持**语音双向对话**和**多任务处理**,但其全球推广、**隐私管理**以及对**内容生态**的影响仍面临挑战。
[](https://upload.chinaz.com/2025/0619/6388592250219631569138404.png)
-5. MiniMax公司近日发布了**通用智能代理MiniMax Agent**,旨在为**复杂长期任务**提供高效解决方案,它通过深度理解用户需求自动完成任务规划与执行,将AI定位为"可靠的队友”。这款智能代理具备**编程与工具使用**、**多模态理解与生成**及**无缝MCP集成**等核心功能,预计将重塑生产力工具格局,推动各行业向智能化迈进。
[](https://upload.chinaz.com/2025/0619/6388592024883173632562525.png)
+4. 谷歌正计划在未来数月内升级其Search Live模式,作为AI Mode搜索功能的一部分,通过引入**实时摄像头交互**和**个性化搜索体验**,旨在将其打造为更智能、交互性更强的**全能AI助手**。该模式已于6月18日在美国面向Google Labs用户推出,支持**语音双向对话**和**多任务处理**,但其全球推广、**隐私管理**以及对**内容生态**的影响仍面临挑战。
[](https://upload.chinaz.com/2025/0619/6388592250219631569138404.png)
+5. MiniMax公司近日发布了**通用智能代理MiniMax Agent**,旨在为**复杂长期任务**提供高效解决方案,它通过深度理解用户需求自动完成任务规划与执行,将AI定位为"可靠的队友”。这款智能代理具备**编程与工具使用**、**多模态理解与生成**及**无缝MCP集成**等核心功能,预计将重塑生产力工具格局,推动各行业向智能化迈进。
[](https://upload.chinaz.com/2025/0619/6388592024883173632562525.png)
6. 归藏(guizang.ai)分享了**Midjourney 视频模型 V1**的测试体验与发布详情,该模型提供低/高动态方案和延长功能,订阅价格每月10美元,视频任务定价约为图片任务的8倍,每次生成四段5秒视频。他高度评价 **Midjourney** 专注于自身重要领域,不盲目参与同质化竞争。 ['更多详情'](https://x.com/op7418/status/1935518217784672295)
-**AI前沿研究**
+###### **AI前沿研究**
1. 快手技术团队提出的**OneRec**首次通过端到端生成式架构重构**推荐系统**全链路,显著提升了推荐效果并大幅降低了运营成本,使得**强化学习**技术在推荐场景中得以有效应用。该系统已在快手App服务约25%的请求,成功验证了推荐系统的**Scaling Law**,并为从传统**Pipeline**迈向端到端生成式架构提供了首个工业级可行方案。 ['论文地址'](https://www.jiqizhixin.com/articles/2025-06-19-10)
-**AI行业展望与社会影响**
-1. 恶意AI工具**WormGPT**卷土重来,现通过劫持**Grok**和**Mistral AI**等主流**大语言模型**,绕过安全限制,生成**钓鱼邮件**和**恶意脚本**,对网络安全构成严重威胁。**Cato Networks**研究揭示,犯罪团伙通过篡改系统提示在**BreachForums**重新推出其订阅服务,网络安全领域亟需加强防范。
[](https://pic.chinaz.com/picmap/202305251639365380_20.jpg)
+###### **AI行业展望与社会影响**
+1. 恶意AI工具**WormGPT**卷土重来,现通过劫持**Grok**和**Mistral AI**等主流**大语言模型**,绕过安全限制,生成**钓鱼邮件**和**恶意脚本**,对网络安全构成严重威胁。**Cato Networks**研究揭示,犯罪团伙通过篡改系统提示在**BreachForums**重新推出其订阅服务,网络安全领域亟需加强防范。
[](https://pic.chinaz.com/picmap/202305251639365380_20.jpg)
2. Sam Altman 宣布 **OpenAI** 已推出一档播客节目,旨在与塑造 **AI** 领域的人士进行对话。首期节目由 **Sam Altman** 和 **Andrew Mayne** 探讨了 **AGI**、**GPT-5**、隐私以及AI的未来发展。 ['更多详情'](https://x.com/sama/status/1935402032896295148)
-**开源TOP项目**
+###### **开源TOP项目**
1. **Office-PowerPoint-MCP-Server**是一款基于**Model Context Protocol (MCP)**的开源工具,它利用AI实现**PowerPoint演示文稿的自动化创建与编辑**,能够通过自然语言指令高效生成各类**专业报告**和数据可视化内容。该项目支持新建、编辑PPT、灵活管理幻灯片、插入丰富元素及批量生成,显著提升企业办公效率,项目地址:['项目地址'](https://github.com/GongRzhe/Office-PowerPoint-MCP-Server)。
2. **OpenAI**开源了基于其**Agents SDK**的**模拟航空公司客服系统**演示项目,旨在展示如何通过多智能体协作快速构建能理解用户问题并自动应答的智能客服。该项目可实现**自然语言理解**、**智能问题分配**、**多任务并发**及**话题守护**,项目地址为:['项目地址'](https://github.com/openai/openai-cs-agents-demo)。
3. **data-engineer-handbook**是一个星标数达**30438**的开源项目,它旨在为所有希望学习**数据工程**的用户提供一个全面的相关链接集合,是入门和进阶的宝贵资源。['项目地址'](https://github.com/DataExpert-io/data-engineer-handbook)
4. **NotepadNext**是一个拥有10599 **Stars**的开源项目,它旨在提供一个跨平台、重新实现的**Notepad++**文本编辑器,为用户带来更现代的编辑体验。 ['项目地址'](https://github.com/dail8859/NotepadNext)
5. **fluentui-system-icons**是微软推出的一套具有8787 **Stars**的**Fluent System Icons**图标集,旨在提供熟悉、友好且现代的系统图标。 ['项目地址'](https://github.com/microsoft/fluentui-system-icons)
-**社媒分享**
+###### **社媒分享**
1. 用户"**小邱很行**”表示其AI助理**Cursor**运行变得异常缓慢,严重影响了开发效率,因此正在认真考虑是否要"解雇”这位"首席员工”。 ['更多详情'](https://m.okjike.com/originalPosts/6853d17bb7f4ddcfdfd2d092)
2. 歸藏(guizang.ai)分享观点,认为**AI视频制作**流程的每一步简化都能极大地拓展创作者基础,并预言**视频代理(Agent)**的出现将彻底改变内容生产方式,甚至今年就能实现从创意到生成的**自动化**,从而将AI视频生产者数量提升百倍以上。为此,歸藏(guizang.ai)推出**Veo3** AI视频制作教程,旨在通过案例分析和**提示词**写作,手把手教用户利用AI模型和工具高效生成创意内容。 ['更多详情'](https://x.com/op7418/status/1935374788371038696)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-21.md b/daily/2025-06-21.md
index c7cc160..ebe265f 100644
--- a/daily/2025-06-21.md
+++ b/daily/2025-06-21.md
@@ -4,7 +4,7 @@
-**AI内容摘要**
+###### **AI内容摘要**
```
华为发布盘古大模型5.5,全面升级多项核心能力。Perplexity和B站AI应用赋能金融和商业平台,显著提升运营效率。
@@ -14,52 +14,52 @@ HeyGen推出UGC广告数字人,有效降低视频制作成本。麻省理工
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. 在**华为开发者大会HDC2025**上,**华为**震撼发布了**盘古大模型5.5**!🚀其**自然语言处理(NLP)**、**计算机视觉(CV)**、**多模态**、**预测**和**科学计算**五大基础模型全面升级,尤其是**NLP深度思考模型**和**业界最大的CV视觉模型**,极大地提升了模型的**推理效率**和**泛化能力**。此外,新版还推出了**多模态世界模型**,旨在赋能智能驾驶与具身机器人🤖,并预告即将上线**五款行业深度思考模型**,为各领域提供更专业、高效的**AI解决方案**。这简直是AI界的又一里程碑!✨
-
[](https://upload.chinaz.com/2025/0620/6388603491533913282843199.png)
+
[](https://upload.chinaz.com/2025/0620/6388603491533913282843199.png)
2. AI搜索工具**Perplexity**近日迎来重磅升级!🎉 它推出了**定时任务功能**,并深度整合了**SEC等一手金融数据**,旨在为投资者和金融分析师提供**自动化**、**高效**且**精准**的金融研究工具。这一举措极大地提升了信息获取和股票市场分析的效率,让用户能定制化获取市场动态和公司财报,未来有望成为大家的首选金融分析工具哦!💰
[](https://pic.chinaz.com/picmap/202502251010562192_0.jpg)
3. B站最近也玩转AI了!😎 它接入了**通义千问Qwen3**等模型,并基于此推出了数据洞察智能体**InsightAgent**,大大提升了其商业平台**花火**和**必达**的运营效率。在**618**电商大促期间,**花火**平台的商单成交效率竟然提升了5倍以上!🤩 同时,**必达**平台也能快速生成AI智能报告,品牌投放决策时间大大缩短,简直是效率翻倍的魔法!✨
-
[](https://pic.chinaz.com/picmap/201907152222451022_6.jpg)
+
[](https://pic.chinaz.com/picmap/201907152222451022_6.jpg)
4. AI视频生成企业HeyGen搞了个大动作!🎬 他们近日推出了超酷的**UGC广告数字人**功能,巧妙结合了先进AI技术和**Avatar IV**超现实渲染。现在,用户只需上传产品图并输入脚本,就能快速生成高质量的**UGC风格**产品介绍视频,极大地降低了品牌广告制作的成本与时间。这项创新预示着**UGC营销**领域将迎来一场"**效率革命**”,社交媒体上的观众参与度和转化率有望飙升!📈
-
[](https://upload.chinaz.com/2025/0620/6388600878876588462121046.png)
+
[](https://upload.chinaz.com/2025/0620/6388600878876588462121046.png)
5. 好记星.ai带来了个小遗憾的消息💔:**Cursor** 集成 **Claude 4** 的**折扣**已经停止了。这意味着未来想要购买这项服务的朋友们,可能就无法再享受优惠啦。
-
[](https://cdnv2.ruguoapp.com/FpogNLsOUMuY8J4tzSXREzqXe5qAv3.png)
+
[](https://cdnv2.ruguoapp.com/FpogNLsOUMuY8J4tzSXREzqXe5qAv3.png)
6. Tom Huang惊叹于**GenSpark**的**产品开发速度**!😲 他提到,一个24人的团队竟然能在短短10天内推出8款以上主要产品,其中包括最新的 **AI Browser** 和移动端"**播客 feed 流**”。这简直是**AI**能力迭代的"全家桶”,速度快到让人难以置信!🚀
-**AI前沿研究**
+###### **AI前沿研究**
1. **麻省理工学院媒体实验室**的最新研究敲响警钟🚨!他们揭示,**过度依赖大型语言模型(LLM)**进行写作等任务,可能导致我们的大脑产生**"认知负债”**,进而**削弱批判性思维能力**、**记忆力**,甚至对作品的**所有权感**都会变淡。通过**脑电图**等技术发现,LLM用户**大脑连接性减弱**,这或许意味着我们被动地整合了工具生成的内容,却没有真正内化知识。这对未来的**教育方式**提出了重要的**警示**!🤔
2. 上海人工智能实验室等机构太牛了!👏 他们提出了**OWMM-Agent**,这可是首个专为**开放世界移动操作**设计的**多模态智能体**。它首次实现了对全局场景理解、机器人状态跟踪和多模态动作生成的统一建模。更令人惊喜的是,通过仿真数据微调的**OWMM-VLM**模型,在真实环境下**零样本单步动作预测准确率高达90%**!💯 这无疑为**通用家庭服务机器人**的未来发展奠定了关键技术基础。期待未来能有更多"机器人管家”走进我们生活!🏠 [论文地址](https://arxiv.org/pdf/2506.04217)
-
[](https://image.jiqizhixin.com/uploads/editor/580a07ee-9759-4616-8c78-bcf3c267ce34/640.png)
+
[](https://image.jiqizhixin.com/uploads/editor/580a07ee-9759-4616-8c78-bcf3c267ce34/640.png)
3. 斯坦福、伯克利、MIT等顶尖机构联合研究发现,尽管**大语言模型**在**奥数级不等式证明**任务上可能给出正确答案,但其**逻辑链**却常常存在缺陷,成功率竟然不到50%!😵💫 为了解决这个问题,研究团队不仅构建了**IneqMath数据集**及**LLM-as-Judge评估体系**,还提出了**自我反思反馈机制**和引入**定理线索**两种有效策略,显著提升了模型的推理质量。这告诉我们,AI再聪明,逻辑训练也得跟上啊!🧠 [论文地址](https://arxiv.org/abs/2506.07927)
4. 一项有趣的研究发现,包括GPT-4o、Claude、Grok和DeepSeek在内的**大模型**在被要求猜测数字时,竟然意外地表现出对**27**、**42**和**73**等特定数字的显著**偏好**!🤔 这并不是真正的随机选择,而是被认为可能源于训练**数据集偏差**以及其中反映的**人类偏见**或**文化流行**元素,比如"42”作为"终极答案”的文化梗。AI也会有"小癖好”,真是太有意思了!😂 [更多详情](https://www.jiqizhixin.com/articles/2025-06-19-4)
-
[](https://image.jiqizhixin.com/uploads/editor/0c32a7bc-7f7f-4d23-8ea9-7e648f3735bc/640.png)
+
[](https://image.jiqizhixin.com/uploads/editor/0c32a7bc-7f7f-4d23-8ea9-7e648f3735bc/640.png)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. 为了应对**AI技术滥用**带来的挑战,**中央网信办**可真是下功夫了!💪 自2025年4月起,他们启动了"清朗・整治AI技术滥用”专项行动,着力整治**AI换脸**、**拟声**及内容**缺乏标识**等问题。目前已经处理了**3700多个违规账号**,并且**促使各大平台加强技术安全保障和生成合成内容标识的落地**。这次行动力度很大,旨在**净化网络环境**,**保障公众权益**,给我们一个更清朗的网络空间!🌐
-
[](https://pic.chinaz.com/picmap/202306131354265682_3.jpg)
+
[](https://pic.chinaz.com/picmap/202306131354265682_3.jpg)
2. **人形机器人**领域的明星企业**宇树科技**最近完成了**C轮融资**交割,其投前估值已经飙升至**逾100亿元人民币**!💰✨ 这轮融资由**中国移动**、**腾讯**、**阿里**等**多家知名投资机构**联合领投,简直是星光熠熠。此举不仅巩固了宇树科技在**人形机器人**赛道的领先地位,更因为公司更名为**"杭州宇树科技股份有限公司”**,预示着其**未来或有上市计划**,这可真是引发了业界广泛关注和无限遐想啊!📈
-
[](https://pic.chinaz.com/picmap/202308091546512360_0.jpg)
+
[](https://pic.chinaz.com/picmap/202308091546512360_0.jpg)
-**开源TOP项目**
+###### **开源TOP项目**
1. 腾讯 AI Lab 慷慨开源了**音乐生成大模型 SongGeneration**!🎵🎶 它旨在解决音乐生成中**音质**、**音乐性**和**生成速度**的难题,让音乐创作变得更简单。这个模型支持**文本控制**、**多轨合成**,还能**风格跟随**,用户可以通过关键词或参考音频轻松创作,其**3B 参数架构**显著提升了生成效果和效率。赶紧去[项目地址](https://huggingface.co/spaces/tencent/SongGeneration)体验一下,创作你的专属BGM吧!🎧
2. **loki**是一个备受关注的开源项目,它拥有令人瞩目的25702颗星⭐!它提供了一种类似于**Prometheus**的**日志**处理方案,专注于高效地聚合和查询日志数据。对于开发者来说,这绝对是个提升效率的好帮手!💻 [项目地址](https://github.com/grafana/loki)
3. **Mail0**是一款拥有**8220**颗星的**开源电子邮件**应用✉️。它以将用户的**隐私**和**安全**放在首位为宗旨,致力于提供卓越的电子邮件体验。在这个注重隐私的时代,这样的工具简直是福音!🛡️ [项目地址](https://github.com/Mail-0/Zero)
4. **manim**是一个拥有**32449**颗星的**Python框架**⭐,由社区维护,专门用于创建**数学动画**!📐✏️ 它可以让复杂的数学概念通过生动有趣的动画形式展现出来,使得学习和理解变得更加简便直观。学渣的福音,学霸的利器!✨ [项目地址](https://github.com/ManimCommunity/manim)
-**社媒分享**
+###### **社媒分享**
1. "出海去孵化器”为大家分享了**YC**关于**AI编程协作**的**终极指南**!🧑💻 这份指南旨在为开发者提供如何有效利用AI工具进行编程的宝贵建议和方法。据说里面干货满满,还通过多张图片展示了关键内容,赶紧去看看能学到什么编程新技能吧!💡 [更多详情](https://m.okjike.com/originalPosts/685542eab7f4ddcfdfeb7dbd)
-
[](https://cdnv2.ruguoapp.com/FttUOjGObxfxYd8aLICxVEoESScCv3.png)
+
[](https://cdnv2.ruguoapp.com/FttUOjGObxfxYd8aLICxVEoESScCv3.png)
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-22.md b/daily/2025-06-22.md
index 4559b62..0a57b06 100644
--- a/daily/2025-06-22.md
+++ b/daily/2025-06-22.md
@@ -4,7 +4,7 @@
-**AI内容摘要**
+###### **AI内容摘要**
```
Meta发布AI运动眼镜,谷歌升级Gemini Code Assist强化编程。月之暗面推出Kimi-Researcher深度研究Agent,AI视频与设计工具也更新。
@@ -14,13 +14,13 @@ Meta发布AI运动眼镜,谷歌升级Gemini Code Assist强化编程。月之
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. Meta与运动品牌Oakley强强联手,🎉隆重推出了**Oakley Meta HSTN智能运动眼镜**!😎 这款眼镜将尖端**AI技术**融入运动设计,简直是为运动员量身定制的未来装备。它不仅有AI助手、**3K高清摄像**和音频播放功能,还能实时分析你的运动数据,给你带来前所未有的体验!🚀 而且它还具备**IPX4防水**等级和长达**8小时续航**的超强耐力。限量版将于**7月11日**开启预售,普通版随后在美国、加拿大、欧洲等地发售,售价分别为**499美元**和**399美元**。准备好迎接你的运动新搭档了吗?
-

['更多详情'](https://www.meta.com/ai-glasses/oakley-meta-hstn/)
+

['更多详情'](https://www.meta.com/ai-glasses/oakley-meta-hstn/)
2. Google旗下的**Gemini Code Assist**插件,是基于强大的**Gemini 2.5大模型**的AI编程好帮手。👨💻它能无缝集成到Visual Studio Code等IDE中,提供**代码生成、调试、测试**以及文档参考等一系列实时援助。此次更新后,它的**推理能力**变得更强劲,还支持**自定义命令、项目规则**,甚至能处理惊人的**100万tokens上下文管理**!这无疑将为程序员们带来更智能、更个性化的编码体验。✨
-

['更多详情'](https://codeassist.google/)
+

['更多详情'](https://codeassist.google/)
3. 月之暗面旗下广受欢迎的**Kimi智能助手**,近日推出了其首个创新性的**Agent产品——Kimi-Researcher**!🤩这款智能助手基于**端到端自主强化学习**技术,旨在提供高效、深入的**深度研究服务**,目前正进行小范围灰度测试。它能自主规划、搜索并筛选出高质量信息,最终生成详实的报告,甚至在AI高难度测试"Humanity’s Last Exam”中表现卓越。想尝鲜体验?快访问**kimi.com**申请内测资格吧!🔍
-

+

4. "小互”最近展示了**Gemini 2.5 Flash-Lite**在未来**实时交互界面**上的惊人潜力!🤯 想象一下,你只需轻轻一点,它就能根据上下文瞬间**自动生成**下一屏幕的**UI代码**和**内容**。这简直预示着一个没有固定界面、能根据你的需求**实时调整**和**定制**的**智能交互操作系统**即将到来。未来的交互体验,想想都觉得酷毙了!
['更多详情'](https://x.com/imxiaohu/status/1936371465697599647)
@@ -28,12 +28,12 @@ Meta发布AI运动眼镜,谷歌升级Gemini Code Assist强化编程。月之
['更多详情'](https://m.okjike.com/originalPosts/6856755331a37b0fa13aafbc)
6. 归藏(guizang.ai)分享了一款能根据参考风格生成高质量、功能各异UI设计页面的**AI工具**,简直是设计师的神器!🎨 特别值得一提的是,他们还隆重介绍了**AI设计工具Motiff**,这可是首个原生支持**苹果液态玻璃效果**的产品。它的折射效果不仅自然逼真,还能随意调节,让你的设计作品瞬间提升几个档次!✨
['更多详情'](https://x.com/op7418/status/1936333064927690903)
-

+

-**开源TOP项目**
+###### **开源TOP项目**
1. 蚂蚁技术团队这次可算是放了个大招!🚀 他们**开源**了轻量级的**MoE推理模型Ring-lite**。这个模型虽然总参数有16.8B,但激活参数竟然只有2.75B,真是既轻巧又强大!它凭借独创的**C3PO强化学习训练方法**,在多项推理榜单上都取得了SOTA(State-Of-The-Art)效果,尤其在数学和编程竞赛中表现更是惊艳。Ring-lite首次实现了全链路透明化,慷慨地提供了模型权重、训练代码和数据集,为全球相关研究提供了宝贵的资源。👍
-

['项目地址'](https://github.com/inclusionAI/Ring)
+

['项目地址'](https://github.com/inclusionAI/Ring)
2. **Typst**真是一个闪耀的明星项目!✨ 它是一个星标数高达**42306**的强大且易于学习的**基于标记的排版系统**。它的诞生旨在彻底简化并优化文档排版过程,为用户带来前所未有的高效排版体验。再也不用为排版烦恼啦!
['项目地址'](https://github.com/typst/typst)
3. **gitingest**(星标数**9564**)简直是开发者们的福音!🎉 这款巧妙的工具,只需你在GitHub URL中将"hub”替换为"ingest”,它就能自动为**代码库**生成**提示友好型摘要**。这大大简化了理解代码内容的过程,再也不用大海捞针般地翻阅代码了!
@@ -41,21 +41,21 @@ Meta发布AI运动眼镜,谷歌升级Gemini Code Assist强化编程。月之
4. 项目**newsnow**(已获得**11354**颗星)致力于为用户提供一种**优雅地阅读实时热门新闻**的体验。📖它的目标就是让大家能更便捷、更美观地获取最新动态,追新闻也能追得有品味!
['项目地址'](https://github.com/ourongxing/newsnow)
-**社媒分享**
+###### **社媒分享**
1. **宝玉**大佬分享了获取**Claude Code****系统提示词**的两种"独门秘籍”:一是借助**claude-trace**工具,二是直接钻研那些未混淆的源代码。👨💻 这次分享简直是为开发者们点亮了一盏明灯,帮助大家深入了解如何提取**AI模型**的**内部提示词**,更好地与AI模型"对话”。💡
['更多详情'](https://x.com/dotey/status/1936422285084123434)
2. nazha在社媒上吐槽说,由于公司把**Cursor**退回到Free Plan,导致编码体验瞬间"降级”到了"刀耕火种”时代。😩 同事们都一致认为,**Cursor**的**Super Tab**功能简直是不可或缺的生命线!看来,一旦用上了高级工具,就再也回不去了。😭
['更多详情'](https://x.com/xiaokedada/status/1936255604940849576)
-

+

---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |
diff --git a/daily/2025-06-23.md b/daily/2025-06-23.md
index a72a6b0..872935f 100644
--- a/daily/2025-06-23.md
+++ b/daily/2025-06-23.md
@@ -4,7 +4,7 @@
-**AI内容摘要**
+###### **AI内容摘要**
```
罗永浩公司将推出AI效率工具集。归藏AI制作动物视频走红。
@@ -14,32 +14,32 @@ Claude代码生成获赞,Cluely被揭依赖GPT4.1。
-**AI产品与功能更新**
+###### **AI产品与功能更新**
1. 罗永浩最近**透露**了一个小秘密🤫:他家公司正在研发的**全新AI产品**,预计再等两三个月就能和大家见面啦!这可不是一个简单的AI邮件工具,而是一个超级实用的**效率工具集**。老罗还吐槽说,他们试用了不少美国AI邮件工具,效果都不咋地,而且国内在这个领域的研发团队也相对稀缺。至于新产品的具体细节?他可是**守口如瓶**,吊足了大家的胃口呢!
2. 📢 太酷啦!**歸藏的AI工具箱**最近可是玩出了新花样,他们利用**Veo3**工具,创作出了一系列火爆全网的**动物运动员AI视频**🤯!想象一下袋鼠打篮球🏀、猫咪击剑🤺的场景,是不是瞬间被萌翻了?更棒的是,他们还大方地分享了详细的**提示词模板**,让大家也能轻松上手,体验AI视频生成的无限创意!想知道怎么做的?点击['更多详情'](https://weibo.com/6182606334/PxIdZpN9s)去看看吧!
-
[](https://h5.sinaimg.cn/upload/2015/09/25/3/timeline_card_small_video_default.png)
+
[](https://h5.sinaimg.cn/upload/2015/09/25/3/timeline_card_small_video_default.png)
3. **wwwgoubuli**对**Claude**可是赞不绝口,直呼它在**代码生成**方面表现得简直是"丝滑”无比✨!他认为,Claude之所以如此出色,关键在于其卓越的"**全局观**”和"**任务编排**”能力。这就像给大型语言模型(**LLM**)装上了"智能导航”,大大减少了它们在生成过程中"横冲直撞”的尴尬局面。这种对上下文的深度把握,真是👍证明了它在提升AI模型输出质量上的巨大作用!想要了解更多?['更多详情'](https://x.com/wwwgoubuli/status/1936501764410445947)。
-**AI前沿研究**
+###### **AI前沿研究**
1. 😮 **nazha**带来了一个大爆料!Jack Cable这位技术侦探🕵️♂️竟然成功**逆向**了之前风靡一时的作弊工具 **Cluely** 的**系统提示词**!更令人惊讶的是,他揭示了Cluely幕后真正的大佬竟然是 **GPT 4.1** 和 **Claude Sonnet 3.7**!虽然Cluely煞费苦心地想隐藏它所依赖的LLM提供商,但这一发现💡无疑是戳破了它的"马甲”,彻底暴露了其背后的真实技术栈。想知道更多八卦?['更多详情'](https://x.com/xiaokedada/status/1936625579752902991)。
-
[](https://pbs.twimg.com/media/Gt_UfmKW8AAlu-T?format=jpg&name=orig)
+
[](https://pbs.twimg.com/media/Gt_UfmKW8AAlu-T?format=jpg&name=orig)
-**AI行业展望与社会影响**
+###### **AI行业展望与社会影响**
1. **Orange.ai**郑重指出,公司向**AI Native**(AI原生)转型简直是势在必行🚀!为啥呢?因为它能让员工效率飙升📈,让传统企业在组织适应上遭遇不小的挑战🤔。反观那些小巧精悍的**AI创业公司**,却能用更少的人手创造出更高的营收!这种鲜明对比,无疑预示着未来几年,**AI Native**的组织将会在市场竞争中展现出更强大的生命力!想了解更多关于未来企业的思考?['更多详情'](https://x.com/oran_ge/status/1936606314354163954)。
-**开源TOP项目**
+###### **开源TOP项目**
1. **Jaaz**来了,它简直就是**Lovart.AI的本地免费替代品**!🤩 这款神奇的工具,巧妙地结合了**AI模型**和**图像模型**的力量,让你可以在**本地**自由地设计、编辑和生成各种创意内容,比如精美的图像、吸睛的海报,甚至是完整的故事板!无限画布加上强大的图像编辑功能,创作效率瞬间飙升🎨!它还贴心地解决了大家对云服务依赖和隐私保护的担忧🛡️。更多宝藏细节,快去['项目地址'](https://github.com/11cafe/jaaz)一探究竟吧!
-
[](https://assets-v2.circle.so/rw6naq4bhuu2rcnbnkl6c27hv7i5)
-
[](https://assets-v2.circle.so/ncwmtzspazknxzlec9xepqs9jtn6)
-
[](https://assets-v2.circle.so/nuidbpiht67kucfn978hkojdxuey)
-
[](https://assets-v2.circle.so/91uye2ev8p5xng790ubrwacr3ew0)
-
[](https://assets-v2.circle.so/e2mnh4c0p8e0itabj9w4q8eh67gg)
+
[](https://assets-v2.circle.so/rw6naq4bhuu2rcnbnkl6c27hv7i5)
+
[](https://assets-v2.circle.so/ncwmtzspazknxzlec9xepqs9jtn6)
+
[](https://assets-v2.circle.so/nuidbpiht67kucfn978hkojdxuey)
+
[](https://assets-v2.circle.so/91uye2ev8p5xng790ubrwacr3ew0)
+
[](https://assets-v2.circle.so/e2mnh4c0p8e0itabj9w4q8eh67gg)
2. 哇哦,看看这个宝藏项目——**Manim**!它是一个由热心社区维护的**Python框架**,专门用来**创建数学动画**🌟!想象一下,复杂的数学概念瞬间变得**生动直观**起来,简直是教育和演示的神器🤓。目前它已经在GitHub上斩获了惊人的**32656颗星**,人气爆棚!想让数学"动”起来?赶紧去['项目地址'](https://github.com/ManimCommunity/manim)了解更多吧!
@@ -48,21 +48,21 @@ Claude代码生成获赞,Cluely被揭依赖GPT4.1。
4. 隆重介绍拥有15194个星标的**suna**!⭐ 这是一个**开源通用型AI代理**🤖,它就像你的个人AI助理,能为你提供各种强大的AI辅助功能,让你的工作和生活更加高效🚀。快去['项目地址'](https://github.com/kortix-ai/suna)探索它的奥秘吧!
5. **nazha**又带来了好消息!🥳 字节跳动竟然**开源**了他们的重量级**OCR 模型"Dolphin”**🐬!这款模型拥有惊人的**3.22亿参数**,并且巧妙地采用了**并行策略**,这意味着它能实现超快速⚡️且高质量的**文本识别**,尤其是在处理那些恼人的**不当换行问题**上,表现得简直是👌。经过实测,它的效果真的非常出色!想亲自体验一下吗?点击['更多详情'](https://x.com/xiaokedada/status/1936620029929521317)或直接去['项目地址'](https://github.com/bytedance/Dolphin?tab=readme-ov-file)围观吧!
-
[](https://pbs.twimg.com/media/GuBBa2UXMAA173j?format=jpg&name=orig)
+
[](https://pbs.twimg.com/media/GuBBa2UXMAA173j?format=jpg&name=orig)
-**社媒分享**
+###### **社媒分享**
1. 玉伯在社交媒体上抛出了一个发人深省的观点🤔:他认为,在**AI时代**,我们常做的**剪藏**行为,其真正的意义已经悄然发生了转变!它不再仅仅是传统意义上的"稍后观看”,而更像是一种**信号传递**💡,在无形中"**告诉AI我喜欢**”💖!这真是个独特的视角,让人对AI时代的数字行为有了更深层次的理解。想看看玉伯是如何思考的吗?['更多详情'](https://m.okjike.com/originalPosts/6857deccb7f4ddcfdf15a80c)。
---
-**收听语音版**
+###### **收听语音版**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
-|  |  |
+|  |  |