82 lines
9.2 KiB
Markdown
82 lines
9.2 KiB
Markdown
## AI洞察日报 2025/6/30
|
||
|
||
> `AI 日报` | `早八更新` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/)
|
||
|
||
|
||
|
||
### **AI内容摘要**
|
||
|
||
```
|
||
Cursor倡并行Agent提升效率。研究揭示LLMs推理"波将金式”不一致,质疑AGI前景。
|
||
新型HoPE与MokA模型提升VLM和MLLM性能。AI降低创业成本,拉平起跑线。
|
||
AI投资关注定性指标和方法论,同时警惕其篡改人类文明的潜在风险。
|
||
```
|
||
|
||
|
||
|
||
### AI产品与功能更新
|
||
|
||
1. Cursor 核心开发者 Tom Huang 分享了利用 **Cursor** 更高效工作的方法,关键在于运用「**并行 Agents**」理念,建议通过 **Tab**、**Formed Tab** 和 **Background Agent** 来构建高效的任务执行系统。💻⚡
|
||
<br/> [](https://pbs.twimg.com/media/Guna8_wW4AAkmqU?format=jpg&name=orig) <br/>
|
||
['更多详情'](https://x.com/tuturetom/status/1939321864200888536)
|
||
|
||
### AI前沿研究
|
||
|
||
1. Gary Marcus 转推了一篇由 MIT、芝加哥大学、哈佛大学合著的论文,该研究揭示了大型语言模型(**LLMs**)在推理中存在"**波将金式**”不一致性,即便顶级模型也频繁犯错。Marcus 因此断言纯 **LLMs** 构建**通用人工智能(AGI)**的希望已终结,引发了行业内关于 **LLM** 能力的广泛讨论。这篇题为《Potemkin Understanding in Large Language Models》的论文通过形式化框架量化了 **LLMs** 的这种"波将金式理解”现象,指出其在概念表征上存在深层内在矛盾,即使模型能正确定义概念,也难以准确应用,从而呼吁对 **LLM** 评估方式进行反思。🤯❓
|
||
['更多详情'](https://www.jiqizhixin.com/articles/2025-06-29-5)
|
||
['论文地址'](https://arxiv.org/pdf/2506.21521)
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/e72097cc-e820-4597-a0ec-c2b312306e3e/640.png) <br/>
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/8fa03d2d-2c7d-4202-897e-50abdc401e18/640.png) <br/>
|
||
2. 为解决视觉语言模型(**VLM**)在长视频理解中的不足,CMU 和小红书的研究团队提出了一种名为 **HoPE**(Hybrid of Position Embedding)的**混合位置编码**。HoPE 通过首次针对多模态旋转位置编码(**RoPE**)扩展策略进行理论评估,发现现有方法限制了语义建模,并通过结合时间维度的零频率建模和动态缩放策略,显著提升了 **VLM** 的**长度泛化能力**,在长视频理解和检索任务中达到了最优表现。🎬✨
|
||
['论文地址'](https://arxiv.org/pdf/2505.20444)
|
||
['代码链接'](https://github.com/hrlics/HoPE)
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/07c7463b-a718-45d0-bd66-7446710db689/640.png) <br/>
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/cc288ff5-7708-4b62-9e4a-a57e3610f82b/640.png) <br/>
|
||
3. 中国人民大学与上海人工智能实验室的研究团队提出了一种专为多模态大模型(**MLLMs**)设计的微调新范式——**MokA**(Multimodal low-rank Adaptation),旨在克服现有方法忽视多模态数据异质性的局限。**MokA** 通过模态特异的 A 矩阵、跨模态注意力机制和模态共享的 B 矩阵,同时兼顾了单模态信息的独立建模与模态间的充分交互,在音频-视觉-文本、视觉-文本、语音-文本等多种任务场景和主流 **LLM** 基座上均实现了显著的性能提升。💡🚀
|
||
['论文链接'](https://arxiv.org/abs/2506.05191)
|
||
['项目主页'](https://gewu-lab.github.io/MokA)
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/0dac2061-2746-4f2c-9304-8e503330c3d7/640.png) <br/>
|
||
<br/> [](https://image.jiqizhixin.com/uploads/editor/7e11d47c-1627-4d37-8cda-ee12a31a26e5/640.png) <br/>
|
||
|
||
### AI行业展望与社会影响
|
||
|
||
1. Yangyi 认为当前存在一个「**注意力套利窗口**」:少数人已利用 **AI** 构建内容杠杆,而当绝大多数人使用 **AI** 后,人类内容创作将产生溢价。然而,他更担忧 **AI** 会以极低的「**边际成本**」**篡改人类文明**,通过蚕食精神文化来影响人类。他引用 Greg Isenberg 的观察,指出大量 **AI** 账号在社交媒体上泛滥已成「新常态」。🤔⚠️
|
||
['更多详情'](https://x.com/Yangyixxxx/status/1939318396111430096)
|
||
2. Yangyi 指出 **AI时代创业** 的最大不同在于「**构建MVP的成本**」大幅降低,使创业者能以极低的成本快速验证想法。他建议不必纠结想法好坏,直接利用 **AI** 在短短几天内完成「**想法验证**」,甚至能在三个月内尝试三十个想法,从而大大提高找到有价值项目的机会。💡📈
|
||
['更多详情'](https://x.com/Yangyixxxx/status/1939278373978857614)
|
||
3. AI 投资人杨毅强调,在对 AI 创业项目进行投资时,他更倾向于关注定性指标,包括**创始人**对 **Agent** 未来**路径的宏图规划**、团队对 AI **信念**的坚定程度、团队**管理**中对 **AI 利用**的效率、**Agent** 如何构建**反馈闭环**以实现自我提升(即**AI 成功的方法论**),以及**多智能体框架**的**扩展性**。他认为这五点共同决定了项目的投资价值,而非简单看留存或用户量等传统指标。💰🧐
|
||
['更多详情'](https://x.com/Yangyixxxx/status/1939212085185093664)
|
||
4. 有观点指出,部分**投资人**仍在沿用**移动互联网**时代的**数据指标**来评估**AI行业**项目,导致难以找到"留存好”的 AI 项目,甚至三年未出手投资。这可能是因为**形式逻辑**、**非形式逻辑**及**概率论**本质上都**面向过去**,而**贝叶斯定律**则是一种**面向未来**的分析方法,更适用于指导当下的决策。📊🔮
|
||
<br/> [](https://cdnv2.ruguoapp.com/FkJ8Cttpht-FSudcqveStLiBY6BBv3.png) <br/>
|
||
<br/> [](https://cdnv2.ruguoapp.com/FhaVZhhtXfzamqX8c4dNBF62yfZRv3.png) <br/>
|
||
['更多详情'](https://m.okjike.com/originalPosts/6860acdfd82bae994ab2ac0e)
|
||
5. 大帅老猿与 Dash 一致认为,**AI** 的出现极大地**拉平了起跑线**,对于新人而言是比 20 年前互联网更大的机遇,使他们能**利用 AI** 突破资源限制实现目标。他们强调,若程序员固步自封不思进取,这条起跑线最终会追上并取代他们。🏁🚀
|
||
['更多详情'](https://x.com/ezshine/status/1939097986682036566)
|
||
<video src="https://video.twimg.com/amplify_video/1938922173013651456/vid/avc/1920x1080/lVHNYiDsj_o_yd27.mp4?tag=21" controls="controls" width="100%"></video>
|
||
|
||
### 开源TOP项目
|
||
|
||
1. **generative-ai-for-beginners** 是一个拥有 86547 星的开源项目,旨在通过 21 节课程帮助初学者入门并使用**生成式AI**进行**构建**。✨
|
||
['项目地址'](https://github.com/microsoft/generative-ai-for-beginners)
|
||
2. 拥有 62777 星的 **system-prompts-and-models-of-ai-tools** 项目,收集了包括 Cursor、Devin 等多种**AI 工具**的**系统提示**、**工具**和**AI 模型**,为开发者提供便利。🛠️
|
||
['项目地址'](https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools)
|
||
3. **storm** 是一个 24892 星的开源项目,它是一个由 **LLM** 驱动的**知识管理系统**,能够自主**研究**特定主题并生成带有**引用**的完整报告。🔍
|
||
['项目地址'](https://github.com/stanford-oval/storm)
|
||
|
||
### 社媒分享
|
||
|
||
1. 在与**AI 交流写代码**的过程中,一位开发者分享了一种更高效的**协作模式**:不再一开始就给出详细需求,而是先让 AI 了解**项目上下文**、文档、代码风格和项目目标,然后让 AI 提出思路,双方共同**对齐颗粒度**。这种方法不仅能避免人脑在复杂**规划**上的局限性,还能大幅提升**效率**,即便在代码编写以外的领域也同样适用。🤝🤖
|
||
['更多详情'](https://x.com/wwwgoubuli/status/1939168328070603017)
|
||
|
||
---
|
||
|
||
## **收听语音版AI日报**
|
||
|
||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||
| --- | --- |
|
||
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||
|  |  |
|
||
|
||
|
||
|