mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-02-19 00:37:23 +08:00
122 lines
5.7 KiB
Markdown
122 lines
5.7 KiB
Markdown
# CowAgent 2.0
|
||
|
||
🚀 CowAgent 2.0 实现了从聊天机器人到**超级智能助理**的全面升级!现在它能够主动思考和规划任务、拥有长期记忆、操作计算机和外部资源、创造和执行技能,真正理解你并和你一起成长。
|
||
|
||
### ✨ 重点更新
|
||
|
||
- Agent核心能力:
|
||
- **复杂任务规划**:能够理解复杂任务并自主规划执行,持续思考和调用工具直到完成目标,支持多轮推理和上下文理解。
|
||
- **长期记忆**:自动将对话记忆持久化至本地文件和数据库中,包括全局记忆和天级记忆,支持关键词及向量检索。
|
||
- **内置系统工具**:内置实现10+种工具,包括文件操作、bash终端、浏览器、文件发送、定时任务、记忆管理等。
|
||
- **Skills**:新增Skill运行引擎,内置多种技能,并支持通过自然语言对话完成自定义Skills开发。
|
||
- **安全和成本**:通过秘钥管理工具、提示词控制、系统权限等手段控制Agent的访问安全;通过最大记忆轮次、最大上下文token、工具执行步数对token成本进行限制。
|
||
- 其他更新:
|
||
- 渠道优化:飞书及钉钉接入渠道支持长连接接入(无需公网IP)、支持图片/文件消息的接收和发送。
|
||
- 模型更新:新增claude-sonnet-4-5、gemini-3-pro-preview、glm-4.7、MiniMax-M2.1、qwen3-max等最新模型。
|
||
- 部署优化:增加一键安装、配置、运行、管理的脚本,简化部署流程。
|
||
|
||
## 一、长期记忆系统
|
||
|
||
Agent 会在用户分享重要信息时主动存储,也会在对话达到一定长度时自动提取摘要。支持语义搜索和向量检索的混合检索模式。
|
||
|
||
**首次启动**时,Agent 会主动询问关键信息,并记录至工作空间(默认 `~/cow`)中的智能体设定、用户身份、记忆文件中。
|
||
|
||
**长期对话**中,Agent 会智能记录或检索记忆,不断更新自身设定、用户偏好,总结经验和教训,真正实现自主思考和持续成长。
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260203000455.png">
|
||
|
||
|
||
## 二、任务规划与工具调用
|
||
|
||
Agent 根据任务需求智能选择和调用工具,完成各类复杂操作。
|
||
|
||
### 1. 终端和文件访问
|
||
|
||
最基础和核心的工具能力,用户可通过手机端与 Agent 交互,操作个人电脑或服务器上的资源:
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260202181130.png">
|
||
|
||
### 2. 应用编程能力
|
||
|
||
基于编程能力和系统访问能力,Agent 可实现从信息搜索、素材生成、编码、测试、部署、Nginx配置、发布的 **Vibecoding 全流程**,通过手机端一句命令完成应用快速 demo。
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260203121008.png">
|
||
|
||
### 3. 定时任务
|
||
|
||
支持 **一次性任务、固定时间间隔、Cron表达式** 三种形式,任务触发可选择 **固定消息发送** 或 **Agent动态任务执行** 两种模式:
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260202195402.png">
|
||
|
||
### 4. 环境变量管理
|
||
|
||
通过 `env_config` 工具管理技能所需秘钥,支持对话式更新,内置安全保护和脱敏策略:
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260202234939.png">
|
||
|
||
## 三、技能系统
|
||
|
||
每个 Skill 由说明文件、运行脚本(可选)、资源(可选)组成,为 Agent 提供无限扩展性。
|
||
|
||
### 1. 技能创造器
|
||
|
||
通过对话方式快速创建技能,将工作流程固化或对接任意第三方接口:
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260202202247.png">
|
||
|
||
### 2. 搜索和图像识别
|
||
|
||
- **搜索技能**:内置 `bocha-search`(博查搜索),配置 `BOCHA_SEARCH_API_KEY` 即可使用。
|
||
- **图像识别**:支持 `gpt-4.1-mini`、`gpt-4.1` 等模型,配置 `OPENAI_API_KEY` 即可使用。
|
||
|
||
<img width="800" src="https://cdn.link-ai.tech/doc/20260202213219.png">
|
||
|
||
### 3. 三方知识库和插件
|
||
|
||
`linkai-agent` 技能可将 [LinkAI](https://link-ai.tech/) 上的所有智能体作为 skill 使用,实现多智能体决策:
|
||
|
||
<img width="750" src="https://cdn.link-ai.tech/doc/20260202234350.png">
|
||
|
||
|
||
## 四、快速开始
|
||
|
||
### 一键启动
|
||
|
||
本次新增了一键下载、配置、运行和管理的脚本,只需命令行中执行:
|
||
|
||
```bash
|
||
bash <(curl -sS https://cdn.link-ai.tech/code/cow/run.sh)
|
||
```
|
||
|
||
详细说明参考:[项目启动脚本](https://github.com/zhayujie/chatgpt-on-wechat/wiki/CowAgentQuickStart)
|
||
|
||
### 模型选择
|
||
|
||
Agent 模式推荐使用以下模型:
|
||
|
||
- **Claude**: `claude-sonnet-4-5`、`claude-sonnet-4-0`
|
||
- **Gemini**: `gemini-3-flash-preview`、`gemini-3-pro-preview`
|
||
- **GLM**: `glm-4.7`
|
||
- **MiniMax**: `MiniMax-M2.1`
|
||
- **Qwen**: `qwen3-max`
|
||
|
||
详细配置方式参考 [README.md 模型说明](../README.md#模型说明)
|
||
|
||
|
||
### 渠道接入
|
||
|
||
支持在 Web、飞书、钉钉、企业微信 等多渠道与 Agent 交互,随时随地使用超级助理,只需修改 `config.json` 中的 `channel_type` 配置即可切换:
|
||
|
||
- **Web网页**:默认使用该渠道,运行后监听本地端口,通过浏览器访问。
|
||
- **飞书接入**:[飞书接入文档](https://docs.link-ai.tech/cow/multi-platform/feishu)
|
||
- **钉钉接入**:[钉钉接入文档](https://docs.link-ai.tech/cow/multi-platform/dingtalk)
|
||
- **企业微信应用接入**:[企微应用文档](https://docs.link-ai.tech/cow/multi-platform/wechat-com)
|
||
|
||
更多渠道配置参考:[通道说明](../README.md#通道说明)
|
||
|
||
## 五、参与共建
|
||
|
||
2.0版本后,项目将持续升级Agent能力、拓展接入渠道、内置工具、技能系统,降低模型成本和提升安全性。欢迎 [提出反馈](https://github.com/zhayujie/chatgpt-on-wechat/issues) 和 [贡献代码](https://github.com/zhayujie/chatgpt-on-wechat/pulls)。
|
||
|
||
**🤖立即体验 CowAgent 2.0,开启你的超级AI助理之旅!**
|