Files
chatgpt-on-wechat/docs/skills/image-vision.mdx
2026-02-28 14:50:55 +08:00

32 lines
721 B
Plaintext

---
title: 图像识别
description: 使用 OpenAI 视觉模型识别图片
---
使用 OpenAI 的 GPT-4 Vision API 分析图片内容,理解图像中的物体、文字、颜色等元素。
## 依赖
| 依赖 | 说明 |
| --- | --- |
| `OPENAI_API_KEY` | OpenAI API 密钥 |
| `curl`、`base64` | 系统命令(通常已预装) |
配置方式:
- 通过 `env_config` 工具配置 `OPENAI_API_KEY`
- 或在 `config.json` 中填写 `open_ai_api_key`
## 支持的模型
- `gpt-4.1-mini`(推荐,性价比高)
- `gpt-4.1`
## 使用方式
配置完成后,向 Agent 发送图片即可自动触发图像识别。
<Frame>
<img src="https://cdn.link-ai.tech/doc/20260202213219.png" width="800" />
</Frame>