mirror of
https://github.com/zhayujie/chatgpt-on-wechat.git
synced 2026-03-03 08:54:50 +08:00
32 lines
935 B
Plaintext
32 lines
935 B
Plaintext
---
|
||
title: 网页抓取
|
||
description: 抓取网页文本内容
|
||
---
|
||
|
||
使用 curl 抓取网页并提取可读文本内容,轻量级的网页访问方式,无需浏览器自动化。
|
||
|
||
## 依赖
|
||
|
||
| 依赖 | 说明 |
|
||
| --- | --- |
|
||
| `curl` | 系统命令(通常已预装) |
|
||
|
||
该技能设置了 `always: true`,只要系统有 `curl` 命令即默认启用。
|
||
|
||
## 使用方式
|
||
|
||
当 Agent 需要获取某个 URL 的网页内容时会自动调用,无需额外配置。
|
||
|
||
## 与 browser 工具的区别
|
||
|
||
| 特性 | web-fetch(技能) | browser(工具) |
|
||
| --- | --- | --- |
|
||
| 依赖 | 仅 curl | browser-use + playwright |
|
||
| JS 渲染 | 不支持 | 支持 |
|
||
| 页面交互 | 不支持 | 支持点击、输入等 |
|
||
| 适用场景 | 获取静态页面文本 | 操作动态网页 |
|
||
|
||
<Tip>
|
||
对于大多数网页内容获取场景,web-fetch 就够用了。只有需要 JS 渲染或页面交互时才需要 browser 工具。
|
||
</Tip>
|