WebFetch API
WebFetch API
Lexmount WebFetch 的公开概览文档。
Lexmount WebFetch 是一个对外公开的网页提取 API,用来抓取页面、按需渲染,并直接返回结构化结果,无需自己搭建 scraping pipeline。
能力概览
POST /v1/extract:一体化结构化提取POST /v1/dom/dump:获取抓取后的 HTML,并复用 DOM 快照- 支持通过
dom_id串联抓取和提取链路 - 支持
trace和raw_dom调试字段 - 提供常见 HTTP / API 错误排查说明
鉴权说明
- 当前接口处于内测阶段
- 外部调用时,请求需要带
X-API-Key - 请联系管理员获取 API key
从这里开始
- 快速开始 说明第一个请求、返回结构,以及何时使用
dump-dom - All-in-One Extract 说明
/v1/extract的完整请求与响应格式 - Dump DOM 说明引擎选择、HTML 抓取和
dom_id复用 - 常见错误 说明常见接入故障与排查方法
典型调用流程
- 正常生产调用时,先用
POST /v1/extract,传extract.url。 - 如果想缩小返回体,显式关闭
trace.include_steps。 - 如果提取失败,或者要检查实际抓到的 HTML,再调用
POST /v1/dom/dump。 - 使用返回的
dom_id再发起/v1/extract,把抓取问题和提取问题拆开看。
常见输出字段
result 里最常用的字段包括:
titledescriptionmain_textfinal_urlauthorpublish_timelinksimagesenginetemplate_iddom_id
Lexmount 文档