返回 MCP 首页

Firecrawl

@ 社区模板

Firecrawl 提供强大的网页抓取能力，且支持转化为HTML/Markdown格式

Firecrawl

爬虫

社区 MCP

MCP 服务接入 — Firecrawl 网页抓取与深度研究

通过 MCP 协议提供强大的网页抓取、搜索和深度研究能力。

Firecrawl MCP Server 接受查询文本，利用 Firecrawl 的网页抓取能力，返回最相关的网页内容，支持从多种网页中提取文本，并将其转换为 Markdown/HTML 格式，供 LLM（大语言模型）进行处理和生成。

部署 MCP Server

环境变量

FIRECRAWL_API_KEY：您的 Firecrawl API 密钥。
FIRECRAWL_API_URL（可选）：自托管实例的自定义 API 端点。
FIRECRAWL_RETRY_MAX_ATTEMPTS（可选）：最大重试次数（默认：3）。
FIRECRAWL_RETRY_INITIAL_DELAY（可选）：首次重试的初始延迟时间（默认：1000 毫秒）。
FIRECRAWL_RETRY_MAX_DELAY（可选）：重试之间的最大延迟时间（默认：10000 毫秒）。
FIRECRAWL_RETRY_BACKOFF_FACTOR（可选）：指数退避因子（默认：2）。

使用说明

Firecrawl MCP Server 参考文档

🗺️ 功能清单

工具标识	功能描述	核心参数
`firecrawl_scrape`	抓取单个网页内容，支持 JavaScript 渲染，返回清理后的文本内容。	`url`（网页 URL），`formats`（返回格式，如 `["markdown"]`），`waitFor`（等待时间，毫秒），`timeout`（超时时间，毫秒），`mobile`（是否使用移动视图）
`firecrawl_map`	映射网站，发现所有索引的 URL。	`url`（网站 URL），`search`（可选的搜索词），`ignoreSitemap`（是否忽略 sitemap.xml），`includeSubdomains`（是否包括子域名），`limit`（最大 URL 数量）
`firecrawl_search`	在网页中搜索指定内容，返回匹配的结果。	`query`（查询文本），`limit`（返回的结果数量），`lang`（语言），`country`（国家），`scrapeOptions`（抓取选项）
`firecrawl_crawl`	启动异步抓取，支持多页面提取。	`url`（网站 URL），`excludePaths` (排除路径)，`includePaths` (包含路径)， `maxDepth`（最大深度），`limit`（最大页面数），`allowExternalLinks`（是否允许外部链接），`deduplicateSimilarURLs`（是否去重相似 URL）
`firecrawl_check_crawl_status`	检查爬虫爬取状态。	`id`（爬虫任务ID）
`firecrawl_extract`	从页面中提取结构化数据。	`urls`（网页 URL 列表），`prompt` (用于 LLM 提取的自定义提示词), `systemPrompt` (指导 LLM 的系统提示词), `schema` (用于结构化数据提取的 JSON 模式), `allowExternalLinks` (允许从外部链接提取信息), `enableWebSearch` (启用网页搜索以获取额外上下文), `includeSubdomains` (在提取时包含子域名)
`firecrawl_deep_research`	执行深入的多源研究，提供摘要和来源。	`query`（查询文本），`maxDepth`（最大深度）, `timeLimit` (时间限制秒), `maxUrls` (要分析的最大 URL 数量, 默认50)
`firecrawl_generate_llmstxt`	为特定领域生成 LLMs.txt 文件。	`url`（要分析的网站的基础 URL），`maxUrls` 要包含的最大 URL 数量（默认：10）, `showFullText` 是否在响应中包含 llms-full.txt 的内容

仓库地址

https://github.com/mendableai/firecrawl-mcp-server

🔌 使用方式

云开发 MCP 控制台