返回 MCP 首页

Firecrawl

@ 社区模板

Firecrawl 提供强大的网页抓取能力,且支持转化为HTML/Markdown格式
Firecrawl
爬虫
社区 MCP

MCP 服务接入 — Firecrawl 网页抓取与深度研究

通过 MCP 协议提供强大的网页抓取、搜索和深度研究能力。

Firecrawl MCP Server 接受查询文本,利用 Firecrawl 的网页抓取能力,返回最相关的网页内容,支持从多种网页中提取文本,并将其转换为 Markdown/HTML 格式,供 LLM(大语言模型)进行处理和生成。

部署 MCP Server


环境变量

  • FIRECRAWL_API_KEY:您的 Firecrawl API 密钥。
  • FIRECRAWL_API_URL(可选):自托管实例的自定义 API 端点。
  • FIRECRAWL_RETRY_MAX_ATTEMPTS(可选):最大重试次数(默认:3)。
  • FIRECRAWL_RETRY_INITIAL_DELAY(可选):首次重试的初始延迟时间(默认:1000 毫秒)。
  • FIRECRAWL_RETRY_MAX_DELAY(可选):重试之间的最大延迟时间(默认:10000 毫秒)。
  • FIRECRAWL_RETRY_BACKOFF_FACTOR(可选):指数退避因子(默认:2)。

使用说明

Firecrawl MCP Server 参考文档

🗺️ 功能清单

工具标识功能描述核心参数
firecrawl_scrape抓取单个网页内容,支持 JavaScript 渲染,返回清理后的文本内容。url(网页 URL),formats(返回格式,如 ["markdown"]),waitFor(等待时间,毫秒),timeout(超时时间,毫秒),mobile(是否使用移动视图)
firecrawl_map映射网站,发现所有索引的 URL。url(网站 URL),search(可选的搜索词),ignoreSitemap(是否忽略 sitemap.xml),includeSubdomains(是否包括子域名),limit(最大 URL 数量)
firecrawl_search在网页中搜索指定内容,返回匹配的结果。query(查询文本),limit(返回的结果数量),lang(语言),country(国家),scrapeOptions(抓取选项)
firecrawl_crawl启动异步抓取,支持多页面提取。url(网站 URL),excludePaths (排除路径),includePaths (包含路径), maxDepth(最大深度),limit(最大页面数),allowExternalLinks(是否允许外部链接),deduplicateSimilarURLs(是否去重相似 URL)
firecrawl_check_crawl_status检查爬虫爬取状态。id(爬虫任务ID)
firecrawl_extract从页面中提取结构化数据。urls(网页 URL 列表),prompt (用于 LLM 提取的自定义提示词), systemPrompt (指导 LLM 的系统提示词), schema (用于结构化数据提取的 JSON 模式), allowExternalLinks (允许从外部链接提取信息), enableWebSearch (启用网页搜索以获取额外上下文), includeSubdomains (在提取时包含子域名)
firecrawl_deep_research执行深入的多源研究,提供摘要和来源。query(查询文本),maxDepth(最大深度), timeLimit (时间限制 秒), maxUrls (要分析的最大 URL 数量, 默认50)
firecrawl_generate_llmstxt为特定领域生成 LLMs.txt 文件。url(要分析的网站的基础 URL),maxUrls 要包含的最大 URL 数量(默认:10), showFullText 是否在响应中包含 llms-full.txt 的内容

仓库地址

https://github.com/mendableai/firecrawl-mcp-server


🔌 使用方式


云开发 MCP 控制台