@ 社区模板
通过 MCP 协议提供强大的网页抓取、搜索和深度研究能力。
Firecrawl MCP Server 接受查询文本,利用 Firecrawl 的网页抓取能力,返回最相关的网页内容,支持从多种网页中提取文本,并将其转换为 Markdown/HTML 格式,供 LLM(大语言模型)进行处理和生成。
工具标识 | 功能描述 | 核心参数 |
---|---|---|
firecrawl_scrape | 抓取单个网页内容,支持 JavaScript 渲染,返回清理后的文本内容。 | url (网页 URL),formats (返回格式,如 ["markdown"] ),waitFor (等待时间,毫秒),timeout (超时时间,毫秒),mobile (是否使用移动视图) |
firecrawl_map | 映射网站,发现所有索引的 URL。 | url (网站 URL),search (可选的搜索词),ignoreSitemap (是否忽略 sitemap.xml),includeSubdomains (是否包括子域名),limit (最大 URL 数量) |
firecrawl_search | 在网页中搜索指定内容,返回匹配的结果。 | query (查询文本),limit (返回的结果数量),lang (语言),country (国家),scrapeOptions (抓取选项) |
firecrawl_crawl | 启动异步抓取,支持多页面提取。 | url (网站 URL),excludePaths (排除路径),includePaths (包含路径), maxDepth (最大深度),limit (最大页面数),allowExternalLinks (是否允许外部链接),deduplicateSimilarURLs (是否去重相似 URL) |
firecrawl_check_crawl_status | 检查爬虫爬取状态。 | id (爬虫任务ID) |
firecrawl_extract | 从页面中提取结构化数据。 | urls (网页 URL 列表),prompt (用于 LLM 提取的自定义提示词), systemPrompt (指导 LLM 的系统提示词), schema (用于结构化数据提取的 JSON 模式), allowExternalLinks (允许从外部链接提取信息), enableWebSearch (启用网页搜索以获取额外上下文), includeSubdomains (在提取时包含子域名) |
firecrawl_deep_research | 执行深入的多源研究,提供摘要和来源。 | query (查询文本),maxDepth (最大深度), timeLimit (时间限制 秒), maxUrls (要分析的最大 URL 数量, 默认50) |
firecrawl_generate_llmstxt | 为特定领域生成 LLMs.txt 文件。 | url (要分析的网站的基础 URL),maxUrls 要包含的最大 URL 数量(默认:10), showFullText 是否在响应中包含 llms-full.txt 的内容 |
https://github.com/mendableai/firecrawl-mcp-server