स्क्रेप URL लोगो

कैटलॉग कार्रवाई एकीकरण

एक वेबपेज को स्क्रेप करें और इसे साफ़, LLM-तैयार मार्कडाउन या अन्य प्रारूपों में परिवर्तित करें। जावास्क्रिप्ट रेंडरिंग को संभालता है, मुख्य सामग्री निकालता है, तथा मेटाडेटा के साथ संरचित डेटा लौटाता है। आदर्श के लिए: सामग्री निष्कर्षण, RAG डेटा संग्रह, वेब अनुसंधान, लेख सारांशीकरण, डेटा एकत्रीकरण।

एक नजर में

फ़ील्डमान
Action IDfirecrawl-scrape-url
CategoryIntegrations
Connectorआवश्यक नहीं
Requires gasनहीं
Funds movementकोई घोषित नहीं
Tagsfirecrawl, scrape, web, content, markdown, extraction, read

पेलोड स्कीमा

फ़ील्डप्रकारआवश्यकविवरण
urlstringहाँस्क्रेप करने के लिए URL। वैध HTTP/HTTPS URL होना चाहिए।
formatsarrayनहींलौटाने के लिए आउटपुट प्रारूप। विकल्प: 'markdown' (साफ़ पाठ), 'html' (प्रसंस्कृत HTML), 'rawHtml' (मूल HTML), 'links' (निकाले गए URL), 'screenshot' (पृष्ठ छवि), 'json' (संरचित डेटा), 'summary' (AI सारांश), 'images' (छवि URL)। डिफ़ॉल्ट: ['markdown']
onlyMainContentbooleanनहींकेवल मुख्य सामग्री निकालें, हेडर, नेविगेशन और फुटर को छोड़कर। डिफ़ॉल्ट: true
waitFornumberनहींस्क्रेपिंग से पहले जावास्क्रिप्ट रेंडर होने का इंतजार करने के लिए मिलीसेकंड में समय। गतिशील साइटों के लिए उपयोगी। सीमा: 0-30000। अवप्रचलित: इसके बजाय कार्रवाइयों का उपयोग करें।
actionsarrayनहींस्क्रेपिंग से पहले करने के लिए पृष्ठ कार्रवाइयाँ। जावास्क्रिप्ट-भारी साइटों के लिए उपयोग करें जिन्हें सामग्री दिखने से पहले इंटरैक्शन की आवश्यकता हो।
timeoutnumberनहींअनुरोध समय सीमा मिलीसेकंड में। डिफ़ॉल्ट: 30000 (30 सेकंड)। अधिकतम: 300000 (5 मिनट)।

परिणाम स्कीमा

फ़ील्डप्रकारआवश्यकविवरण
successbooleanहाँक्या स्क्रेप अनुरोध सफल रहा
dataobjectहाँ-

उदाहरण

json
{ "type": "firecrawl-scrape-url", "payload": { "url": "https://example.com/webhook" }, "children": []}

पेलोड फ़ील्ड्स वर्कफ़्लो अभिव्यक्तियों का उपयोग कर सकते हैं जैसे {{$trigger.body.amount}}, {{$nodes.fetch.result.price}}, और {{$props.asset}} जब मान किसी ट्रिगर, पूर्ववर्ती नोड, या पुन: उपयोग योग्य वर्कफ़्लो प्रॉप से आना चाहिए।

Ask a question... ⌘I