サイトマップを読み込みURLをフィルタリング
中級
これはEngineering, Marketing分野の自動化ワークフローで、10個のノードを含みます。主にSet, Xml, Filter, SplitOut, HttpRequestなどのノードを使用。 sitemap.xmlから特定のリンクをクロールして処理
前提条件
- •ターゲットAPIの認証情報が必要な場合あり
ワークフロープレビュー
ノード接続関係を可視化、ズームとパンをサポート
ワークフローをエクスポート
以下のJSON設定をn8nにインポートして、このワークフローを使用できます
{
"id": "7fdJOvYNILCr24fH",
"meta": {
"instanceId": "568298fde06d3db80a2eea77fe5bf45f0c7bb898dea20b769944e9ac7c6c5a80"
},
"name": "Read sitemap and filter URLs",
"tags": [],
"nodes": [
{
"id": "38910330-5286-4f3f-b62e-9216acccd503",
"name": "「Test workflow」トリガー",
"type": "n8n-nodes-base.manualTrigger",
"position": [
-460,
-60
],
"parameters": {},
"typeVersion": 1
},
{
"id": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"name": "サイトマップURL設定",
"type": "n8n-nodes-base.set",
"position": [
-280,
-60
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "d6c5ac86-6d67-42fb-96ec-9826caf452e2",
"name": "sitemapUrl",
"type": "string",
"value": "https://duckduckgo.com/sitemap.xml"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "0d957deb-5830-4077-97e4-437dc7c0e527",
"name": "分割",
"type": "n8n-nodes-base.splitOut",
"position": [
260,
-60
],
"parameters": {
"options": {},
"fieldToSplitOut": "urlset.url"
},
"typeVersion": 1
},
{
"id": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"name": "サイトマップ取得",
"type": "n8n-nodes-base.httpRequest",
"position": [
-100,
-60
],
"parameters": {
"url": "={{ $json.sitemapUrl }}",
"options": {}
},
"typeVersion": 4.2
},
{
"id": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"name": "サイトマップを JSON に変換",
"type": "n8n-nodes-base.xml",
"position": [
80,
-60
],
"parameters": {
"options": {
"trim": true,
"normalize": true,
"mergeAttrs": true,
"ignoreAttrs": true,
"normalizeTags": true
}
},
"typeVersion": 1
},
{
"id": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"name": "URLフィルタリング",
"type": "n8n-nodes-base.filter",
"position": [
440,
-60
],
"parameters": {
"options": {},
"conditions": {
"options": {
"version": 2,
"leftValue": "",
"caseSensitive": true,
"typeValidation": "strict"
},
"combinator": "and",
"conditions": [
{
"id": "0bf8e98c-b6c5-4129-852c-0d3e63f32f9f",
"operator": {
"type": "string",
"operation": "endsWith"
},
"leftValue": "={{ $json.loc }}",
"rightValue": ".pdf"
}
]
}
},
"typeVersion": 2.2
},
{
"id": "1d3fed97-1e72-426c-a48d-1a9683f40c4c",
"name": "付箋1",
"type": "n8n-nodes-base.stickyNote",
"position": [
-300,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Set your sitemap.xml\nurl here.**"
},
"typeVersion": 1
},
{
"id": "521ec74d-6707-47fd-992d-eecebed415ab",
"name": "付箋2",
"type": "n8n-nodes-base.stickyNote",
"position": [
420,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Create your filter here.**"
},
"typeVersion": 1
},
{
"id": "07e6c3de-cc72-490d-b614-67034ce04bfb",
"name": "付箋3",
"type": "n8n-nodes-base.stickyNote",
"position": [
-140,
-180
],
"parameters": {
"color": 7,
"width": 540,
"height": 300,
"content": "## Fetch and process the sitemap.xml file\nThis part fetches and process the sitemap.xml file from XML data to JSON that we can work with."
},
"typeVersion": 1
},
{
"id": "abf5f02d-d2a0-43f1-9a1f-386cc4f9861b",
"name": "付箋",
"type": "n8n-nodes-base.stickyNote",
"position": [
-780,
-220
],
"parameters": {
"width": 280,
"height": 420,
"content": "## Sitemap.xml reader\nThis workflow reads an sitemap.xml and filters out the entries you want.\n\nBy default only PDF documents are returned at the end of the workflow.\n\n**SETUP**\n- Edit the **Set sitemap URL** block and add the url to the sitemap you want to read.\n\n- Edit the **Filter URLs** to your needs."
},
"typeVersion": 1
}
],
"active": false,
"pinData": {},
"settings": {
"executionOrder": "v1"
},
"versionId": "74793599-4c7d-4532-bbd5-a2ce4761fbc8",
"connections": {
"0d957deb-5830-4077-97e4-437dc7c0e527": {
"main": [
[
{
"node": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"type": "main",
"index": 0
}
]
]
},
"7021088c-dfa1-4aae-b2e7-15b0ca10a750": {
"main": [
[
{
"node": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"type": "main",
"index": 0
}
]
]
},
"d4e5991b-62d9-45ca-962f-c1077f3bce19": {
"main": [
[
{
"node": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"type": "main",
"index": 0
}
]
]
},
"d3b86577-01fc-40f8-ab65-93ba420187b8": {
"main": [
[
{
"node": "0d957deb-5830-4077-97e4-437dc7c0e527",
"type": "main",
"index": 0
}
]
]
},
"38910330-5286-4f3f-b62e-9216acccd503": {
"main": [
[
{
"node": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"type": "main",
"index": 0
}
]
]
}
}
}よくある質問
このワークフローの使い方は?
上記のJSON設定コードをコピーし、n8nインスタンスで新しいワークフローを作成して「JSONからインポート」を選択、設定を貼り付けて認証情報を必要に応じて変更してください。
このワークフローはどんな場面に適していますか?
中級 - エンジニアリング, マーケティング
有料ですか?
このワークフローは完全無料です。ただし、ワークフローで使用するサードパーティサービス(OpenAI APIなど)は別途料金が発生する場合があります。
関連ワークフロー
ウェブページ内リンクの抽出
Web ページから内部リンクを抽出する
If
Set
Html
+
If
Set
Html
13 ノードAudun
エンジニアリング
ビジュアルベースのAIエージェントクローラー - Google Sheets、ScrapingBee、Geminiを使用
✨ ビジュアルベースのAIエージェントスクレイパー - Google Sheets、ScrapingBee、Geminiを使用
Set
Markdown
Split Out
+
Set
Markdown
Split Out
29 ノードDataki
営業
APIアーキテクチャ抽出ツール
APIアーキテクチャ抽出器
If
Set
Code
+
If
Set
Code
88 ノードPolina Medvedieva
エンジニアリング
私のワークフロー5
AIメールパーソナライゼーションを使用した自動LinkedInリード生成(未完了)
If
Set
Code
+
If
Set
Code
37 ノードMatthieu
営業
私のサブワークフロー 3
DataForSEOを使用した自動SEOキーワードおよびSERP分析による高転換コンテンツの構築
Set
Filter
Split Out
+
Set
Filter
Split Out
55 ノードSam Yassine
マーケティング
CSVからHubSpotアップローダー(動のフィールドマッピングとGoogle Sheets連携)
CSVをHubSpotにアップロードするツール(動のフィールドマッピングとGoogle Sheets連携)
If
Set
Code
+
If
Set
Code
36 ノードPollupAI
人工知能