Lectura de sitemaps y filtrado de URL

Intermedio

Este es unEngineering, Marketingflujo de automatización del dominio deautomatización que contiene 10 nodos.Utiliza principalmente nodos como Set, Xml, Filter, SplitOut, HttpRequest. Extraer y procesar enlaces específicos de sitemap.xml

Requisitos previos
  • Pueden requerirse credenciales de autenticación para la API de destino
Vista previa del flujo de trabajo
Visualización de las conexiones entre nodos, con soporte para zoom y panorámica
Exportar flujo de trabajo
Copie la siguiente configuración JSON en n8n para importar y usar este flujo de trabajo
{
  "id": "7fdJOvYNILCr24fH",
  "meta": {
    "instanceId": "568298fde06d3db80a2eea77fe5bf45f0c7bb898dea20b769944e9ac7c6c5a80"
  },
  "name": "Read sitemap and filter URLs",
  "tags": [],
  "nodes": [
    {
      "id": "38910330-5286-4f3f-b62e-9216acccd503",
      "name": "Disparador 'Test workflow'",
      "type": "n8n-nodes-base.manualTrigger",
      "position": [
        -460,
        -60
      ],
      "parameters": {},
      "typeVersion": 1
    },
    {
      "id": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
      "name": "Establecer URL del mapa del sitio",
      "type": "n8n-nodes-base.set",
      "position": [
        -280,
        -60
      ],
      "parameters": {
        "options": {},
        "assignments": {
          "assignments": [
            {
              "id": "d6c5ac86-6d67-42fb-96ec-9826caf452e2",
              "name": "sitemapUrl",
              "type": "string",
              "value": "https://duckduckgo.com/sitemap.xml"
            }
          ]
        }
      },
      "typeVersion": 3.4
    },
    {
      "id": "0d957deb-5830-4077-97e4-437dc7c0e527",
      "name": "Dividir",
      "type": "n8n-nodes-base.splitOut",
      "position": [
        260,
        -60
      ],
      "parameters": {
        "options": {},
        "fieldToSplitOut": "urlset.url"
      },
      "typeVersion": 1
    },
    {
      "id": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
      "name": "Obtener mapa del sitio",
      "type": "n8n-nodes-base.httpRequest",
      "position": [
        -100,
        -60
      ],
      "parameters": {
        "url": "={{ $json.sitemapUrl }}",
        "options": {}
      },
      "typeVersion": 4.2
    },
    {
      "id": "d3b86577-01fc-40f8-ab65-93ba420187b8",
      "name": "Convertir mapa del sitio a JSON",
      "type": "n8n-nodes-base.xml",
      "position": [
        80,
        -60
      ],
      "parameters": {
        "options": {
          "trim": true,
          "normalize": true,
          "mergeAttrs": true,
          "ignoreAttrs": true,
          "normalizeTags": true
        }
      },
      "typeVersion": 1
    },
    {
      "id": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
      "name": "Filtrar URLs",
      "type": "n8n-nodes-base.filter",
      "position": [
        440,
        -60
      ],
      "parameters": {
        "options": {},
        "conditions": {
          "options": {
            "version": 2,
            "leftValue": "",
            "caseSensitive": true,
            "typeValidation": "strict"
          },
          "combinator": "and",
          "conditions": [
            {
              "id": "0bf8e98c-b6c5-4129-852c-0d3e63f32f9f",
              "operator": {
                "type": "string",
                "operation": "endsWith"
              },
              "leftValue": "={{ $json.loc }}",
              "rightValue": ".pdf"
            }
          ]
        }
      },
      "typeVersion": 2.2
    },
    {
      "id": "1d3fed97-1e72-426c-a48d-1a9683f40c4c",
      "name": "Nota adhesiva1",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -300,
        -140
      ],
      "parameters": {
        "color": 6,
        "width": 150,
        "height": 240,
        "content": "**Set your sitemap.xml\nurl here.**"
      },
      "typeVersion": 1
    },
    {
      "id": "521ec74d-6707-47fd-992d-eecebed415ab",
      "name": "Nota adhesiva2",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        420,
        -140
      ],
      "parameters": {
        "color": 6,
        "width": 150,
        "height": 240,
        "content": "**Create your filter here.**"
      },
      "typeVersion": 1
    },
    {
      "id": "07e6c3de-cc72-490d-b614-67034ce04bfb",
      "name": "Nota adhesiva3",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -140,
        -180
      ],
      "parameters": {
        "color": 7,
        "width": 540,
        "height": 300,
        "content": "## Fetch and process the sitemap.xml file\nThis part fetches and process the sitemap.xml file from XML data to JSON that we can work with."
      },
      "typeVersion": 1
    },
    {
      "id": "abf5f02d-d2a0-43f1-9a1f-386cc4f9861b",
      "name": "Nota adhesiva",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -780,
        -220
      ],
      "parameters": {
        "width": 280,
        "height": 420,
        "content": "## Sitemap.xml reader\nThis workflow reads an sitemap.xml and filters out the entries you want.\n\nBy default only PDF documents are returned at the end of the workflow.\n\n**SETUP**\n- Edit the **Set sitemap URL** block and add the url to the sitemap you want to read.\n\n- Edit the **Filter URLs** to your needs."
      },
      "typeVersion": 1
    }
  ],
  "active": false,
  "pinData": {},
  "settings": {
    "executionOrder": "v1"
  },
  "versionId": "74793599-4c7d-4532-bbd5-a2ce4761fbc8",
  "connections": {
    "0d957deb-5830-4077-97e4-437dc7c0e527": {
      "main": [
        [
          {
            "node": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "7021088c-dfa1-4aae-b2e7-15b0ca10a750": {
      "main": [
        [
          {
            "node": "d3b86577-01fc-40f8-ab65-93ba420187b8",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "d4e5991b-62d9-45ca-962f-c1077f3bce19": {
      "main": [
        [
          {
            "node": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "d3b86577-01fc-40f8-ab65-93ba420187b8": {
      "main": [
        [
          {
            "node": "0d957deb-5830-4077-97e4-437dc7c0e527",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "38910330-5286-4f3f-b62e-9216acccd503": {
      "main": [
        [
          {
            "node": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}
Preguntas frecuentes

¿Cómo usar este flujo de trabajo?

Copie el código de configuración JSON de arriba, cree un nuevo flujo de trabajo en su instancia de n8n y seleccione "Importar desde JSON", pegue la configuración y luego modifique la configuración de credenciales según sea necesario.

¿En qué escenarios es adecuado este flujo de trabajo?

Intermedio - Ingeniería, Marketing

¿Es de pago?

Este flujo de trabajo es completamente gratuito, puede importarlo y usarlo directamente. Sin embargo, tenga en cuenta que los servicios de terceros utilizados en el flujo de trabajo (como la API de OpenAI) pueden requerir un pago por su cuenta.

Información del flujo de trabajo
Nivel de dificultad
Intermedio
Número de nodos10
Categoría2
Tipos de nodos7
Descripción de la dificultad

Adecuado para usuarios con experiencia intermedia, flujos de trabajo de complejidad media con 6-15 nodos

Autor
Audun

Audun

@xqus

Transforming complexity into simplicity.

Enlaces externos
Ver en n8n.io

Compartir este flujo de trabajo

Categorías

Categorías: 34