Recherche académique sur cinq bases de données, avec des vecteurs PDF et plusieurs exportations

Name: Recherche académique sur cinq bases de données, avec des vecteurs PDF et plusieurs exportations
Rating: 4.5 (10 reviews)
Author: PDF Vector

Intermédiaire

Ceci est unAI RAG, Multimodal AIworkflow d'automatisation du domainecontenant 9 nœuds.Utilise principalement des nœuds comme Set, Code, PdfVector, WriteBinaryFile. Recherche académique sur cinq bases de données avec vecteurs PDF et export multiple

Prérequis

•Aucun prérequis spécial, prêt à l'emploi après importation

Nœuds utilisés (9)

Catégorie

RAG IA

IA Multimodale

Aperçu du workflow

Visualisation des connexions entre les nœuds, avec support du zoom et du déplacement

Définir les paramètres de recherche

PDF Vector - Recherche multi-bases

Déduplication des résultats

Classement par pertinence

Générer BibTeX

Exporter le fichier BibTeX

Export JSON

Export CSV

React Flow

Exporter le workflow

Copiez la configuration JSON suivante dans n8n pour importer et utiliser ce workflow

{
  "meta": {
    "instanceId": "placeholder"
  },
  "nodes": [
    {
      "id": "search-info",
      "name": "Configuration de recherche",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        250,
        150
      ],
      "parameters": {
        "content": "## Multi-Database Search\n\nSearches:\n- PubMed\n- ArXiv\n- Google Scholar\n- Semantic Scholar\n- ERIC\n\nDeduplicates and ranks results"
      },
      "typeVersion": 1
    },
    {
      "id": "search-params",
      "name": "Définir les paramètres de recherche",
      "type": "n8n-nodes-base.set",
      "position": [
        450,
        300
      ],
      "parameters": {
        "values": {
          "number": [
            {
              "name": "yearFrom",
              "value": 2020
            },
            {
              "name": "resultsPerSource",
              "value": 25
            }
          ],
          "string": [
            {
              "name": "searchQuery",
              "value": "machine learning healthcare applications"
            }
          ]
        }
      },
      "typeVersion": 1
    },
    {
      "id": "pdfvector-search",
      "name": "PDF Vector - Recherche multi-bases",
      "type": "n8n-nodes-pdfvector.pdfVector",
      "position": [
        650,
        300
      ],
      "parameters": {
        "limit": "={{ $json.resultsPerSource }}",
        "query": "={{ $json.searchQuery }}",
        "fields": [
          "title",
          "authors",
          "year",
          "doi",
          "abstract",
          "totalCitations",
          "pdfUrl",
          "provider"
        ],
        "resource": "academic",
        "yearFrom": "={{ $json.yearFrom }}",
        "operation": "search",
        "providers": [
          "pubmed",
          "semantic_scholar",
          "arxiv",
          "google_scholar",
          "eric"
        ]
      },
      "typeVersion": 1
    },
    {
      "id": "deduplicate",
      "name": "Déduplication des résultats",
      "type": "n8n-nodes-base.code",
      "position": [
        850,
        300
      ],
      "parameters": {
        "functionCode": "// Deduplicate papers based on DOI and title similarity\nconst papers = $json;\nconst unique = new Map();\n\npapers.forEach(paper => {\n  // First check DOI\n  if (paper.doi && !unique.has(paper.doi)) {\n    unique.set(paper.doi, paper);\n  } else if (!paper.doi) {\n    // For papers without DOI, check title similarity\n    const normalizedTitle = paper.title.toLowerCase().replace(/[^a-z0-9]/g, '');\n    let isDuplicate = false;\n    \n    for (const [key, existingPaper] of unique) {\n      const existingTitle = existingPaper.title.toLowerCase().replace(/[^a-z0-9]/g, '');\n      if (normalizedTitle === existingTitle) {\n        isDuplicate = true;\n        // Merge provider info\n        if (!existingPaper.providers) existingPaper.providers = [existingPaper.provider];\n        existingPaper.providers.push(paper.provider);\n        break;\n      }\n    }\n    \n    if (!isDuplicate) {\n      unique.set(normalizedTitle, paper);\n    }\n  }\n});\n\nreturn Array.from(unique.values());"
      },
      "typeVersion": 1
    },
    {
      "id": "rank-results",
      "name": "Classement par pertinence",
      "type": "n8n-nodes-base.code",
      "position": [
        1050,
        300
      ],
      "parameters": {
        "functionCode": "// Calculate relevance score\nconst papers = $json;\nconst query = $node['Set Search Parameters'].json.searchQuery.toLowerCase();\n\nconst scored = papers.map(paper => {\n  let score = 0;\n  \n  // Title relevance\n  const titleWords = paper.title.toLowerCase().split(' ');\n  const queryWords = query.split(' ');\n  queryWords.forEach(word => {\n    if (titleWords.includes(word)) score += 10;\n  });\n  \n  // Citation impact\n  score += Math.log(paper.totalCitations + 1) * 5;\n  \n  // Recency bonus\n  const yearDiff = new Date().getFullYear() - paper.year;\n  score += Math.max(0, 10 - yearDiff);\n  \n  // Full text availability\n  if (paper.pdfUrl) score += 15;\n  \n  return { ...paper, relevanceScore: score };\n});\n\n// Sort by relevance\nreturn scored.sort((a, b) => b.relevanceScore - a.relevanceScore);"
      },
      "typeVersion": 1
    },
    {
      "id": "generate-bibtex",
      "name": "Générer BibTeX",
      "type": "n8n-nodes-base.code",
      "position": [
        1250,
        250
      ],
      "parameters": {
        "functionCode": "// Generate BibTeX entries\nconst papers = $json;\n\nconst bibtex = papers.map((paper, index) => {\n  const key = paper.doi ? paper.doi.replace(/[^a-zA-Z0-9]/g, '') : `paper${index}`;\n  const authors = paper.authors.join(' and ');\n  \n  return `@article{${key},\n  title={${paper.title}},\n  author={${authors}},\n  year={${paper.year}},\n  doi={${paper.doi || ''}},\n  abstract={${paper.abstract || ''}}\n}`;\n}).join('\\n\\n');\n\nreturn { bibtex, papers };"
      },
      "typeVersion": 1
    },
    {
      "id": "export-bibtex",
      "name": "Exporter le fichier BibTeX",
      "type": "n8n-nodes-base.writeBinaryFile",
      "position": [
        1450,
        250
      ],
      "parameters": {
        "fileName": "search_results_{{ $now.format('yyyy-MM-dd') }}.bib",
        "fileContent": "={{ $json.bibtex }}"
      },
      "typeVersion": 1
    },
    {
      "id": "export-json",
      "name": "Export JSON",
      "type": "n8n-nodes-base.writeBinaryFile",
      "position": [
        1450,
        350
      ],
      "parameters": {
        "fileName": "search_results_{{ $now.format('yyyy-MM-dd') }}.json",
        "fileContent": "={{ JSON.stringify($json.papers, null, 2) }}"
      },
      "typeVersion": 1
    },
    {
      "id": "export-csv",
      "name": "Export CSV",
      "type": "n8n-nodes-base.writeBinaryFile",
      "position": [
        1450,
        450
      ],
      "parameters": {
        "fileName": "search_results_{{ $now.format('yyyy-MM-dd') }}.csv",
        "fileContent": "={{ $json.papers.map(p => [p.title, p.authors.join(';'), p.year, p.doi, p.totalCitations, p.pdfUrl].join(',\t')).join('\\n') }}"
      },
      "typeVersion": 1
    }
  ],
  "connections": {
    "generate-bibtex": {
      "main": [
        [
          {
            "node": "export-bibtex",
            "type": "main",
            "index": 0
          },
          {
            "node": "export-json",
            "type": "main",
            "index": 0
          },
          {
            "node": "export-csv",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "rank-results": {
      "main": [
        [
          {
            "node": "generate-bibtex",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "deduplicate": {
      "main": [
        [
          {
            "node": "rank-results",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "search-params": {
      "main": [
        [
          {
            "node": "pdfvector-search",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "pdfvector-search": {
      "main": [
        [
          {
            "node": "deduplicate",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}

Foire aux questions

Comment utiliser ce workflow ?

Copiez le code de configuration JSON ci-dessus, créez un nouveau workflow dans votre instance n8n et sélectionnez "Importer depuis le JSON", collez la configuration et modifiez les paramètres d'authentification selon vos besoins.

Dans quelles scénarios ce workflow est-il adapté ?

Intermédiaire - RAG IA, IA Multimodale

Est-ce payant ?

Ce workflow est entièrement gratuit et peut être utilisé directement. Veuillez noter que les services tiers utilisés dans le workflow (comme l'API OpenAI) peuvent nécessiter un paiement de votre part.

Workflows recommandés

Revue automatique de littérature académique avec GPT-4 et recherche multi-base de données

Utiliser GPT-4 et la recherche multi-base de données pour automatiser la synthèse de la littérature académique

Extraction de documents

Construction d'un graphe de connaissances académique avec des vecteurs PDF, GPT-4 et Neo4j

Construire un graphe de connaissances académique à partir d'articles de recherche avec PDF vector, GPT-4 et Neo4j

Construction d'une API de réponse aux questions de documents avec des vecteurs PDF et des Webhooks

Construire une API de questions-réponses sur documents avec PDF vector et Webhooks

Surveillance automatisée des publications académiques, avec des vecteurs PDF, GPT-3.5 et des alertes Slack

Automatisation de la surveillance d'articles académiques, avec des vecteurs PDF, GPT-3.5 et des notifications Slack

Productivité personnelle

Conversion de masse de PDF en Markdown (Google Drive et analyse par LLM)

Conversion de masse de PDF en Markdown avec Google Drive et une analyse pilotée par LLM

Extraction de données à partir de documents via GPT-4, PDFVector et export PostgreSQL

Exporter les données extraites de documents avec GPT-4, PDFVector et PostgreSQL

Extraction de documents

Informations sur le workflow

Niveau de difficulté

Intermédiaire

Nombre de nœuds9

Catégorie2

Types de nœuds5

Description de la difficulté

Adapté aux utilisateurs expérimentés, avec des workflows de complexité moyenne contenant 6-15 nœuds

Auteur

PDF Vector

@pdfvector

A fully featured PDF APIs for developers - Parse any PDF or Word document, extract structured data, and access millions of academic papers - all through simple APIs.

Liens externes

Voir sur n8n.io →

Partager ce workflow

Recherche académique sur cinq bases de données, avec des vecteurs PDF et plusieurs exportations

Nœuds utilisés (9)

Catégorie

Comment utiliser ce workflow ?

Dans quelles scénarios ce workflow est-il adapté ?

Est-ce payant ?

Workflows recommandés

Catégories