자동 웹 크롤러: 세분화된 구인/제품 모니터링 및 Telegram 알림
중급
이것은Market Research, AI Summarization분야의자동화 워크플로우로, 6개의 노드를 포함합니다.주로 If, Cron, Function, Telegram, HtmlExtract 등의 노드를 사용하며. 자동화网页爬虫:细分职位/제품모니터링与Telegram警报
사전 요구사항
- •Telegram Bot Token
- •대상 API의 인증 정보가 필요할 수 있음
워크플로우 미리보기
노드 연결 관계를 시각적으로 표시하며, 확대/축소 및 이동을 지원합니다
워크플로우 내보내기
다음 JSON 구성을 복사하여 n8n에 가져오면 이 워크플로우를 사용할 수 있습니다
{
"nodes": [
{
"name": "시간별 모니터 트리거",
"type": "n8n-nodes-base.cron",
"notes": {
"text": "### 1. Hourly Monitor Trigger\n\nThis `Cron` node will trigger the workflow automatically every **hour**.\n\n**To change the schedule:** Adjust the 'Mode' or set specific 'Hour' and 'Minute' values to match how often you want to check the website (e.g., every 4 hours, daily).",
"position": "right"
},
"position": [
240,
300
],
"parameters": {
"mode": "everyHour",
"options": {}
},
"typeVersion": 1,
"id": "--0"
},
{
"name": "웹페이지 콘텐츠 가져오기",
"type": "n8n-nodes-base.httpRequest",
"notes": {
"text": "### 2. Fetch Webpage Content\n\nThis `HTTP Request` node downloads the entire HTML content of the target webpage.\n\n**Setup:**\n1. **URL:** **IMPORTANT:** Change `https://www.n8n.io/blog/` to the exact URL of the job board, product page, or any webpage you want to monitor.\n2. **Response Format:** Ensure this is set to `string` (for HTML content).\n\n**Considerations:**\n* If the website requires login, you might need to add authentication headers or cookies (more advanced).\n* If the content loads dynamically with JavaScript after the initial page load, this method might not capture it. You'd need more advanced tools (like Puppeteer/Playwright in a `Code` node).",
"position": "right"
},
"position": [
460,
300
],
"parameters": {
"url": "https://www.n8n.io/blog/",
"options": {},
"responseFormat": "string"
},
"typeVersion": 3,
"id": "--1"
},
{
"name": "채용 공고/제품 정보 추출",
"type": "n8n-nodes-base.htmlExtract",
"notes": {
"text": "### 3. Extract Specific Data (`HTML Extract` - Key Node!)\n\nThis `HTML Extract` node is the core of the web scraping. It parses the HTML and pulls out specific data points based on CSS Selectors.\n\n**Setup (CRITICAL!):**\n1. **HTML:** This field is already set to `{{ $node[\"Fetch Webpage Content\"].json.data }}`, taking the HTML from the previous node.\n2. **Extract Operations:**\n * **Change or Add Operations:** You'll need to define exactly *what* to extract.\n * **Selector:** This is the most important part. You need to find the correct CSS selector for the data you want. \n * **How to find:** Open the target webpage in your browser (Chrome/Firefox). Right-click on the specific text/element (e.g., a job title, a product price) and choose 'Inspect' or 'Inspect Element'. In the developer tools panel, right-click on the highlighted HTML code, then select 'Copy' -> **'Copy selector'** or 'Copy XPath'. Paste this into the 'Selector' field.\n * **Attribute:** Usually `textContent` for visible text, or `href` for links, `src` for image URLs, etc.\n * **Property Name:** Give it a meaningful name (e.g., `JobTitle`, `JobLink`, `ProductName`, `StockStatus`).\n\n**Example (from n8n blog):**\n* `h3.BlogItem_title__d78Xb` for blog post titles (`textContent`)\n* `a.BlogItem_blogItem__a_H6E` for blog post links (`href`)\n\n**Test this node carefully!** Run the workflow up to this point and inspect its output to ensure it extracts what you expect.",
"position": "right"
},
"position": [
700,
300
],
"parameters": {
"html": "={{ $node[\"Fetch Webpage Content\"].json.data }}",
"extractOperations": [
{
"options": {},
"selector": "h3.BlogItem_title__d78Xb",
"attribute": "textContent",
"operation": "extract",
"propertyName": "JobTitle"
},
{
"options": {},
"selector": "a.BlogItem_blogItem__a_H6E",
"attribute": "href",
"operation": "extract",
"propertyName": "JobLink"
}
]
},
"typeVersion": 1,
"id": "--2"
},
{
"name": "항목 발견 시",
"type": "n8n-nodes-base.if",
"notes": {
"text": "### 4. If Items Found (Conditional Check)\n\nThis `If` node checks if the 'Extract Job/Product Info' node actually found any items. If it did, the workflow continues down the 'True' path to send a notification.\n\n**No configuration needed**; it checks if the array of extracted items is not empty.",
"position": "right"
},
"position": [
940,
300
],
"parameters": {
"conditions": [
{
"value1": "={{ $json.length }}",
"value2": "0",
"operation": "notEqual"
}
]
},
"typeVersion": 1,
"id": "--3"
},
{
"name": "알림 메시지 형식 지정",
"type": "n8n-nodes-base.function",
"notes": {
"text": "### 5. Format Notification Message\n\nThis `Function` node takes the extracted data and formats it into a human-readable message for your Telegram alert.\n\n**Customization:**\n* **Adjust `item.json.JobTitle`, `item.json.JobLink`, etc.:** Make sure these match the 'Property Name' you defined in the 'Extract Job/Product Info' node.\n* You can add more details or change the formatting here.\n\n**No configuration needed if your property names match the example.**",
"position": "right"
},
"position": [
1180,
220
],
"parameters": {
"options": {},
"function": "let summary = \"\";\n\nif (items.length > 0) {\n summary = `**Found ${items.length} new/updated items!**\\n\\n`;\n for (const item of items) {\n // Assuming you extracted 'JobTitle' and 'JobLink' from HTML Extract\n const title = item.json.JobTitle || item.json.ProductName || 'N/A';\n const link = item.json.JobLink || 'No link';\n const otherInfo = item.json.StockStatus ? ` (Status: ${item.json.StockStatus})` : '';\n summary += `* **${title}**${otherInfo}\\n Link: ${link}\\n\\n`;\n }\n} else {\n summary = \"No new items found during this check.\";\n}\n\nreturn [{ json: { notificationMessage: summary } }];"
},
"typeVersion": 1,
"id": "--4"
},
{
"name": "Send Telegram Alert",
"type": "n8n-nodes-base.telegram",
"notes": {
"text": "### 6. Send Telegram Alert\n\nThis `Telegram` node sends the formatted notification message to your Telegram chat.\n\n**Setup:**\n1. **Telegram Credential:** Click 'Credentials' and select 'New Credential'. Choose 'Telegram API'.\n * You'll need a **Bot Token** from BotFather on Telegram (search for '@BotFather' in Telegram, type `/newbot`, follow instructions).\n2. **Chat ID:** **IMPORTANT: You need your specific Telegram Chat ID.**\n * **How to get it:** Send a message to your new bot. Then, open this URL in your browser: `https://api.telegram.org/bot<YOUR_BOT_TOKEN>/getUpdates` (replace `<YOUR_BOT_TOKEN>` with your bot's token). Look for the `\"chat\": {\"id\": ...}` field; that's your Chat ID.\n * Paste this ID into the 'Chat ID' field.\n3. **Text:** This pulls the message from the 'Format Notification Message' node.\n4. **Parse Mode:** Set to `Markdown` for bolding (`**`) and links.\n\n**Test this node by running the workflow (from the 'Hourly Monitor Trigger') and checking your Telegram!**",
"position": "right"
},
"position": [
1420,
220
],
"parameters": {
"text": "={{ $json.notificationMessage }}",
"chatId": "YOUR_TELEGRAM_CHAT_ID",
"options": {},
"parseMode": "Markdown"
},
"credentials": {
"telegramApi": {
"id": "YOUR_TELEGRAM_CREDENTIAL_ID",
"resolve": false
}
},
"typeVersion": 1,
"id": "Send-Telegram-Alert-5"
}
],
"pinData": {},
"version": 1,
"connections": {
"--3": {
"main": [
[
{
"node": "--4",
"type": "main"
}
],
[]
]
},
"--1": {
"main": [
[
{
"node": "--2",
"type": "main"
}
]
]
},
"--0": {
"main": [
[
{
"node": "--1",
"type": "main"
}
]
]
},
"--2": {
"main": [
[
{
"node": "--3",
"type": "main"
}
]
]
},
"--4": {
"main": [
[
{
"node": "Send-Telegram-Alert-5",
"type": "main"
}
]
]
}
}
}자주 묻는 질문
이 워크플로우를 어떻게 사용하나요?
위의 JSON 구성 코드를 복사하여 n8n 인스턴스에서 새 워크플로우를 생성하고 "JSON에서 가져오기"를 선택한 후, 구성을 붙여넣고 필요에 따라 인증 설정을 수정하세요.
이 워크플로우는 어떤 시나리오에 적합한가요?
중급 - 시장 조사, AI 요약
유료인가요?
이 워크플로우는 완전히 무료이며 직접 가져와 사용할 수 있습니다. 다만, 워크플로우에서 사용하는 타사 서비스(예: OpenAI API)는 사용자 직접 비용을 지불해야 할 수 있습니다.
관련 워크플로우 추천
자동화된 멀티플랫폼 게임 할인 추적
Deku Deals 및 Gmail 알림을 사용한 멀티 플랫폼 게임 할인 자동 추적
If
Cron
Gmail
+
If
Cron
Gmail
11 노드Piotr Sobolewski
개인 생산성
기업 온라인 이미지 모니터링기
AI 감정 분석 및 다중 플랫폼 추적을 사용한 일일 기업 온라인 이미지 모니터링
Set
Cron
Gmail
+
Set
Cron
Gmail
17 노드Piotr Sobolewski
시장 조사
아마존 가격 자동 추적 및 Telegram 알림
Google Gemini를 사용하여 Amazon 가격 자동 추적 및 Telegram 알림 전송
If
Set
Code
+
If
Set
Code
22 노드Issam AGGOUR
시장 조사
OpenAI와 Gmail을 사용하는 매일 긍정적인 뉴스 요약
OpenAI와 Gmail을 사용한 매일 긍정적인 뉴스 요약
If
Cron
Gmail
+
If
Cron
Gmail
9 노드Piotr Sobolewski
개인 생산성
Gmail과 GPT 요약을 사용한 일일 이메일 요약 자동 발송
Gmail 및 GPT 요약을 사용한 일일 이메일 다이제스트 자동 전송, 매일 오후 발송
Cron
Gmail
Open Ai
+
Cron
Gmail
Open Ai
6 노드Piotr Sobolewski
개인 생산성
자동화된 매일 지능형 Firecrawl 크롤러
매일 웹 사이트 데이터 추출: Firecrawl, Telegram 알림
If
Set
Wait
+
If
Set
Wait
14 노드Automate With Marc
시장 조사
워크플로우 정보
난이도
중급
노드 수6
카테고리2
노드 유형6
저자
Piotr Sobolewski
@piotrsobolewskiAI PhD with 7 years experience as a game dev CEO, currently teaching, helping others and building something new.
외부 링크
n8n.io에서 보기 →
이 워크플로우 공유