检测 Node Express 中的社交机器人

2024-03-22

我正在尝试检测以下两个选项之一：

特定的机器人列表 (FacebookExternalHit|LinkedInBot|TwitterBot|Baiduspider)
任何不支持 Crawable Ajax 规范的机器人

我见过类似的问题（如何识别 Facebook 用户代理 https://stackoverflow.com/questions/8626812/how-to-recognize-facebook-user-agent）但没有解释如何在 Node 和 Express 中执行此操作。

我需要以如下格式执行此操作：

app.get("*", function(req, res){ 
  if (is one of the bots) //serve snapshot
  if (is not one of the bots) res.sendFile(__dirname + "/public/index.html");
});

你可以检查标题User-Agent在请求对象中并测试不同机器人的值，

截至目前，Facebook 表示他们拥有三种类型的 User-Agent 标头值（检查Facebook 爬虫 https://developers.facebook.com/docs/sharing/webmasters/crawler），twitter 还有一个带有版本的用户代理（检查Twitter URL 抓取和缓存 https://dev.twitter.com/cards/getting-started#crawling），下面的示例应该涵盖这两个机器人。

Node

var http = require('http');
var server = http.createServer(function(req, res){

    var userAgent = req.headers['user-agent'];
    if (userAgent.startsWith('facebookexternalhit/1.1') ||
       userAgent === 'Facebot' ||
       userAgent.startsWith('Twitterbot') {

        /* Do something for the bot */
    }
});

server.listen(8080);

Express

var http = require('http');
var express = require('express');
var app = express();

app.get('/', function(req, res){

    var userAgent = req.headers['user-agent'];
    if (userAgent.startsWith('facebookexternalhit/1.1') ||
       userAgent === 'Facebot' ||
       userAgent.startsWith('Twitterbot') {

        /* Do something for the bot */
    }
});

app.listen(8080);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

检测 Node Express 中的社交机器人的相关文章

如何检查变量是否是生成器函数？（例如函数*产量）[重复]

这个问题在这里已经有答案了检查函数是否是生成器的可靠方法是什么例如 let fn function yield 100 if fn instanceof for let value in fn 我能想到的唯一方法是fn toString
我无法在我的反应本机上使用加载的应用程序。它不会正常工作

我不断收到此错误错误截图 https i stack imgur com 88KPa png 这是我用来导入自定义谷歌字体的代码 import React useState from react import Home from scre
在 Javascript 中获取文本框的值

我有这个html代码 table border cellpadding 3 cellspacing 0 tbody tr td Song td td td tr tbody table
HTML：您可以隐藏/忽略浏览器查找中的文本元素 (CTRL+F)

我有一个具有相当复杂的 UI 的 Web 应用程序并且屏幕的一部分保留用于内容如果可能的话我想这样做以便当用户使用浏览器的内置文本搜索 CTRL F 时 UI 中的任何文本都将被忽略并且仅搜索实际内容这可行吗 CSS 和 Jav
如果文本过滤器在 ng-repeat 中没有返回结果，则显示消息

假设我们有一个带有文本过滤器的 ng repeat
更改模板标签 <# {% {{ 等后，John Resig 的微模板出现语法错误

我在使用 John Resig 的 Micro 模板时遇到了一些麻烦谁能帮我解释为什么它不起作用这是模板以及发动机的改装部分 str replace r t n g split join t replace gt t g 1 r re
ES6 生成器——它们真的是 async/await 的替代品吗？

评论区的帖子之一this http blogs msdn com b typescript archive 2014 10 22 typescript and the road to 2 0 aspx打字稿博客文章说如果我必须等到 2 0
从 json 文件加入时添加角色 (autorole)

我对 JS 相当陌生为了学习我决定为 Discord 制作一个机器人我学到了很多并且正在继续学习我有一个 autorole 的想法我知道传统的做法 bot on guildMemberAdd member gt var role
使用 jQuery animate 时，有没有办法隐藏 webkit 浏览器中显示的工件？

我正在使用 jQuery animate 在网页上的项目中滑动由于某种原因只有在 webkit 浏览器中元素动画的空间中才会出现伪影痕迹有没有办法阻止或隐藏这种情况一旦您加载此处的页面它们就会出现在轮播上 http www my
如何使用javascript通过类名更改html元素的值

这是我用来更改 html 元素值的代码 a class classname href Vtech com This text to be chnage a 如何在页面加载瞬间更改此文本看来你需要添加DOMContentLoaded或者把你
查找 JavaScript 中函数参数的数量[重复]

这个问题在这里已经有答案了可能的重复获取函数的元数 https stackoverflow com questions 4848149 get a functions arity 假设我有 function a x function b
使用XMLHttpRequest自动网页刷新内存泄漏

问候我一直在为一些使用 8 位微控制器的硬件开发网络界面该网页使用 HTML javascript JSON 和 XHR XMLHttpRequest 进行通信我想做的是创建一个页面使用 setInterval 使用控制器中的新值每
Javascript 警报/消息框中的欧元符号或其他实体

有谁知道我如何在 javascript 警报窗口中显示欧元或其他 html 实体 alert u20AC HTML 实体字符查找 http leftlogic com lounge articles entity lookup
图像未显示在从 HTML 创建的 PDF 上

我想动态创建 PDF 这意味着我将从 Google Drive 获取文件然后将它们放入 HTML 代码中并尝试从中创建 PDF 一切工作正常除了图像没有显示我现在正在做的是从 HTML 字符串创建 HtmlOutput 获取该 H
更改哈希值而不触发 hashchange 事件

我使用哈希来动态加载内容为了使后退按钮正常工作我正在捕获哈希更改然而有时我需要更改哈希值而不触发哈希更改函数例如当页面重定向到服务器端时我需要在内容返回后更新哈希值我想出的最佳解决方案是取消绑定 hashchange 事件
如何使用 Typescript 设置 Material-UI for React？

我在将 Material UI 添加到我的 React 项目中时遇到了一些问题该项目是用 Typescript 编程的根据教程我首先添加react tab event plugin import injectTapEventPlugi
如何在画布中旋转图表同时保持数字垂直？

我正在尝试围绕其中心旋转画布中的图表同时保持字母直立我正在尝试使用 ctx rotate 但它使用画布的左侧作为中心来旋转整个图表以下链接提供了视觉效果我希望它看起来像绿色而不是红色就像我的代码当前所做的那样视觉解释 http
如何始终将焦点保持在画布上？

我一直在这个论坛寻找解决方案但尚未找到无论我在页面上的哪个位置单击我都需要始终将焦点放在画布元素上我有几个按钮在每个 onclick 事件中我写 document getElementById canvas focus 这确实有效
仅使用 javascript 获取网站的正文元素

我想检索以下网站的正文内容http sports espn go com nhl bottomline scores nhl s left1 http sports espn go com nhl bottomline scores nhl
在哪里放置资源特定逻辑

您能帮我考虑在 AngularJS 中将资源服务特定的业务逻辑放置在哪里吗我觉得在我的资源上创建一些类似模型的抽象应该很棒但我不确定如何做 API调用 gt GET customers 1 lt first name John la

随机推荐

数据库传输/服务器设置期间波兰字符集出现编码错误

我正在尝试将我的一个数据库从一台主机 home pl 传输到另一台主机我新设置的服务器我试图传输的脚本是wordpress 不幸的是无论使用哪种方法我都在努力解决编码问题新主机配置在我的新服务器中我在 my cnf 中使用以下
从 java 加载库时出现“未定义符号：__cxa_pure_virtual”错误

我有一个 Java 程序需要加载本机代码库通过 JNI 和 SWIG 但是当我尝试运行它时出现如下错误 Exception in thread main java lang UnsatisfiedLinkError usr local
使用 django-import-export 进行 django 迁移中的外键

我在用着django 导入导出 https github com bmihelac django import export在迁移文件中加载 csv 文件据我所知这是 Django 1 7 加载初始数据的当前最佳实践这对于第一个文件效
如何使用 Git 作为内容分发网络

Git Internal 一书提到在 p50 上使用 git 作为点对点内容分发网络但没有提供太多细节特别是如何拥有多个跟踪不同文件的分支例子工作目录 a00 exe a01 exe b00 exe c00 exe c01 exe
倾斜一个角并向对角添加边框半径

如何使用 CSS 重现这个形状如何移动右上角 span Shift top right corner span 类似这样的东西但仍然很难掌握我会考虑使用图像 span border 2px dashed blue border rad
我收到 TypeError: 'int' object is unsubscriptable

我从我的代码中收到一条错误消息上面写着TypeError int object is unsubscriptable 经过一番研究我明白了它的意思但我不明白为什么会出现问题我将问题范围缩小到这段代码 def calcNextPos
SVG Circle 元素在比例变换时跳跃

下面是使用 D3 绘制一个圆并在鼠标悬停时对其进行缩放的代码它做了它应该做的事情但也将 cricle 带到其他地方这意味着圆圈缩放并跳转翻译到其他位置我无法理解其原因 this node this chartLayer appe
直接从浏览器上传字符串到s3，无需本地文件

我正在使用 javascript node js 和 aws sdk 有很多关于使用签名 URL 直接将现有文件上传到 S3 的示例但现在我尝试上传字符串并在 S3 中创建文件而不需要任何本地保存的文件请问有什么建议吗请按照此处的示
关于 ASP.Net 中的弹出窗口

我有一个gridview其中包含一个details button作为最后一栏 My aspx
Wildfly 17 服务器提供的 Maven 依赖项

我刚刚开始使用 Wildfly 服务器版本 17 并且我一直在研究我应该在 pom 文件中提供的依赖项我在文档中没有找到任何显示所提供的依赖项及其正确版本的内容作为一个例子这是我想要的
C# 泛型委托类型推断

为什么 C 编译器无法在指定示例中将 T 推断为 int void Main int a 0 Parse 1 x gt a x Compiler error Cannot convert expression type int to ret
C/C++ 中两个 INT_MAX 数字的乘积不正确

就我而言两个 INT MAX 数字的乘积是296447233 这是不正确的 long long int product 0 product 2137483647 2137483647 printf product lli n produc
将换行符附加到 NSString

我有这个 if soapResults nil soapResults soapResults stringByAppendingString n 但我收到警告构建时来自不同 Objective C 类型的分配当我在设备上运行它时我得
C++ 反序列化通过 UDP 从 C# 应用程序发送的对象

我有一个申请c 它连接到另一个应用程序编写为c 通过UDP 我更喜欢高性能的解决方案因为我希望测量事件客户端某些处理服务器端和客户端处理完成的响应之间的时间本质上是往返延迟我有一个 C 对象例如 public class Pa
C# - 显示最大值、最小值和平均值

我是 C 新手我一直在致力于这个计划并进行研究但一无所获目标是让用户输入数字多少由用户决定当他们输入0时它将停止程序并显示输入的最小数字输入的最大数字以及输入的所有数字的平均值我没有收到任何错误而且我收到了如果有人可以请
Java中删除字符串中的特定字符

例如给定一个字符串Battle of the Vowels Hawaii vs Gronzy当我们指定要删除的字符为aeiou 该函数应将字符串转换为Bttl f th V wls Hw vs Grzny 在书上找到这个问题编程面试曝光
surfaceDestroyed()何时发生

我不知道什么时候surfaceDestroyed 发生我试图让我的线程停止运行surfaceDestroyed 方法 SurfaceView 但似乎我的表面从未真正被破坏有人可以告诉我什么时候发生这种情况吗或者说如何触发每当您单击
Angular模板绑定，多次调用回调函数

我尝试实现一个包含结构化数据的网格组件columns definition和它的data array 有一个callback每列定义中的函数用于自定义显示该列的值每一个里面callback 它调用了 console log 来显示回调函
NSArray：为什么发送 SIGABRT 而不是“索引越界”类型的错误？

好的所以我有这个非常奇怪的SIGABRT我正在开发的一个复杂的 Objective C iOS 程序上出现了错误经过一天的跟踪我找到了罪魁祸首假设我们有以下代码 NSArray a NSArray arrayWithObjects
检测 Node Express 中的社交机器人

我正在尝试检测以下两个选项之一特定的机器人列表 FacebookExternalHit LinkedInBot TwitterBot Baiduspider 任何不支持 Crawable Ajax 规范的机器人我见过类似的问题如何识别

检测 Node Express 中的社交机器人

检测 Node Express 中的社交机器人 的相关文章

随机推荐

热门标签

检测 Node Express 中的社交机器人的相关文章