使用 MySQL 检测垃圾邮件发送者

2024-05-02

我发现越来越多的用户在我的网站上注册，只是为了向其他用户发送重复的垃圾邮件消息。我添加了一些服务器端代码来使用以下 mysql 查询检测重复消息：

  SELECT count(content) as msgs_sent 
    FROM messages 
   WHERE sender_id = '.$sender_id.' 
GROUP BY content having count(content) > 10

该查询运行良好，但现在他们通过更改消息中的一些字符来解决这个问题。有没有办法用 MySQL 来检测这一点，或者我是否需要查看从 MySQL 返回的每个分组，然后使用 PHP 来确定相似性的百分比？

有什么想法或建议吗？

全文匹配

你可以考虑实施类似的东西MATCH例子here http://dev.mysql.com/doc/refman/5.0/en/fulltext-natural-language.html:

mysql> SELECT id, body, MATCH (title,body) AGAINST
    -> ('Security implications of running MySQL as root') AS score
    -> FROM articles WHERE MATCH (title,body) AGAINST
    -> ('Security implications of running MySQL as root');
+----+-------------------------------------+-----------------+
| id | body                                | score           |
+----+-------------------------------------+-----------------+
|  4 | 1. Never run mysqld as root. 2. ... | 1.5219271183014 |
|  6 | When configured properly, MySQL ... | 1.3114095926285 |
+----+-------------------------------------+-----------------+
2 rows in set (0.00 sec)

因此，对于您的示例，也许：

SELECT id, MATCH (content) AGAINST ('your string') AS score
FROM messages 
WHERE MATCH (content) AGAINST ('your string')
    AND score > 1;

请注意，要使用这些功能，您的content列需要是FULLTEXT index.

What is score在这个例子中？

It is a relevance value。它是通过以下描述的过程计算的：

集合和查询中的每个正确单词都经过加权根据其在收集或查询中的重要性。因此，出现在许多文档中的单词具有较低的重量（甚至可能为零重量），因为它具有较低的该特定集合中的语义价值。相反，如果这个词很罕见，它的权重更高。单词的权重是组合起来计算行的相关性。

来自文档 http://dev.mysql.com/doc/refman/5.0/en/fulltext-natural-language.html page.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

php

mysql

spam

使用 MySQL 检测垃圾邮件发送者的相关文章

INNER JOIN 后从多个表获取最大日期

我有以下两个表 table 1 ID HOTEL ID NAME 1 100 xyz 2 101 pqr 3 102 abc table 2 ID BOOKING ID DEPARTURE DATE AMOUNT 1 1 2013 04 1
无法在 Laravel 8 中运行迁移：SQLSTATE[HY000] [2002] php_network_getaddresses: getaddrinfo failed: 名称或服务未知 [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我不明白为什么我的迁移在全新安装 Laravel 8 时失败这就是我得到的结果 Illuminate Database
php动态创建子域的问题

你好我通过以下代码在 php 中创建子域 function subd host port ownername passw request sock fsockopen localhost 2082 if sock print Socket
使用 php ping 网站

我想创建一个 php 脚本它将 ping 一个域并列出响应时间以及请求的总大小这将用于监控网站网络我尝试过curl 这是我到目前为止的代码 function curlTest2 url clearstatcache return if
使用 php 脚本的电子邮件管道

你好我想将所有电子邮件到达我的收件箱转发到 php 脚本并检索电子邮件内容并将其保存在文件中因此我正确地添加了具有管道路径的电子邮件转发器转发地址电子邮件受保护 cdn cgi l email protection 管道到程序
php 检查文件是否存在于外部域中（从子域访问）

我有一个网站http www reelfilmlocations co uk http www reelfilmlocations co uk 上述网站有一个管理区域其中上传图像并在 uploads images 目录的子文件夹中创建不同
在 laravel 中禁用特定路由的 csrf

我有一个支付系统数据被提交到第三方网站然后被拉回当数据返回时它会到达特定的 url 比如 ok 路由 REQUEST transaction 但由于 Laravel 中间件我遇到了令牌不匹配的情况第三方支付API无法生成token
使用 Mock 对 Laravel 5 Mail 进行单元测试

有没有办法在 Laravel 5 中测试 Mail 尝试了我在互联网上看到的唯一合法的模拟示例但它似乎只适用于 Laravel 4 下面的当前代码 mock Mockery mock Swift Mailer this gt app ma
为什么我的 PHP 脚本无法对其创建的文件进行 chmod？

我有一个 php 创建一个需要可执行的文件它是一个需要由系统运行的批处理文件由于某种原因即使该文件归 apache 所有并且 php 作为 apache 运行并且创建了该文件该脚本还是在 chmod 行处终止我需要进行哪些不同配
laravel 5.3 新的 Auth::routes()

最近开始使用laravel 5 3写博客但是运行后出现一个问题php artisan make auth 当我运行这个时它会在我的web php 这是其中的代码 Auth routes Route get home HomeContro
AFNetworking 上传图片

我看过一些例子但我认为我的问题可能出在 PHP 中我正在尝试使用 AFNetworking 将图像从 iPhone 上传到服务器这是我的 obj c 代码 IBAction uploadButtonClicked id sender
数据库级别的别名列名 [MySQL]

别名可能是错误的词因为它是在将列表名称作为查询中的其他名称引用的上下文中使用的我感兴趣的是是否有一种方法可以在数据库中为列指定两个名称如果我要打印这样的表格它看起来会是这样的 mysql gt SELECT FROM User
管理面板的 htaccess 重写规则

我的网络应用程序中有这样的 url 模式 www mysitename com foldername controller method 所有请求的页面首先被重定向到根文件夹上的index php 然后处理请求的页面但每当我进入管理面板
检查一个类是否是另一个类的子类

我想在不创建实例的情况下检查一个类是否是另一个类的子类我有一个类它接收类名作为参数作为验证过程的一部分我想检查它是否属于特定的类系列以防止安全问题等有什么好的方法可以做到这一点吗 is subclass of http php
Oracle Blob 在 PHP 页面中作为 img src

我有一个网站当前使用文件服务器上的图像这些图像显示在页面上用户可以根据需要拖放每个图像这是使用 jQuery 完成的图像包含在列表中每张图片都非常标准 img src network path image png height 8
Microsoft VS Code：当我尝试启动程序时，出现错误“spawn php ENOENT”

我正在尝试在 Microsoft VS Code 上运行 PHP 代码当我单击启动时唯一发生的事情是调试控制台中出现错误生成 php ENOENT 为了解决这个问题我将 XDebug 的 dll 文件放入 ext 文件夹中我将 p
shell_exec 的输出被截断为 100 个字符

当在 shell 中运行以下命令时 curl F file filename http 192 168 0 1 产生以下输出 Accuracy 0 0 1 classification Accuracy 0 0 1 classificati
为什么 LinkedIn v2 Share API 在任何 v2/shares 端点上给出权限不足的错误？

当我调用任何 v2 LinkedIn 共享 API 端点时例如https api linkedin com v2 socialActions https api linkedin com v2 socialActions share UR
Monolog，如何将 PHP 数组记录到控制台？

我正在使用浏览器处理程序将消息记录到 JS 控制台 require once vendor autoload php use Monolog Logger use Monolog Handler BrowserConsoleHandler
使用 PHP 将 SVG 图像转换为 PNG

我正在开发一个网络项目该项目涉及动态生成的美国地图根据一组数据为不同的州着色这个 SVG 文件为我提供了一张很好的美国空白地图并且很容易更改每个州的颜色困难在于 IE 浏览器不支持 SVG 因此为了让我使用 svg 提供的便捷语法

随机推荐

使用 REST API 进行正确的会话管理

我已经完成了 RESTful API 的设计其中我使用作为参数发送的 API 令牌对每个请求进行身份验证现在我想创建一个客户端界面我想知道什么是管理每个客户端的会话的正确安全方法browser客户我想过一个流程来保持服务器端无状态
这是可插拔组件本地化的好解决方案吗？

我问了一个question https stackoverflow com questions 1504363 how should i localise pluggable components以前只有一个答案我现在已经花了一些时间来研
比较元胞数组中的字符串

我试图在单词列表中找到最常见的单词到目前为止这是我的代码 uniWords unique lower words for i 1 length words for j 1 length uniWords if uniWords j lo
如何对 Django 视图进行单元测试？

我想开始将单元测试集成到我的 Django 项目中并且我发现对视图进行单元测试很棘手因为 Django 使用函数实现视图的方式例如如果函数有 URL 则每个函数都是 Django 中的视图页面如何对 Django 视图进行单元测
如何使用 hibernate JPA 2 以二进制形式存储 uuid

我有一个关于通过休眠持久化 JPA2 在数据库中以二进制形式存储字符串uuid的问题我现在正在使用这段代码 private UUID id Id Type type uuid char GeneratedValue generator s
不小心删除了Android布局文件

我不小心从我的 Android 项目中删除了一个布局文件有什么办法可以拿回来吗自从做完之后我就再也没碰过而且我在其他地方没有该文件的副本如果您的 bin 文件夹中有该 apk 那么您很幸运使用apktool https code
使用 ffmpeg 将视频与其自身连接，但相反

我能够逆转 ffmpeg i input mp4 vf reverse output reversed mp4 我可以连接 ffmpeg i input mp4 i input mp4 filter complex 0 0 0 1 1 0
如何以编程方式迭代所有 CMake 目标？

有没有办法从顶层获取 CMake 项目的所有目标CMakeLists txt 即以编程方式迭代目标我想要这样做的原因是将一些 XCode 特定设置应用于每个目标 if CMAKE GENERATOR MATCHES Xcode inclu
受保护属性的通用 getter 和 setter

考虑这个 TypeScript 类它通过将实现分为超类和子类来提供类型检查的通用 getter 和 setter class ICompetence protected id number undefined protected name
抓取网页时调用 javascript 函数

我正在使用 python 抓取网页该页面有
emacs 启动后更改 X11 窗口标题

当我启动 emacs 时我可以使用 title 选项来控制保存 emacs 应用程序的 x 窗口的标题 emacs从elisp启动后可以更改标题吗 M x set frame name NewName RET 和来自 elisp set
videoMinFrameDuration 已弃用

当我将 Xcode 从 4 6 更新到 5 1 时 ios7 中不推荐使用 videoMinnFrameDuration void setFrameRate NSInteger frameRate frameRate frameRate i
Angular2 RC6 HttpModule手动注入

我正在将一个项目从 angular2 RC4 迁移到 RC6 并且我有一个自定义表单验证器需要Http 在迁移之前我使用了ReflectiveInjector与HTTP PROVIDERS 但是对于 RC6 这不再可能了因为HTTP P
通过电子邮件搜索将 Excel 2003 中的数据行复制并粘贴到不同的工作表

在任何人发表任何言论之前我已经浏览了几篇与此类似想法相关的帖子采用不同的搜索条件然后对其进行修改但我无法让宏正常工作这可能是由于我缺乏编程知识我想做的就是 search的电子邮件地址工作表1如果找到则将整行复制到下一个空闲行工
如何将数据框随机分成三个具有给定行数的较小数据框

使用 R 我想将一个数据帧随机拆分为三个较小的数据帧第一个占总观测值的 80 第二个和第三个分别占总观测值的 15 和 5 三个数据框不能有任何重叠你有什么建议吗这是一个快速函数可以根据您在 props 参数中指定的值的数量分成任意
iPhone应用程序NSNumber内存泄漏

我遇到了内存泄漏但我不知道它从哪里来以及如何修复它在某些时候我计算两个位置之间的距离 double calc self getDistance location to otherLocation NSNumber distance N
如何使用Python的RotatingFileHandler

我正在尝试进行测试运行logging模块的RotatingFileHandler https docs python org 3 library logging handlers html logging handlers Rotating
检查 C# 中泛型方法的类型参数

是否可以在 C 中执行类似的操作 public void DoSomething
正式协议对象有什么用

我们可以在源代码中创建协议对象但是正式的协议对象有什么用呢 Protocol myObj protocol protocolName 您可以使用它来检查对象是否符合协议 anotherObject conformsToProtocol m
使用 MySQL 检测垃圾邮件发送者

我发现越来越多的用户在我的网站上注册只是为了向其他用户发送重复的垃圾邮件消息我添加了一些服务器端代码来使用以下 mysql 查询检测重复消息 SELECT count content as msgs sent FROM messages

使用 MySQL 检测垃圾邮件发送者

使用 MySQL 检测垃圾邮件发送者 的相关文章

随机推荐

热门标签

使用 MySQL 检测垃圾邮件发送者的相关文章