广告过滤服务器端[关闭]

2024-05-07

我正在开发一个 Web 应用程序，在其中显示来自其他网站的 HTML。在显示最终版本之前，我想去掉广告。

关于如何实现这一目标有什么想法、建议吗？它不需要是一个超级高效的过滤工具，我正在考虑移植一些filters https://adblockplus.org/en/filters被定义为广告拦截加 https://adblockplus.org/en/source到 Ruby 并在以下帮助下返回解析后的文档Nokogiri http://nokogiri.org.

假设我使用超级通配符过滤器ad。这不是官方的广告拦截器，但为了简单起见，我将在这里使用它。然后的想法是删除任何属性与过滤器匹配的所有元素，例如：src="http://ad.foo.com?my-ad.gif" href="http://ad.foo.com" class="annoying-ad" etc.

此过滤器的 Nokogiri 命令为：

doc.xpath("//*[@*[contains(., 'ad')]]").each { |element| element.remove }

我为此应用了过滤器page http://www.nytimes.com/2013/09/02/arts/music/kathleen-hanna-returns-with-the-julie-ruin.html?hp:

结果是：

还不错，请注意，全局通配符过滤器还删除了标头等有效元素，因为它们具有诸如id="masthead".

所以我认为这种方法适合我的情况，现在的问题是使用什么过滤器？他们有一个巨大的list https://easylist-downloads.adblockplus.org/easylist.txt过滤器，我不想迭代所有过滤器。我正在考虑获取前 10-20 名并据此解析文档，是否有一个包含最受欢迎的列表？如果是的话我还没找到。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

广告过滤服务器端[关闭] 的相关文章

Ruby On Rails 与 Windows Vista - 最佳设置？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案您认为 Win Vista 环境中 RoR 的最佳设置是什么我尝试过 radrails eclipse 插件它对我来说似乎太庞大了我也开始
如何使用 Jsoup 解析此 HTML

我正在尝试提取了解你的拖拉机和壳牌石油公司 1955 请记住这只是整个代码的一小段并且有多个 H2 H3 标签我想获取所有 H2 和 H3 标签的数据 HTML 如下 https i stack imgur com Pif3B
HTML 电子邮件 - Outlook 2013 中图像之间的间隙

I m composing an HTML email which looks fine in every major email client except Outlook 2013 which is adding vertical ga
Capistrano 无法定位应用程序部署中的 Gemfile 错误

我正在尝试将 Rails 应用程序部署到生产服务器并决定使用以下命令将其部署到 DigitalOcean本指南 https gorails com deploy ubuntu 14 04 overview RVM 要部署我使用以下命令
如何区分两个同名的多选列表

对于我正在构建的系统我需要查看第一个列表中出现了哪些选项通过 POST 请求以及第二个列表中出现了哪些选项
为什么table-layout:fixed会影响父元素的宽度？

有人可以解释为什么我的div with table layout fixed正在改变其父元素的宽度 body在本例中使其在不应该是 100 的情况下达到 100 因为它已经定位了 body border 2px solid red hei
如何将 STDOUT 捕获到字符串？

puts hi puts bye 我想存储到目前为止代码的 STDOUT 在本例中 hi nbye 到变量中说结果并打印它 puts result 我这样做的原因是我已将 R 代码集成到我的 Ruby 代码中当 R 代码运行时其输出
加载 HTML 格式的大型视频文件

这是我的问题我想播放存储在 S3 存储桶中的大型视频文件 3 6Gb 但该文件似乎太大并且加载 30 秒后页面崩溃这是我播放视频的代码 var video document getElementById video const med
CSS条件注释适用于除IE之外的其他浏览器吗？

据我所知条件注释仅支持不同版本的IE 同样我们也可以为其他浏览器提供条件注释吗如果是如何如果不是最好的选择是什么 CSS 条件注释仅适用于 IE http msdn microsoft com en us library ms5
之后的脚本会阻止 DOM 加载

考虑以下代码 div class box div 令我惊讶的是 DOM 延迟了十秒的加载 10秒后出
查找数组中 2 个缺失数字的最快方法

这个问题的存在只是出于纯粹的好奇心不是作业找到在数组 1 n 中找到两个缺失数字的最快方法因此在相关帖子中查找数字数组中缺失数字的最快方法 https stackoverflow com questions 2113795 qui
Bootstrap .row margin-left: -15px - 为什么它会缩进（来自文档）

我在 Bootstrap 文档中看到了这一行 http getbootstrap com css grid intro http getbootstrap com css grid intro It says 列通过填充创建装订线列内容之
div 准备好后如何调用函数？

我的 javascript 文件中有以下内容 var divId divIDer jQuery divId ready function createGrid Adds a grid to the html html 看起来像这样 div
如何在索引视图中打印关联数据

subjects this gt Subjects gt find all contain gt Users fields gt Users username Users email gt hydrate false gt toArray
将 Rails 5.2 升级到 6.0 时出现参数错误数量错误

我正在尝试将旧站点从 Rails5 2 升级到 6 0 然后再升级到 6 1 推荐的路径我收到了有关参数数量错误的各种错误其中一些错误我已通过更新或删除各种 gem 设法清除最后我被困在了这一点上 rbenv versions 3 0
从 Rails 2.3.8 升级到 4.0

我正在 Rails 2 3 8 上运行一个应用程序我计划将其升级到 Rails 4 0 RC 版对我来说最简单的方法是什么我需要先升级到 Rails 3 x 吗注意在我当前的实现中我使用八哥和雪貂作为升级的一部分我也在考虑搬
Marionette CompositeView 为 Collection 中的每个模型呈现自身，而不是 ItemView (Marionette Rails)

基本上我试图将 CompositeView 渲染为带有表头的简单四列列表其中集合中的每个模型都渲染为并附加到我正在跟进德里克的一个例子 http jsfiddle net derickbailey me4NK 非常接近只有一点点变
如何实现Contenteditable属性的Ctrl+A功能？

我正在尝试为用户显示带有一些示例代码的 div 我希望他们能够在 div 内部进行选择并使用 Ctrl A 选择所有示例代码但我不希望他们能够编辑实际文本以免意外删除一点然后它不会工作我现在通过 div 上的 contentedit
Rails 6 - 操作文本和 API

我正在创建一个 Rails 6 0 0 应用程序它具有以下模块网络表格 Cruds Api 我使用的地方有一个 CRUD动作文本 https edgeguides rubyonrails org action text overvie
无法使用python和beautifulsoup抓取网页中的某些href

我目前正在使用 Python 3 4 和 bs4 爬取网页以收集塞尔维亚在里约 2016 年的比赛结果所以网址here http rio2016 fivb com en volleyball women teams srb serbia

随机推荐

构造函数中的变量？

我目前是 Java 编程的初学者任务是编码并测试 Hangman 游戏的一个版本您的解决方案将涉及一个 Hangman 类其构造函数选择一个单词其猜测方法处理每个猜测的字符不过我有一个小问题我的整个代码可以工作并编译并且我
python3.5中使用aiohttp查询获取URL的参数

async def method request here how to get query parameters param1 request rel url query name param2 request rel url query
Javascript：在 For 循环中创建函数

最近我发现自己需要创建一系列函数这些函数使用 XML 文档中的值并且我使用 for 循环运行适当的节点然而在执行此操作时我发现数组中的所有函数仅使用过 XML 表的最后一个节点对应于 for 循环的最后一次运行以下是展示这一
如何确定 CSV 文件字段是制表符分隔还是逗号分隔？

我试图确定 CSV 文件字段是制表符分隔还是逗号分隔我需要 PHP 验证我怎样才能确定这一点现在回答这个问题已经太晚了但希望它能对某人有所帮助这是一个简单的函数它将返回文件的分隔符 function getFileDelimit
JSON 响应周围的注释块

我注意到一些 Web 应用程序返回 AJAX 响应并在注释块中嵌入 JSON 数据例如这是一个示例响应 firstName John lastName Smith address streetAddress 21 2nd Street
服务器端 Google 标记聚类 - Python/Django

在尝试使用客户端方法来聚类大量 Google 标记后我认为这对于我的项目拥有 28 000 多名用户的社交网络来说是不可能的是否有在服务器端对坐标进行聚类的示例最好是在 Python Django 中我希望它的工作方式是根据标记
类似 wget 的 BitTorrent 客户端或库？ [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 是否有任何
CPU是如何做减法的？

我有一些基本的疑问但每次我坐下来尝试面试问题时这些问题和我的疑问就会出现假设 A 5 B 2 假设A和B都是4字节那么CPU是怎么做的呢 A B添加我知道 A 的符号位 MSB 为 0 表示正值 B 的符号位为 1 表示负整数现
创建超过 2 组的高图表密度

我尝试用两个以上的组创建高图表密度我找到了一种手动将它们逐一添加的方法但必须有更好的方法来处理组示例我想创建一个类似于下面的ggplot图表的highchart 而不需要将它们一一添加有什么办法可以做到吗 d f lt data
无法使用 Android 版 VLC 设置字幕

启动 Android 版 VLC 的 VideoPlayerActivity 时我在设置字幕位置时遇到问题我的目标是 API 27 并使用 FileProvider 来允许访问文件根据文档here https wiki videola
从多页表单中获取活动控件名称和值

我已经在网上寻找解决方案几个月了但没有成功我创建于Excel 2010 a UserForm与多页我正在尝试编写一个函数来获取activecontrol名称和值到目前为止我已经成功使用此命令获取了控件的名称Me MultiPage
pyPDF通过django合并并显示为httpresponse

我在合并 pyPDF 逻辑以将两个 pdf 文件合并到我的 django 站点时遇到问题我编写了在本地服务器上的 python 文件中运行时用于合并文件的代码但我需要明确识别要合并的文件 from pyPdf import PdfFil
如何通过VBA刷新所有单元格

有没有办法触发从VBA Excel要求它重新评估所有Excel单元格谢谢 The 计算 http msdn microsoft com en us library aa223802 28office 11 29 aspx方法可以重新计算
最初从位图泄漏未引用的 byte[] 但被回收（）导致内存泄漏（直到活动停止）

我有位图内存泄漏导致内存不足我在 Android 5 0 三星 S5 上运行了测试我已经使用 Android Studio 1 5 1 2 0 0 Preview 7 调查了这个问题 HPROF 内存转储显示有多个 byte 与我暂时使
XTS to.weekly 返回不同的每周端点

我有一个问题endpoints 函数于xts 还有to weekly函数使用端点有时返回星期五作为周末有时返回星期一我的数据集叫做sp2 gt head sp2 1 2012 01 09 1 78 2012 01 10 1 78 2
将角半径应用于 Storyboard 内的特定 UIView 角并不适用于所有角

我为此创建了一个自定义类但它仅适用于左上角不适用于其他位置 IBDesignable public class RoundedView UIView IBInspectable public var topLeft Bool false
在 python 中使用 numpy.linalg.eig 后对特征值和关联的特征向量进行排序

我使用 numpy linalg eig 来获取特征值和特征向量的列表 A someMatrixArray from numpy linalg import eig as eigenValuesAndVectors solution eig
如何使用 Javascript 弹出一个新窗口，其 html 与其父窗口几乎相同

我想从单个页面创建多个版本的适合打印的页面我正在考虑这样做在原始页面上放置几个按钮然后单击一个按钮将弹出一个新窗口其html与其父窗口相同但进行了一些修改例如将某些DIV的显示属性设置为没有任何可以使用javascript来
比较通用列表和数组

为什么 generic list 比 array 慢通用列表比数组稍慢但在大多数情况下您不会注意到主要与稍微复杂的查找有关据说 List 在幕后使用数组但不能保证以与数组相同的方式将节点保留在相邻内存中然而我早在 2005
广告过滤服务器端[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在开发一个 Web 应用程序在其中显示来自其他网站的 HTML 在显示最终版本之前我想去掉广告关于如何实现这一目标有什么想法

广告过滤服务器端[关闭]

广告过滤服务器端[关闭] 的相关文章

随机推荐

热门标签