如何像 Evernote Clipper 那样检测主文章标签

2024-02-25

When I tried with Evernote clipper extension https://chrome.google.com/webstore/detail/evernote-web-clipper/pioclpoplcdbaefihamjohnefbikjilc, I see a very useful feature. When I clicked at "article", It gives me a really correct main content of page. Let see the result when I used Evernote Clipper with page https://developer.chrome.com/extensions/api_index https://developer.chrome.com/extensions/api_index extract article in a page

我查看了evernote字段中的主要文章，在几个页面中，该文章实际上是从第一篇文章标签中提取的。然而，evernote Clipper 仍然可以很好地处理不使用此类标签的页面。

我想知道 Evernote Clipper 是如何做到这一点的？是否有任何js库支持检测包含页面主要内容的主标签。你能给我一些建议吗？

先感谢您！

据我所知，没有通用的 js 库可以做到这一点。 Evernote Clipper 使用自己的方法从网页中提取“有趣”的内容。您可以访问 Evernote Clipper 的代码来尝试了解该过程。

在我的 Mac 上，chrome 扩展程序的路径是：

〜/库/应用程序支持/Google/Chrome/默认/扩展/pioclpoplcdbaefihamjohnefbikjilc/6.2_0/

这是另一个工作原理几乎相同的工具：https://www.readability.com/ https://www.readability.com/

您还可以检查此线程：Readability 使用什么算法从 URL 中提取文本？ https://stackoverflow.com/questions/3652657/what-algorithm-does-readability-use-for-extracting-text-from-urls

或者在 google 上搜索“内容提取 js lib”等术语。（找到了这个：https://github.com/hatena/extract-content-javascript https://github.com/hatena/extract-content-javascript)

希望这可以帮助

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何像 Evernote Clipper 那样检测主文章标签的相关文章

通过搜索查找下一个文本并突出显示不起作用

当在搜索框中搜索任何文本时它可以找到并突出显示正确的文本但是当搜索下一个新文本时它无法找到下一个新文本再次搜索时它不起作用我无法找到问题这JS below JS button search click function va
Javascript：如何根据 html 标签扩展用户选择？

乐代码 http jsfiddle net frf7w 12 http jsfiddle net frf7w 12 所以现在当前的方法将完全按照选择的方式获取所选文本并添加标签以便在显示时页面不会爆炸但我想做的是就是说当用户选
如何延迟 NavLink 的反应？

Delay e gt e preventDefault setTimeout gt e unpreventDefault make this work 500 render
Angular - Safari 无法正确显示 DOM

我是 Angular 的新手使用 Angular 4 我尝试通过在关联的组件类文件中设置属性来更新特定元素但是除非我尝试强制重新绘制网页通过调整窗口大小等否则页面不会更新我打开检查器看到 DOM 已更改但显示与元素检查器中的
使用 jQuery 的 javascript 关联数组长度

我正在使用 javascript 关联数组例如 var testarray testarray one 1 testarray two 2 testarray three 3 我也在旁边使用jquery 如何使用 jquery 或任何其他
动态地将 .on() 方法与事件映射绑定

我使用此语法来确保事件绑定动态添加li元素 ul list on click li function do something 我尝试使用这样的事件映射来存档相同的内容 ul list hammer css hacks false on s
apollo 客户端从存储中删除而不发生突变

我需要通过 id 从本地存储中删除一条记录而不使用突变因为服务器不支持突变我尝试像这样手动访问商店 delete this apolloClient store getState apollo data 1112 这会删除记录但是
如何反转媒体查询中元素的顺序？

我有两个 div 左和右但是当屏幕小于 500px 时左 div 成为底部 div 右 div 成为顶部 div DOM 中的第一个 div 应该显示为第二个第二个 div 为第一个 I use display flex 然后 div
javascript onclick 进入新窗口

这是我的代码
替换打字稿中字符串中字符的所有实例？

我正在尝试用 x 字符替换电子邮件中的所有句号例如电子邮件受保护 cdn cgi l email protection 将变为 myxemail emailxcom 电子邮件设置为字符串我的问题是它不只是替换句号而是替换每个字符所
从 html 页面和 javascript 调用 java webservice

我正在尝试从 javascript 调用 java 实现的 Web 服务使用 NetBeans IDE 我读过很多关于 jQuery 和 AJAX 的内容但我似乎无法掌握它假设我的 Web 服务 WSDL 位于 http localh
backbone.js：视图中影响集合中不同模型的按钮

我刚刚开始使用backbone js 到目前为止我真的很喜欢它我有这样的事情 ModelA ModelB ViewA ViewB ModelA 持有 ModelB 的集合如何使用按钮构建模型 B 的视图单击该按钮会更改集合中下一个
React TypeError：x 不是函数

我在子组件中从父组件调用函数 booksRefresh 但出现错误类型错误 booksRefresh 不是函数我不知道为什么因为 booksRefresh 是一个函数有人可以帮我解释为什么会出现这个错误吗这是我的代码 import
如何修复带有单个道具的括号的 prettier 和 tslint 错误？

我使用 prettier 和 tslint https github com alexjoverm tslint config prettier https github com alexjoverm tslint config prett
如何在 WebView 中添加 JavaScript 函数并稍后在提交 reCAPTCHA 时从 HTML 调用它

我在 WebView 中添加一个 JavaScript 函数如下所示 Kotlin val webView findViewById R id webview as WebView webView getSettings setJavaS
如何将命名空间与 TypeScript 外部模块一起使用？

我有一些代码基本类型 ts export namespace Living Things export class Animal move export class Plant photosynthesize dog ts import
如何用时刻找到与给定时间最接近的时间？

所以我有一个简单的代码一个工作代码它使用 moment 获取最接近给定时间的时间 Current time in millis const now moment 10 16 HH mm format x List of times co
如何设置javascript对象数组中所有对象的特定属性值（lodash）

我有以下对象数组 var arr id a1 guid sdfsfd value abc status active id a2 guid sdfsfd value def status inactive id a2 guid sdfsfd
如何在 ionic2 中 pop() 之后重新加载 ion-page

我有2页Page1 and Page2 我用过this nav pop 在Page2中它将弹出Page2 Page1将启用但我想刷新Page1 先感谢您您可以将父页面与导航推送一起传递这样您就可以将父页面作为 navParamter
开玩笑 setTimeout 不暂停测试

it has working hooks async gt setTimeout gt console log Why don t I run expect true toBe true 15000 我已经查看了这个答案 Jest 文档和几

随机推荐

PHPDoc 文档生成器是在 Eclipse 中还是在 Eclipse 之外？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在使用 Eclipse PDT 进行开发我一直在代码中添加 phpdoc 注释但实际上从未在
导入 numpy 时出现 OpenBLAS 错误：`blas_thread_init 函数中的 pthread_creat 错误`

突然间我无法导入 numpy import numpy as np OpenBLAS pthread creat error in blas thread init function Error code 1 我正在运行 numpyAna
使用 iPhone 的排序描述符对核心数据位置变化进行排序

我有一个具有两个属性的 CoreData 实体一个称为 position 另一个称为 positionChange 它们都是整数其中position属性是当前位置 positionChange是前一个位置和新位置之间的差值这意味着po
颤动| Dart：URI 目标不存在

我正在制作我的第一个应用程序来使用 Flutter 构建 Android 应用程序我使用 Android Studio 作为 IDE 问题是当我导入 http 包时 import package http http dart as htt
scala 中两个数据帧的架构比较

我正在尝试编写一些测试用例来验证源 csv 文件和目标配置单元表之间的数据验证之一是表的结构验证我已将 csv 数据使用定义的架构加载到一个数据框中并将配置单元表数据提取到另一个数据框中当我现在尝试比较两个数据帧的架构时它
用于验证邮政编码并检查无效字符的正则表达式

我正在尝试验证邮政编码的输入现在这个邮政编码应该适用于美国加拿大英国所有国家但省略任何特殊字符所以我尝试首先检查无效字符如果通过然后我检查邮政编码要么是美国要么只是为了确保有有效字符且不超过 8 个只要现在是美国它们
为什么第二次 cp 命令更快

当我执行时cp folder1 folder2 rf 第一次大约需要10分钟但是当我执行第二个命令时cp folder1 folder3 rf 大约需要 1 分钟 folder1包含大约 100 000 个文件为什么第二次运行时间会有所
强制使用 C++ override 关键字？

我真的很喜欢 c 11 的新 override 关键字我试图将它添加到我的代码中如果编译器能够帮助我发现所有这些情况那就太好了有什么方法可以让编译器表现得好像 override 关键字是强制的吗我正在使用 Visual Studi
类模板的成员函数如果从未被调用，是否不会被实例化？

我刚刚开始了解一些模板基础知识实际上直到现在我才接受它作为事实但我不太明白为什么会这样 template
Django：使用 Ajax 获取模板中的数据库对象值

我想根据用户选择获取数据库对象我知道 Ajax 是一种可能的解决方案但我不知道如何实现这是代码 view py def automation request some code car CAR objects get ida name
我可以在输入寄存器中写入吗？ MODBUS

我已经在一家公司工作了两个月MODBUS项目现在我发现了一个问题我的客户要求我写入输入寄存器地址 30001 到 40000 我认为这对我来说不是什么问题因为每个modbus文档说 30001 到 40000 寄存器是只读的甚至可以
PHP 相当于 JavaScript 绑定

首先请原谅我的英语我不是母语人士很抱歉如果它看起来很粗糙这是我第一次在这个网站上发帖我认为我的问题很简单比方说我们有 class A function foo function bar arg echo this gt baz
如何使用 matlab 根据 FAR/FRR 值计算并绘制等错误率 (EER)

我对 FAR FRR 有以下值我想计算 EER 率然后在 matlab 中绘图 FAR FRR 19 64 20 21 29 18 61 24 92 17 08 19 14 20 28 17 99 21 39 16 83 23 47 1
亚马逊 MWS 错误签名不匹配 (Python)

目前我在尝试向 Amazon Marketplace WebService 提交请求时遇到以下错误 The request signature we calculated does not match the signature you
使用Jmeter调用API时如何传递表单数据？

我想使用 Jmeter 进行 API 调用在我的 API 调用中我发送一个带有请求的文件我需要将文件名指定为表单数据 e g when I call the same API from postman 当我从 Jmeter 进行上述调
Vagrant Share - 访问虚拟主机以及访问不在默认 Web 根目录中的虚拟主机

我有 Vagrant 设置并运行 CentOS 6 5 x64 它运行得很好在这一台虚拟机中运行多个站点没有问题所有站点均从以下位置运行 var www 公共文件夹但运行的 PhpMyAdmin 除外 var www html 我正在
我如何在 swift 中将 uiview (xib) 作为警报视图呈现

我想将我的 xib 呈现为警报视图在 xib 中主视图将是半透明的这将防止用户在警报视图打开时点击后台的任何其他内容我没有在 xib 中使用视图控制器 1 获取XIB文件对象 let alert NSBundle mainBundl
SQL Server：类似中使用的索引列？

对仅在 LIKE 操作中使用的 varchar 列建立索引是个好主意吗根据我从查询分析中读到的内容我从以下查询中得到 SELECT FROM ClientUsers WHERE Email LIKE niels bosmainter 在
为什么 Angular.js 使用 ng-change 如此频繁地调用我的函数以及如何让它每次更改只调用一次？

在学习了许多教程之后我正在构建我的第一个合适的 angular js 应用程序我遇到了一个问题ngChange指示每次用户更改下拉列表的值时我都尝试使用它来调用函数我发现它在页面加载时多次调用该函数并且每次选择该选项时也会多次调
如何像 Evernote Clipper 那样检测主文章标签

When I tried with Evernote clipper extension https chrome google com webstore detail evernote web clipper pioclpoplcdbae

如何像 Evernote Clipper 那样检测主文章标签

如何像 Evernote Clipper 那样检测主文章标签 的相关文章

随机推荐

热门标签

如何像 Evernote Clipper 那样检测主文章标签的相关文章