如何在Python中获取JavaScript内容

2023-12-02

我有一个网站，其中有我想要获取的存储在 JavaScript 中的数据。我如何获取它？

代码是这样的：-http://pastebin.com/zhdWT5HM

我想从“varplayersData”行获取。我想获取这个东西：-“playerId”：“showsPlayer”（显然没有引号）。我该怎么做？

我尝试过美味的汤。我当前的脚本如下所示

q = requests.get('websitelink')
soup = BeautifulSoup(q.text)

searching = soup.findAll('script',{'type':'text/javascript'})
for playerIdin searching:
  x = playerId.find_all('var playersData', limit=1)
  print x

我得到 [] 作为我的输出。我似乎无法弄清楚我的问题在这里。请各位男士和女士帮忙:)

BeautifulSoup只会帮助找到所需的script标签。然后，您将有多种选择：您可以使用 javascript 解析器提取所需的数据，例如slimit，或使用正则表达式：

import re

from bs4 import BeautifulSoup

page = """
<script type="text/javascript">
            var logged = true;
            var video_id = 59374;
            var item_type = 'official';

            var debug = false;
            var baseUrl = 'http://www.example.com';
            var base_url = 'http://www.example.com/';
            var assetsBaseUrl = 'http://www.example.com/assets';
            var apiBaseUrl = 'http://www.example.com/common';
            var playersData = [{"playerId":"showsPlayer","userId":true,"solution":"flash","playlist":[{"itemId":"5090","itemAK":"Movie"}]];
</script><script type="text/javascript" >
"""
soup = BeautifulSoup(page)

pattern = re.compile(r'"playerId":"(.*?)"', re.MULTILINE | re.DOTALL)
script = soup.find("script", text=pattern)

print pattern.search(script.text).group(1)

Prints:

showsPlayer

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

python

html

python27

beautifulsoup

如何在Python中获取JavaScript内容的相关文章

Jquery获取每个div的子子div并将信息抓取到数组中

我有一些看起来像这样的 html div div class sub main div div
替换打字稿中字符串中字符的所有实例？

我正在尝试用 x 字符替换电子邮件中的所有句号例如电子邮件受保护 cdn cgi l email protection 将变为 myxemail emailxcom 电子邮件设置为字符串我的问题是它不只是替换句号而是替换每个字符所
React TypeError：x 不是函数

我在子组件中从父组件调用函数 booksRefresh 但出现错误类型错误 booksRefresh 不是函数我不知道为什么因为 booksRefresh 是一个函数有人可以帮我解释为什么会出现这个错误吗这是我的代码 import
如何在 JavaScript 中从代理对构造 UTF-16 字符？

以下计算 Unicode 代码点的 UTF 16 代理对戴着医用口罩的脸 https emojipedia org face with medical mask 但是如何从代理对构造字符以在字符串中使用呢 const codepoint
如何在Python和Selenium中通过标签名称或id获取元素[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 和 Selenium 获取输入但它向我显示错误我该如何解决这个错误 inputElement send keys getStock getStocklFunc 0 Error i
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
将 Pandas 列中的列表拆分为单独的列

这是我在 pandas 数据框中的特征列 Feature Cricket 82379 Kabaddi 255 Reality 4751 Cricket 15640 Wildlife 730 LiveTV 13 Football 4129
在 Selenium WebDriver 上如何从 Span 标签获取文本

在 Selenium Webdriver 上如何从 span 标记检索文本并打印我需要提取文本UPS Overnight Free HTML代码如下 div id customSelect 3 class select wrapper
将输入发送到 python 子进程而不等待结果

我正在尝试为一段代码编写一些基本测试该代码通常通过 stdin 无休止地接受输入直到给出特定的退出命令我想检查程序是否在给出一些输入字符串时崩溃经过一段时间来考虑处理但似乎无法弄清楚如何发送数据而不是陷入等待我不知道的输出关心我
如何将命名空间与 TypeScript 外部模块一起使用？

我有一些代码基本类型 ts export namespace Living Things export class Animal move export class Plant photosynthesize dog ts import
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
Flask WTForms 使用变量自动填充 StringField

我有一个表格我想用上一页收到的信息自动填充一些字段但如果他们想调整它它需要是可更改的我正在为我的 SelectField 使用动态创建的列表但添加 StringField 并不成功请参阅下面的我的代码 forms py clas
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
浏览器正在加载两张图像 - 一张用于 srcset，一张用于 src（Chrome 41 等）

我正在开发的网页上使用 srcset 属性 img src img picture 820x496 jpg 如果我检查页面加载了哪些资源我会发现 Chrome 41 以及使用 polyfill 的 FF 以及 Safari 7 总是加载图
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
开玩笑 setTimeout 不暂停测试

it has working hooks async gt setTimeout gt console log Why don t I run expect true toBe true 15000 我已经查看了这个答案 Jest 文档和几
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe

随机推荐

带有 ManagedBeans 的 Primefaces 总是返回 null [重复]

这个问题在这里已经有答案了我有个问题我有一个表格通过将输入发送到 bean 进行调试在 bean 对象中始终为 null 你能帮我解决这个问题吗这里是代码
代码仅从 Firebase 中的数据检索一个值

正如标题所示我正在尝试从 firebase 数据库检索一些数据但我的代码无法正常工作我在帖子中有三个孩子我猜这就是你对他们的称呼名为标题描述和用户名我试图获取所有这些孩子并将它们附加到一个变量中以便稍后使用它们但它
iCal 格式 - 存储事件创建者

我目前正在编写一个大致基于 iCalendar 标准的日程安排应用程序有谁知道我可以在哪个属性中存储活动创建者的信息通过浏览 iCalendar RFC 2445 我找到了这个属性组织者即使活动创建者是唯一参与活动的人我是否可以将
内存布局意味着Go中[]T无法转换为[]接口？

所以我一直在阅读这两篇文章和这个答案无法将 string 转换为 interface 表示需要更改内存布局 http jordanorelli com post 32665860244 how to use interfaces in g
如何在移动设备的 Facebook 即时游戏中创建 Phaser 按钮

我正在尝试在移动设备上使用 Phaser 2 CE 创建一个按钮但它不会触发即使它在桌面上运行良好整个代码也会打开我的 github 存储库但目前我只能显示一个图像如下面的代码所示 var game new Phaser Game
PROLOG 打印以 7 结尾且其数字之和大于 100 的数字

我需要创建一个谓词来接收数字列表并仅打印以 7 结尾且其数字之和大于 100 的数字我为分离做了谓词但我需要帮助将两个谓词合并起来我的意思是这两个谓词进入一个唯一的谓词这就是我到目前为止所做的 sum of digits great
如何导入 java 的 multimap？

这有点愚蠢但我该如何安装MultiMap 我需要一种将多个值存储到键的方法但我的地图实现无法正常工作那堂课 MultiMap 不是 Java 标准库的一部分它是一部分阿帕奇共享区一组独立的实用程序类许多 Java 开发人员认为很
如何使用非树数据创建 d3.js 可折叠力布局？

我有一个 d3 力定向布局其中的数据具有下面类似的结构是否可以应用可折叠力布局例如http bl ocks org mbostock 1062288到它我希望单击时折叠展开节点 nodes x 469 y 410 x 493 y
Java 8：使用字符串的字符数创建 HashMap

想知道是否有比计算给定字符串的字符数更简单的方法如下所示 String word AAABBB Map
表单获取方法：防止在查询字符串中提交空字段

我正在开发一个搜索表单搜索表单有 2 个部分首先使用一些选择输入和提交按钮进行简单搜索第二个包含许多选择复选框单选输入和提交按钮我正在使用 GET 方法因为我想要查询字符串中的所有字段 example com cars p
创建一个新分支

我想创建新分支 B 目前我有一个主分支本地和远程和功能分支 A 本地功能分支 A 已在远程删除另外我的本地功能分支中有一些已提交的文件和未暂存的文件我想去master在不丢失任何更改并创建另一个分支的情况下先提交该分支然后
在 matplotlib 轮廓图中同时使用 set_under 和 set_bad

我正在尝试生成一个 matplotlib 轮廓图其中指定值下的所有值都为白色包括零并且所有 nan 值代表缺失数据为黑色我似乎无法让 nan 值的颜色与低于零值不同问题的一个简化示例是 import numpy as np
打印到同一行时遇到问题

我正在尝试编写一个代码您在控制台中输入一个整数然后您输入的整数显示得更大由字母组成如 ascii art 所以假设输入是112 那么输出将是我的代码将具有相同的输出只是不在同一行它将在另一个数字下打印一个数字从我的代码中您可
seaborn barplot：随 x 和色调改变颜色

我的数据集包含有关决策支持模型的短期和长期影响的信息我想将其绘制在条形图中有 4 个条形模型短期模型长期模型关闭短期模型长期这是一些示例代码 df pd DataFrame columns model time val
临时容器对象上的迭代器

假设我有一个按值返回 STL 容器的函数例如 std list std list
将小部件嵌入到 QWindow 中

基本上我想使用创建一个窗口QtGui QWindow 代替QtWidgets QMainWindow 我想这样做是因为我想访问QWindow功能例如 startSystemMove setTitle setWindowStates star
WebSocket 中是否有像lastEventId 这样的数据块ID？

我使用 WebSockets 在浏览器客户端中的按钮按下事件上从服务器发送图像 WebSocket API 的 onmessage 方法接收到的图像数据是 Blob 结构分为多个块问题在于短时间内多次按下按钮事件收到的块是出故障
如何加快AMI（Amazon Machine Image）的创建速度？

AMI 创建需要long time 有没有办法让它发生得更快例如也许通过更改一些 AMI 创建设置可能涉及 IOPS 卷类型设备等我不知道如何更改这些设置或者它是否有帮助因此我不确定现阶段有什么方法可以加快 AMI 创建过程
通过 HTTP 表单上传文件，通过 MultipartEntityBuilder，带有进度条

The 简洁版本 org apache MultipartEntity已弃用其升级 MultipartEntityBuilder 在我们的在线论坛中似乎代表性不足让我们解决这个问题如何注册回调以便我的 Android 应用程序可以在
如何在Python中获取JavaScript内容

我有一个网站其中有我想要获取的存储在 JavaScript 中的数据我如何获取它代码是这样的 http pastebin com zhdWT5HM 我想从 varplayersData 行获取我想获取这个东西 playerId sh

如何在Python中获取JavaScript内容

如何在Python中获取JavaScript内容 的相关文章

随机推荐

热门标签

如何在Python中获取JavaScript内容的相关文章