Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？

2023-11-30

我正在尝试抓取一些元素并返回网页上显示的文本。我相信我可以通过 css_selectors 和 xpaths 很好地找到元素，但我无法返回所需的文本。下面是我的程序：

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait as wait
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.options import Options
import time
import threading
import pandas as pd

threadLocal = threading.local()

def instantiate_chrome():
    driver = getattr(threadLocal, 'driver', None)

    if driver is None:
        options = webdriver.ChromeOptions()
        options.add_argument('log-level=3')
        options.add_argument('--ignore-certificate-errors')
        options.add_argument('--ignore-ssl-errors')
        driver = webdriver.Chrome(executable_path = r'path/to/chrome', options = options)
        setattr(threadLocal, 'driver', driver)

    return driver

def search_stock(driver, stock):
    search_url = r'https://www.forbes.com/search/?q=' + stock
    driver.get(search_url)
    time.sleep(2)
    driver.find_element_by_xpath(r'/html/body/div[1]/main/div[1]/div[1]/div[4]/div/div[1]/div/div[1]/a[1]').click()

def get_q_score(stock, driver):

    df = pd.DataFrame(columns = ['stock','overall_score','quality', 'momentum','growth','technicals'])
    time.sleep(3)
    overall_score = driver.find_element_by_css_selector(r'.q-factor-total .q-score-bar__grade-label').text
    quality_score = driver.find_element_by_xpath(r'/html/body/div[1]/main/div/div[1]/div[4]/div[2]/div[2]/div[1]/div[2]/div[1]').text

    return print('overall score is '+ overall_score, ' quality score is ' + quality_score)

def main(stock):
    driver = instantiate_chrome()
    print('attempting to get q score for ' + stock)
    search_stock(driver, stock)
    print('found webpage for ' + stock)
    get_q_score(stock, driver)

main('AAPL')

我认为问题是我试图通过 selenium 的 .text 方法抓取文本，但没有要抓取的文本。有什么想法吗？

除了您提到的文字实际上并非如此之外，您走在正确的道路上text. These texts实际上是由一个渲染的CSS属性称为content只能与伪元素一起使用:before and :after。你可以阅读here如果您有兴趣的话，可以了解它是如何工作的。

文本呈现为图标；有时组织这样做是为了避免合理的价值观被忽视scraped。然而，有一种方法（有点困难）可以解决这个问题。使用Selenium and javascript您可以单独定位CSS财产的价值content其中它保存着您所追求的值。

研究了一个小时这是最简单的pythonic获得您想要的值的方法

overall_score = driver.execute_script("return [...document.querySelectorAll('.q-score-bar__grade-label')].map(div => window.getComputedStyle(div,':before').content)") #key line in the problem

代码简单地创建了一个javascript目标代码classes的元素，然后映射div元素的值CSS特性。这会返回一个列表

['"TOP BUY"', '"B"', '"B"', '"B"', '"A"']

值，按以下顺序对应

Q-Factor Score/Quality/Momentum/Growth/Technicals

要访问列表的值，您可以使用for循环和indexing选择值。你可以看到更多相关内容here

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？的相关文章

更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
PySide6.1 与 matplotlib 3.4 不兼容

当我只安装PySide6时 GUI程序运行良好但是一旦我安装了matplotlib及其依赖包包括pyqt5 则GUI程序将无法运行并输出以下错误消息 This application failed to start because no
Pandas 滚动窗口 Spearman 相关性

我想使用滚动窗口计算 DataFrame 两列之间的 Spearman 和或 Pearson 相关性我努力了df corr df col1 rolling P corr df col2 P为窗口尺寸但我似乎无法定义该方法添加meth
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
乘以行并按单元格值附加到数据框

考虑以下数据框 df pd DataFrame X a b c d Y a b d e Z a b c d 1 2 1 3 df 我想在列中附加数字大于 1 的行并在该行中的数字减 1 df 最好应该然后看起来像这样或者它可能看起来
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 Java 在 selenium webdriver 中打开新选项卡或如何使用使用 selenium webdriver 的操作类在 selenium 中按 ctrl +T [重复]

这个问题在这里已经有答案了如何使用 Java 在 Selenium Webdriver 中按 CTRL T 或者如何使用 Java 在 selenium webdriver 中打开新选项卡简单步骤 1 打开google com 不必触
具有屏蔽无效值的 pcolormesh

我试图将一维数组绘制为 pcolormesh 因此颜色沿 x 轴变化但每个 x 的 y 轴保持不变但我的数据有一些错误值因此我使用屏蔽数组和自定义颜色图其中屏蔽值设置为蓝色 import numpy as np import mat
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

jquery 一个滑块控制另一个

如何让一个 jquery ui 滑块控制另一个如果我滑动滑块 1 它也应该滑动滑块 2 创建滑块 1 时提供滑动更改函数该函数使用滑块 1 上正在更改的手柄的 ui value 并设置滑块 2 上的手柄值根据滑块的手柄数量您需要调
强制使用 const 对象的 C++ 类

首先让我问一个一般性问题在我看来 C 是一种语言其目的是提供大量功能为程序员提供最大可能的灵活性以他认为合适的方式做事换句话说它是一种灵活的语言它允许程序员以比我见过的任何其他语言更多的方式表达自己这是正确的吗然后是具体的
static_cast(*this) 和 static_cast(*this) 之间的区别

在下面的代码中取自Effective C class A char operator std size t position now just calls const op return const cast
如何正确调用setListAdapter

我已经搜索了很多如何解决这个问题但没有得到任何结果我需要的唯一帮助是请看一下 stackoverflow 上提出的这个问题和答案这是来自的问题this link 我的活动不扩展 ListActivity 因此此行会引发错误 setL
获取进程/线程的上下文切换次数

出于好奇我想知道我的程序被操作系统切换了多少次上下文就像所有寄存器都被保存并且控制权被传递给另一个进程或线程一样然后一段时间后一切都恢复了我们继续因为它从未发生过系统是否在某个地方维护了这样的数字或者是否存在某种黑客行为或其他
将标签与其各自的字段 Swing 一起排列

我需要将所有字段与相应的标签对齐这是我的代码 public class Progress extends JPanel implements ActionListener public JLabel ClientIP JTextField
错误渲染视图：java.lang.IllegalStateException：已为此响应调用 getOutputStream()

我正在 JSF 和 spring 中创建一个项目其主要目的是在浏览器中生成 PDF 文件一切看起来都很好也生成了 pdf 但在控制台上我遇到了这个异常有人对此有任何想法吗我搜索了一下发现很多人都有这个问题但我没有找到适合我的问
CSS、嵌套 div 和边距与填充

我完全理解盒子模型这个问题更多的是试图确定关于何时使用边距和何时使用填充的语义方法这是一个典型的例子首先用简单的英语来说情况我们有一个容器div 里面有一个段落元素目标在 div 内部和段落外部之间有 12px 的空间选项
C# Windows Universal 10 TopMost 窗口

我正在开发一个 Windows 10 通用应用程序 UWP 是否可以将应用程序设置为 TopMost 始终位于顶部喜欢WPF or Winforms 最上面的属性 Thanks Creators Update 中添加了一项名为 Compa
映射两个列表[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我最近问了一个关于使用apply函数作用于两个列表每
什么 SQL 查询或视图将显示“动态列”

我有一个数据表我允许人们向该表添加元数据我为他们提供了一个界面允许他们将其视为向存储数据的表添加额外的列但实际上我将数据存储在另一个表中 Data Table DataID Data Meta Table DataID MetaNa
CSS 元素恢复默认样式

CSS 中有没有一种快速的方法来删除应用于元素的所有样式例如假设某种选项卡菜单 div class outer div div div div div div div div div CSS 应用 outer foo blee bar
自定义地图功能 - 它是如何工作的？

对于不清楚的主题标题我深表歉意我在计划中有这个函数它是map功能它工作得很好但我在试图理解它时迷失了方向 define my map proc ls letrec iter lambda proc ls0 if null ls0
C++ 使用多个分隔符分解字符串[重复]

这个问题在这里已经有答案了可能的重复 C 中通过多个分隔符将字符串拆分为单词我目前正在尝试读取一个文件其中每行都有不同的制表符和空格用于分隔需要插入二叉树中的关键属性我的问题是如何仅使用 STL 使用多个分隔符分割一行在一天的
document.elementFromPoint(x,y) 获取 iframe 内的元素

我试图获取 html 页面中的元素我使用 document elementFromPoint x y 来检测输入元素当没有 iframe 时它工作正常但在 iframe 内部它在这段代码中不起作用 html如下我错过了什么吗 di
RequireJS 未加载名为“module.js”的文件或模块

我刚刚开始使用 RequireJS 我尝试了一个简单的代码但一种方法有效但另一种方法无效文件夹 script 有 main js module js require js 在 main js 中 requirejs module fu
克隆控件 - C# (Winform) [重复]

这个问题在这里已经有答案了可能的重复是否可以复制某个控件的所有属性 C 窗口窗体我必须创建一些类似于设计时创建的控件的控件创建的控件应该具有与预定义控件相同的属性或者换句话说我想复制一个控件有没有一行代码可以达到这个目的或者
快速屏蔽圆段

I m creating a simple player app There is a circle that shows a progress of playing a song 在 Swift 中绘制这个圆圈并制作蒙版的最佳方法是什么
获取当前类的typedef

我目前正在将 boost intrusive ptr 与我的 GUI 类一起使用虽然这或多或少是一个方便的问题但是否有正确的方法来获取当前类的类型名我问的原因是我有一个用于定义不同指针类型的宏 define INTRUSIVE PTR
Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？

我正在尝试抓取一些元素并返回网页上显示的文本我相信我可以通过 css selectors 和 xpaths 很好地找到元素但我无法返回所需的文本下面是我的程序 from selenium import webdriver from s

Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？

Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？ 的相关文章

随机推荐

热门标签

Python - 从 Selenium 中 ::before 伪元素上的 CSS 属性“content”获取文本？的相关文章