我如何使用 python 从 flashscore 中抓取足球结果

2023-12-09

网页抓取 Python

'我是刮擦新手。我想抓取英超联赛 2018-19 赛季结果（赛程、结果、日期），但我很难浏览该网站。我得到的只是空列表/[无]。如果您有可以分享的解决方案，这将是一个很大的帮助。 '

“这就是我尝试过的。”

'''

import pandas as pd
import requests as uReq
from bs4 import BeautifulSoup

url = uReq.get('https://www.flashscore.com/football/england/premier-league-2018-2019/results/')

soup = BeautifulSoup(url.text, 'html.parser')

divs = soup.find_all('div', attrs={'id': 'live-table'})

Home = []
for div in divs:
    anchor = div.find(class_='event__participant event__participant--home')
    
    Home.append(anchor)
    
    print(Home)

'''

你必须安装requests_html对于我的解决方案。

我将这样做：

from requests_html import AsyncHTMLSession
from collections import defaultdict
import pandas as pd 


url = 'https://www.flashscore.com/football/england/premier-league-2018-2019/results/'

asession = AsyncHTMLSession()

async def get_scores():
    r = await asession.get(url)
    await r.html.arender()
    return r

results = asession.run(get_scores)
results = results[0]

times = results.html.find("div.event__time")
home_teams = results.html.find("div.event__participant.event__participant--home") 
scores = results.html.find("div.event__scores.fontBold")
away_teams = results.html.find("div.event__participant.event__participant--away")
event_part = results.html.find("div.event__part")


dict_res = defaultdict(list)

for ind in range(len(times)):
    dict_res['times'].append(times[ind].text)
    dict_res['home_teams'].append(home_teams[ind].text)
    dict_res['scores'].append(scores[ind].text)
    dict_res['away_teams'].append(away_teams[ind].text)
    dict_res['event_part'].append(event_part[ind].text)

df_res = pd.DataFrame(dict_res)

这会生成以下输出：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

webscraping

beautifulsoup

pythonrequests

我如何使用 python 从 flashscore 中抓取足球结果的相关文章

Cython 中固定大小的字节串序列

我是 Cython 的新手对 C 的经验很少所以请耐心等待我想存储固定大小的不可变字节对象序列该对象看起来像 obj b abc b 1234 b 元组中的元素是不可变的但它们的长度是任意的我尝试的是以下内容 cdef char
在数据库中插入具有相同组合框的 2 个函数的字段。仅保存第一个函数的数据

我有一个用 tkinter 制作的数据库管理器我在其中插入和保存数据它工作正常一切正确它正确保存一切我尝试添加新插入这就是我遇到问题的地方但是我无法从同一组合框添加新的字段插入即同一组合框插入 2 个内容我用2个不同的c
使用请求登录具有 javascript 登录表单的网站

首先我要说的是我的编程经验很少在过去几天尝试编写这个程序时我学到了很多东西我正在 Windows 7 上使用 PyCharm requests Beautiful Soup 和 lxml 运行 Python 2 7 我正在尝试从一个严
如何在 Python 中以列表形式返回字典键？

使用Python 2 7 我可以获得字典keys values or items as a list gt gt gt newdict 1 0 2 0 3 0 gt gt gt newdict keys 1 2 3 使用 Python gt
从Python请求ConnectionError获取Errno？

我可以通过以下方式捕获并打印 Python Requests ConnectionErrors except requests exceptions ConnectionError as e logger warning str e mes
在 Python 3 中调用 super() 的 4 种方法中，使用哪一种？

我想知道什么时候使用 Python 3 的什么风格super http docs python org py3k library functions html super Help on class super in module buil
将 cookies.txt 文件与 Python 请求结合使用

我正在尝试使用访问经过身份验证的网站cookies txt带有 Python 请求的文件使用 Chrome 扩展生成 import requests cookielib cj cookielib MozillaCookieJar cook
从'_io.BytesIO'转换为python3.6中的类似字节的对象？

我使用此函数来解压缩 HTTP 响应的正文如果它是使用 gzip compress 或 deflate 压缩的 def uncompress body self compression type body if compression t
如何在 Django 模型中使用枚举作为选择字段？

我有一个模型类我希望其中两个字段成为选择字段因此为了填充这些选择我使用了如下列出的枚举 models py class Transaction models Model transaction status models CharFi
Pandas：根据除一行之外的其他多级列对最里面的列进行分组排序

这是我的扩展previous question https stackoverflow com questions 65021214 pandas sort innermost column group wise based on othe
使用 CSS 选择器和 BeautifulSoup 获取属性值

我正在抓取网页Python并使用BeutifulSoup library I have HTML像这样的标记 tr class deals span class hotel name a href www example2 com a sp
beautiful soup有没有办法计算html页面中标签的数量

我正在考虑在 python 中创建一个字典其中键是 html 标签名称值是标签出现的次数有没有办法用漂亮的汤或其他东西来做到这一点 BeautifulSoup 非常适合 HTML 解析您当然可以将它用于此目的这将非常简单 from
Python 中的 Hello World [重复]

这个问题在这里已经有答案了我尝试运行一个 python 脚本 print Hello World 我收到此错误 File hello py line 1 print Hello World SyntaxError invalid synt
导入父目录进行简单测试

我从上到下搜索了这个网站但还没有找到一种方法来真正实现我在 Python3x 中想要的东西这是一个简单的玩具应用程序所以我想我可以在断言中编写一些简单的测试用例然后就到此为止了它确实会生成报告等因此我想确保我的代码在更改时不会做
如何在不使用太多内存的情况下打乱大型 csv 文件的行并将结果写入新的 csv 文件？

因此如果我有一个 csv 文件如下所示 User Gender A M B F C F 然后我想编写另一个 csv 文件其中行像这样打乱作为示例 User Gender C F A M B F 我的问题是我不知道如何随机选择行并确保
如何在不重复代码的情况下定义 randint 元组？

我经常使用 randint 元组来表示颜色值等 a b c randint 0 255 randint 0 255 randint 0 255 当我认为必须有更好的方法时有吗使用numpy 1 import numpy as np tu
导入错误：无法导入名称 DependencyWarning

我正在使用 python 2 7 12 当我做import requests 我看到下面的错误尝试卸载和安装 requests 也升级 pip 但没有运气仍然是同样的问题 Python 2 7 12 default Nov 19 201
在 MACOSX 上找不到“Python.h”文件，如何解决这个问题？

pip3 安装 PyAudio 0 2 12默认为用户安装因为普通站点包不可写收集PyAudio 0 2 12 使用缓存的 PyAudio 0 2 12 tar gz 42 kB 安装构建依赖项完成获取建造轮子的要求完成准备元数
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page

随机推荐

关于 torch.nn.DataParallel 的问题

我是深度学习领域的新手现在我正在复制一篇论文的代码因为他们使用多个 GPU 所以有一个命令torch nn DataParallel model device ids args gpus cuda 在代码中但我只有一个GPU 什么我
解决 IE7 bug“input type=file”onchange 触发两次？

你有没有遇到过这个IE7的bug
将 Silverlight 连接到本地计算机的 COM 端口

我一直在寻找一种方法让我的 silverlight 应用程序与本地计算机上的 COM 端口进行通信有没有人能够让 Silverlight 成功连接到本地计算机的 COM 端口如果是这样你能指出我的文档吗 Silverlight 无法做
java中12小时制到24小时制的转换

在我的应用程序中我需要格式化12 hours时间到24 hours时间我必须使用什么方法例如像这样的时间10 30 AM java中如何转换为24小时时间尝试这个 import java text SimpleDateFormat
导入 RealmSwift 不再使用 CocoaPods 工作

RealmSwift 的 CocoaPods 安装克鲁赫森受到推崇的here 或者也可以从realm io页面推荐here 基本上可以工作但是我使用 Swift 0 92 3 的应用程序中仍然存在一个问题以下导入不再被识别 import
Android 黑屏前的启动画面

我想在 onCreate 方法中初始化所有内容时显示启动屏幕但我需要将内容绘制到屏幕上的组件也在初始化因此当我启动应用程序时和 onCreate 之后会出现黑屏方法已完成然后仅绘制第一个屏幕我想要一个闪屏而不是黑屏这是我在 on
线程“main”中的异常 java.lang.NoClassDefFoundError: org/apache/http/ConnectionReuseStrategy:

我正在尝试使用 Eclipse 在 Maven 项目中作为 Java 应用程序运行但出现以下运行时错误错误如下所示线程 main java lang NoClassDefFoundError 中出现异常 org apache http
使用PHP邮件通过smtp发送

有谁知道是否可以配置 php 的 mail 命令使其仅使用 SMTP 服务器而不是本地 sendmail 我们在电子邮件被标记为垃圾邮件时遇到了麻烦我们的服务器运行的是 RedHat 5 Enterprise 我知道有多种 PHP 库充
在模板外部重载模板类的输出流运算符

我想重载输出流运算符 lt lt 在模板类定义之外在模板类中实现它就可以了 template
CS5001 程序不包含适合入口点的静态“Main”方法

我是 C 新手如果有人可以告诉我为什么代码显示以下错误我将不胜感激 CS5001 程序不包含适合入口点的静态 Main 方法 using System class test void Foo int x Console WriteLin
VBA：循环遍历行，如果满足条件则对某些行求和

我在学习 VBA 的同时已经使用论坛几个星期了但现在我陷入困境需要帮助所以这是我的问题我有一本工作簿里面有几个工作表为简单起见我们假设我有两个工作表一份包含大量原始数据材料另一份格式精美将作为接收表原始数据表如下所示
我可以将 javascript 模块与“常规”javascript 混合使用吗？

我有一个页面设置它引用了几个 javascript 文件并在页面中内联了一些 javascript 这是在加载页面时生成的其中一个 JavaScript 文件包含来自第三方库的类另一个 javascript 文件包含与页面相关的各种
Go 中的接口是如何表示的？

我现在正在阅读两篇文章有点困惑本文 http blog golang org laws of reflection says gt var r io Reader tty err os OpenFile dev tty os O RDW
C# 4.0 可选 out/ref 参数

C 4 0 是否允许可选out or ref论据 No 解决方法是使用另一种方法重载doesn t有 out ref 参数并且它只调用您当前的方法 public bool SomeMethod out string input new o
在视图中滚动时，recyclerView 不会调用 onBindViewHolder

这是注意到的启动时数据项索引 0 1 5 将显示在视图中并看到 onCreateViewHolder 和 onBindViewHolder 被调用然后滚动出顶部项目看到 onCreateViewHolder 和 onBindVie
通过VBA解析Json数组

我从 api 获取 json 响应并解析它以在 Excel 中更新下面是代码我无法进一步解析以获取价格信息 Dim strResult As String Dim objHTTP As Object Dim URL As String
Youtube-API：上传二进制字幕文件 (ebu-stl)

YouTube 支持一些二进制字幕文件格式例如 ebu stl 我有一个 stl 文件当我通过 Web 界面上传它时它可以正常上传和处理但是当我尝试使用 POST 请求通过 API v2 上传它时它似乎无法正确识别文件格式 PO
$.mobile 未定义（Worklight + jQuery Mobile）

我有主要的html
IScroll 包装器没有获得高度

我有以下代码 div height 100 div class homebutton zeile a href pictures div class homebutton all div class homebutton name Pict
我如何使用 python 从 flashscore 中抓取足球结果

网页抓取 Python 我是刮擦新手我想抓取英超联赛 2018 19 赛季结果赛程结果日期但我很难浏览该网站我得到的只是空列表无如果您有可以分享的解决方案这将是一个很大的帮助这就是我尝试过的 import pandas

我如何使用 python 从 flashscore 中抓取足球结果

网页抓取 Python

我如何使用 python 从 flashscore 中抓取足球结果 的相关文章

随机推荐

热门标签

我如何使用 python 从 flashscore 中抓取足球结果的相关文章