2017年10米分辨率全球土地覆盖产品(FROM-GLC10)Python下载爬虫

2023-11-18

此为2017清华大学地球系统科学系宫鹏教授团队研发的重大成果世界首套“2017年10米分辨率全球土地覆盖产品(FROM-GLC10)”爬虫下载爬虫分享。

一、参考网站
1、 全国各省10米分辨率的土地利用数据的制作与分享
2、世界首套2017年10米分辨率全球土地覆盖产品问世
3、关于地理数据收集与处理的基本工具推荐(2)—10m精度的全球土地覆盖数据下载
4、借助Python爬虫批量下载数据——以NASA和NOAA科研数据为例
5、HTML中tr,th和td的区别
6、tr、td形式的静态网页爬取-以爬取厦门银行理财产品为例(附代码可实现)

二、Python下载脚本

import urllib
from bs4 import BeautifulSoup

rawurl='http://data.ess.tsinghua.edu.cn/fromglc10_2017v01.html'
content = urllib.request.urlopen(rawurl).read().decode('ascii')  #获取页面的HTML
soup = BeautifulSoup(content, 'lxml')
product = soup.find_all('tr')
print(len(product))

# soup中find_all方法寻找源代码中的“tr”A
# 全球有7046个多个文件
urls=[]
for row in product:
    aa = row.find_all('td')[1].find("a").get('href')
    urls.append(aa)

for i,url in enumerate(urls):
    print("This is file "+str(i+1)+" downloading! You still have "+str(len(product)-i-1)+" files waiting for downloading!!")
    file_name = "E:/landuse_2017/"+url.split('/')[-1] #文件保存位置+文件名
    urllib.request.urlretrieve(url, file_name)

三、运行结果
脚本运行提示
下载得到的数据

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

2017年10米分辨率全球土地覆盖产品(FROM-GLC10)Python下载爬虫 的相关文章

  • 使用 Python 编辑 RTF 文件

    也许这是一个愚蠢的问题 但我不明白 所以道歉 我有一个 RTF 文档 我想更改它 例如 有一个表 我想复制一行并以面向对象的方式更改代码中第二行中的文本 我认为 pyparsing 应该是可行的方法 但我摆弄了几个小时但没有明白 我没有提供
  • Python 和 Numpy 是 nan 和 set

    我在使用 Python 的 Numpy set 和 NaN 非数字 时遇到了不可预测的行为 gt gt gt set np float64 nan np float64 nan set nan nan gt gt gt set np flo
  • 在PyGI中获取窗口句柄

    在我的程序中 我使用 PyGObject PyGI 和 GStreamer 在 GUI 中显示视频 该视频显示在Gtk DrawingArea因此我需要获取它的窗口句柄realize 信号处理程序 在 Linux 上 我使用以下方法获取该句
  • 如何为未捕获的异常处理程序编写单元测试

    我有一个函数可以捕获uncaught例外情况 如下 有没有办法编写一个单元测试来执行uncaught exception handler 功能正常 但测试正常退出 import logging def config logger logge
  • 如何调整 matplotlib 单选按钮的大小和纵横比?

    我已经尝试了几个小时来使简单的单选按钮列表的大小和纵横比正确 但没有成功 首先 导入模块 import matplotlib pyplot as plt from matplotlib widgets import RadioButtons
  • Python re无限执行

    我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
  • 将 C++ 指针作为参数传递给 Cython 函数

    cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
  • 检查 python 中命令行参数的数量

    我是蟒蛇新手 还是把脚弄湿了 我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
  • 从 pyspark.sql 中的列表创建数据框

    我完全陷入了有线的境地 现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
  • 使用 Pytest 的参数化添加测试功能的描述

    当其中一个测试失败时 可以在测试正在测试的内容的参数化中添加描述 快速了解测试失败的原因 有时您不知道测试失败的原因 您必须查看代码 通过每个测试的描述 您就可以知道 例如 pytest mark parametrize num1 num2
  • 以类型化内存视图作为成员的结构定义

    目前我正在尝试让一个具有类型化内存视图的结构能够工作 例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图 据我所知 它可以完美地工作 然而 通过内存视图并使用类似的东西 def
  • numpy:高效执行数组的复杂重塑

    我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid M N load data data numpy fromfile file dirname fid dtype numpy dtype i4 convert
  • 如何将 sql 数据输出到 QCalendarWidget

    我希望能够在日历小部件上突出显示 SQL 数据库中的一天 就像启动程序时突出显示当前日期一样 在我的示例中 它是红色突出显示 我想要发生的是 当用户按下突出显示的日期时 数据库中日期旁边的文本将显示在日历下方的标签上 这是我使用 QT De
  • OpenCV 跟踪器:模型未在函数 init 中初始化

    在视频的第一帧 我运行一个对象检测器 它返回对象的边界框 如下所示
  • 为什么在Python解释器中输入_会返回True? [复制]

    这个问题在这里已经有答案了 我的翻译行为非常奇怪 gt gt gt True gt gt gt type True
  • Flask 应用程序路由中的多个参数

    烧瓶怎么写app route如果我在 URL 调用中有多个参数 这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
  • PyInstaller“ValueError:源代码字符串不能包含空字节”

    我得到了一个ValueError source code string cannot contain null bytes执行命令时pyinstaller main py在具有和不具有管理员权限的cmd中 Traceback most re
  • 仅允许正小数

    在我的 Django 模型中 我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然 价格为负或零是没有意义的 有没有办法将小数
  • 在 numpy 中连接维度

    我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说 我想连接中间维度的所有项目 在这种特殊情况下我可以得到这
  • 如何使用xlwt设置文本颜色

    我无法找到有关如何设置文本颜色的文档 在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col

随机推荐

  • IIS7解析漏洞复现

    首先我们在win7上安装IIS7 控制面板 程序 打开或关闭windows功能 勾选如下信息 尽量勾选多一点防止实验失败 点击确定 稍等 在windows7虚拟机安装phpstudy2018版本 可先在物理机下载压缩包 然后上传到虚拟机 然
  • 工程职业伦理_Mooc_2018_期末考试答案

    1 直接在浏览器中在此页面按下ctrl F打开搜索框 2 复制原题目的部分 全部 3 在此页面的搜索框中粘贴复制的内容 即可直接找到此题目 加粗字体为正确答案 直接复制过来的 格式不太好看 单选题 1 1分数 当工程风险产生的不利后果比较严
  • delphi listview动态添加图片_南通启东【长泰海滨城】售楼处电话-位置-价格-开盘时间-最新动态【官网】...

    南通启东 长泰海滨城 售楼处电话 位置 价格 开盘时间 最新动态 官网 2020 10 29 14 38 来源 搜狐焦点淮北站 原标题 南通启东 长泰海滨城 售楼处电话 位置 价格 开盘时间 最新动态 官网 南通启东 长泰海滨城 售楼中心
  • 05笔趣阁小说爬取--爬取作者所有小说

    前面的程序已经实现了从笔趣阁自动爬取整部小说 接下来在之前的基础上 将功能进一步扩展 实现自动爬取某一作者在笔趣阁中的所有小说 继续以方想为例 下图是方想作品列表的页面 https www 52bqg com modules article
  • 伺服怎么接单相220伏_220v电表怎么接线?如何接单相电表?普通家用电表怎么接线...

    以下文章来源于电工电气学习 作者 电工电气学习 单相有功电度表 简称 单相电度表 由接线端子 电流线圈 电压线圈 计量转盘 计数器构成 只要电流线圈通过电流 同时电压线圈加有电压 转盘就受到电磁力而转动 单相电度表共有5个接线端子 其中有两
  • 如何把桌面显示的文件都放在D盘

    1 改目录 具体如下 先在d盘建一个文件夹 然后点开始 运行 regedit 点击HKEY CURRENT USER Software Microsoft Windows CurrentVersion Explorer user Shell
  • leetcode 34. 在排序数组中查找元素的第一个和最后一个位置

    虽然只是一道中等难度的题目 但是看了官方的解答 有很精彩的地方 但是总体代码写得不算优雅 class Solution returns leftmost or rightmost index at which target should b
  • 使用 mock 模拟登录接口数据

    mock js模拟登录接口 第一步 打开apipost 通过mock服务来进行编写登录接口 选择为mock环境 第二步 编写自己的登录接口 apipost支持 req body对象 当 post 请求以 x www form urlenco
  • SpringSecurity+JWT认证流程解析

    楔子 本文适合 对Spring Security有一点了解或者跑过简单demo但是对整体运行流程不明白的同学 对SpringSecurity有兴趣的也可以当作你们的入门教程 示例代码中也有很多注释 大家在做系统的时候 一般做的第一个模块就是
  • 【内外网映射】通过外网ip来访问虚拟机服务器【原创】

    经试验 可以通过外网访问家里笔记本win 7里面的虚拟机vmvare的Ubuntn服务器 比如用手机来访问笔记本电脑的虚拟机的服务器等 注意 win 7的ip地址和虚拟机的ip地址的网段是不一样的 特别注意 只适用于公网ip是固定的 不固定
  • 一看就懂的ReactJs入门教程-精华版

    现在最热门的前端框架有AngularJS React Bootstrap等 自从接触了ReactJS ReactJs的虚拟DOM Virtual DOM 和组件化的开发深深的吸引了我 下面来跟我一起领略ReactJs的风采吧 文章有点长 耐
  • Dbeaver 修改SQL编辑器字体

    Dbeaver 版本 23 1 0 字体链接 YaHei Consolas Hybrid 1 12 YaHei Consolas Hybrid 1 12 如何换字体 窗口 gt 首选项 gt 用户界面 gt Appearance gt Co
  • 30数据类型检测

  • Mysql数据库Sql优化

    1 选择合适的字段属性 mysql中表越小 查询速度越快 所以 我们在创建表时 字段尽可能的设置最小 如果可以的话 可以用MEDIUMINT而不是BIGIN来定义整型字段 应该尽量把字段设置为NOTNULL 这样在将来执行查询的时候 数据库
  • 华为OD机试真题- 书籍叠放-2023年OD统一考试(B卷)

    题目描述 书籍的长 宽都是整数对应 l w 如果书A的长宽度都比B长宽大时 则允许将B排列放在A上面 现在有一组规格的书籍 书籍叠放时要求书籍不能做旋转 请计算最多能有多少个规格书籍能叠放在一起 输入描述 输入 books 20 16 15
  • mybatis之foreach用法

    在做mybatis的mapper xml文件的时候 我们时常用到这样的情况 动态生成sql语句的查询条件 这个时候我们就可以用mybatis的foreach了 foreach元素的属性主要有item index collection ope
  • 选择器函数querySelector和querySelectorAll

    选择器是Css非常强大的功能 早先一般是通过getElementById和getElementsByTagName来获取页面元素 在一些场景下就很不方便 后来DOM扩展出了Selector API标准 其中 Selector API Lev
  • 移植uboot-支持yaffs烧写,打补丁

    1 修改uboot支持yaffs 首先 每个命令都会对应一个文件 比如nand命令对应的common cmd nand c 而我们使用nand命令时 便会进入do nand 函数 位于common cmd nand c 1 1do nand
  • 产品经理的思考-ChatGPT的影响

    最近ChatGPT的不断升温 公司开始全面布局和应用人工智能 本以为今年的赋智会有个过渡过程 没想到来的这么凶猛 随着应用的深入 越来越多的开始了灵魂质问 随着大模型的不断深入应用 什么职位会被取代 我们应该如何与ChatGPT共存 Cha
  • 2017年10米分辨率全球土地覆盖产品(FROM-GLC10)Python下载爬虫

    此为2017清华大学地球系统科学系宫鹏教授团队研发的重大成果世界首套 2017年10米分辨率全球土地覆盖产品 FROM GLC10 爬虫下载爬虫分享 一 参考网站 1 全国各省10米分辨率的土地利用数据的制作与分享 2 世界首套2017年1