WGET 从网站下载 pdf 时出现问题

2024-04-03

我正在尝试从此网站下载所有 pdf 和 ppt:http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides

我在 Cygwin 中这样做:

wget --no-parent -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides

但没有下载任何文件。

我需要在上面的 wget 命令中更改什么才能使其工作?


需要使用-e robots=off代码,所以这有效

wget -e robots=off -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides

一般来说,使用 --debug 标志可以获得更多帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

WGET 从网站下载 pdf 时出现问题 的相关文章

  • 无法建立 SSL 连接,如何修复我的 SSL 证书?

    我试图wget到我自己的盒子 它不能是 wget 中的内部地址 另一位开发人员是这么说的 当我得到时 我得到这个 wget http example com 2013 03 01 15 03 30 http example com Reso
  • 在从管道执行的 bash 脚本中使用 read -p

    我提前道歉 我没有完全理解我所要求的背后的想法 无法理解为什么它不起作用 我不知道我需要学什么 我首先在堆栈交换中搜索答案 我发现了一些似乎可能相关的信息 但没有很好地解释这些概念 以至于我无法理解如何构建可行的解决方案 我一直在谷歌上搜索
  • 使用 wget 和 SFTP 获取文件 [关闭]

    Closed 这个问题是无关 目前不接受答案 大家好 我每天晚上在 Linux 服务器上运行一个脚本 该脚本打算使用 wget 和 ftp 协议从另一个服务器获取文件 这些文件位于无法通过 HTTP 访问的文件夹下 这是使用的命令行 wge
  • 如何使用 Objective C 在 iOS 上本地下载并保存文件? [复制]

    这个问题在这里已经有答案了 我是 Objective C 的新手 我想从网络下载一个文件 如果它在网络服务器上更改 并将其保存在本地 以便我的应用程序可以使用它 主要是我想实现什么wget timestamp
  • 通过 XMLStarlet 取消与符号 (&) - Bugging &

    这是一个相当烦人但更简单的任务 根据这个guide 我写了这个 bin bash content wget https example com O ampersand echo xmllint html xpath id table tbo
  • Google抓取503服务不可用

    当我在服务器上使用 wget curl 或 python 抓取 google 搜索引擎时 遇到了一个非常奇怪的问题 Google 将我重定向到以以下内容开头的地址 ipv4 ipv6 google fr sorry IndexRedirec
  • 如何检查是否有 wget 实例正在运行

    我有这个 php 脚本 每次调用时都会运行 wget 的 fork 进程 wget http myurl id insert id O images insert id gt dev null 2 gt 1 但是我如何检查是否已经有一个 w
  • 相当于给定 wget 命令的 Python

    我正在尝试创建一个与 wget 命令执行相同操作的 Python 函数 wget c read timeout 5 tries 0 URL c 如果下载中断 则从上次中断的地方继续 read timeout 5 如果超过 5 秒没有新数据传
  • wget:检查文件时间戳并覆盖[关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我怎样才能得到wget去做这个 从某个位置下载文件x 仅当文件的本地副本的时间戳早于该文件的时间戳时x 这意味着 仅当存在文件的较新版本时 它才应从给
  • wget 破坏了内容配置

    我正在尝试从以下网站下载通过 Content Disposition attachment 发送的 kml 文件 http waterwatch usgs gov index php m real w kml r us regions ia
  • wget :在发送后数据之前获取字段信息

    我使用 wget 以及 post data 和 save cookies 选项成功地通过了网站的登录表单 现在我尝试填写网页的某些字段 然后提交 问题是 网页上有一个 图灵 隐藏字段 每次都有不同的值 我尝试的是打开网页 加载我的cooki
  • wget 未被识别为内部或外部命令

    我正在开发一个程序 当我进行新的开发并添加新的补丁时 它会自动更新我的游戏 当我运行补丁更新时 它无法将 wget 识别为内部或外部命令 游戏 Checkforupdates cls cd C AirlineSim echo Checkin
  • wget ssl 警报握手失败

    我尝试从 https 站点下载文件并不断收到以下错误 OpenSSL error 14077410 SSL routines SSL23 GET SERVER HELLO sslv3 alert handshake failure Unab
  • 谷歌 Colab 上的 RVL-CDIP 数据集

    我正在尝试使用以下命令在 google colab 上下载 RVL CDIP 数据集 wget load cookies tmp cookies txt https docs google com uc export download co
  • 如何在Dockerfile中下载并解压

    所以 我有 它有效 但我想改变立即下载文件并解压它的方式 Dockerfile FROM wordpress fpm Copying themes from local COPY wordpress var www html wp cont
  • 无法在 Ubuntu 14.04 LTS 上的 wget 上建立 SSL 连接

    我尝试通过 wget 下载图像 但出现错误 无法建立 SSL 连接 wget https www website com image jpg 2015 02 26 01 30 17 https www website com image j
  • 将二进制文件转换为图像

    我需要找到一种将二进制文件转换为图像的快速方法 二进制文件由 N 个NN 矩阵 我想将 0 与一种颜色关联 将 1 与另一种颜色关联 我需要对超过 1000 个二进制文件执行此操作 如果可能的话 我想避免使用 MatLab 有没有任何工具
  • 如何更改使用 wget 下载的文件的文件名?

    我正在下载一个文件www examplesite com textfile txt 当运行以下命令时 wget www examplesite com textfile txt 文件另存为textfile 我怎样才能将其另存为newfile
  • 有没有办法以编程方式下载网页的部分内容,而不是整个 HTML 正文?

    我们只需要 nytimes com technology 上的 HTML 文档中的特定元素 该页面包含许多文章 但我们只想要文章的标题 该标题位于 如果我们使用 wget cURL 或任何其他工具或某些包 例如Python 中的请求 htt
  • 如何wget目录中最新的文件

    我想编写一个 bash 脚本来下载并安装最新的每日构建程序 RStudio 是否有可能使wget仅下载目录中最新的文件http www rstudio org download daily desktop http www rstudio

随机推荐

  • NLTK 关系提取不返回任何内容

    我最近正在研究使用 nltk 从文本中提取关系 所以我构建了一个示例文本 汤姆是微软的联合创始人 并使用以下程序进行测试并且不返回任何内容 我不明白为什么 我使用的NLTK版本 3 2 1 python版本 3 5 2 这是我的代码 imp
  • 使用 SSL 和 SslStream 进行点对点身份验证?

    我需要在使用 TCP IP 套接字进行通信的各个进程之间提供安全通信 我想要身份验证和加密 我真的很想使用 SSL 和 SslStream 类以及自签名证书 而不是重新发明轮子 我想要做的是根据本地应用程序中的已知副本验证远程进程的证书 不
  • 使用 Notepad++ 删除 @ 之前少于 5 个字符的行

    可能标题99 都看不懂 我有这样的 abc 5004428 abcd 62604 abcde 505779 但我的文件比这个大 所以 我想删除包含 abc 和 abcd 的整行 因为它们在 之前 并且它们短于5个或不相等的字符 更多解释 我
  • strsplit 并保留第一个下划线之前的部分

    我想保留第一个下划线之后的部分 请参阅示例代码 colnames df EGAR00001341740 P32 1 EGAR00001341741 PN32 我尝试过 但没有给出P32 1但只有P32这是错误的 sapply strspli
  • IPython 中带多个参数的并行映射函数

    我正在尝试使用 IPython 的并行环境 到目前为止 它看起来很棒 但我遇到了问题 假设我有一个在库中定义的函数 def func a b 当我想要评估 a 的一个值和 b 的一组值时 我会使用它 func myA b for b in
  • 一起使用 django-storages 和 django-compressor 时尝试压缩静态文件时出错

    我已经设置了一个 AWS S3 存储桶 以便使用应用程序 django storages 在远程 CDN 中传输静态文件 一切都工作正常 直到我尝试使用 django compressor 上传到 S3 之前压缩静态文件 我已经根据 dja
  • 通过 Poetry 中的 bash 命令输出确定要安装的软件包版本

    我正在尝试通过 Poetry 安装一个 Python 包 其安装版本应根据 Bash 命令的输出 返回值 确定 是否有可能做某事 在pyproject toml 大致如下 tool poetry dependencies python 3
  • jquery mobile 更改为下一个和上一个 data-role=page

    我在我的项目中使用 jquery mobile 并且我尝试使用滑动效果 使用两个按钮更改到下一个和上一个 data role page 我正在尝试使用这个 JavaScript 但我不知道为什么不起作用 感谢您的帮助 HTML div di
  • Spring 中的自定义身份验证

    我有个问题 在 Struts 中 我有一个处理用户身份验证的操作 即 我获取用户的凭据并使用 DAO 来验证用户凭据 我想在 Spring 中保持相同的设置 我正在使用 Spring 3 0 3 RELEASE 我的问题是 我已经阅读了 S
  • com.android.ddmlib.InstallException:EOF

    我正在使用 Android Development Toolkit 版本 16 0 1 v201112150204 238534 和库 Android 4 0 3 编译后 模拟器启动 几分钟后无法启动 当我尝试启动时 从控制台收到以下消息
  • ADFS(3.0)与iPad应用程序集成以实现SSO实施

    我在用ADAL SDK https github com AzureAD azure activedirectory library for objc https github com AzureAD azure activedirecto
  • java.lang.NoClassDefFoundError: android.security.MessageDigest

    在我的应用程序中我使用MessageDigest getInstance SHA 1 获取SHA1 在android 2 3中可以成功运行 但在android 4 0中无法运行 并且会显示以下异常 FATAL EXCEPTION main
  • Docker远程错误:tls:握手失败

    我安装了 Docker 版本 Docker version 19 03 8 build afacb8b 当我尝试使用 docker pull 命令时 例如通过 PowerShell 和 Windows 中的管理权限 docker pull
  • 可能的 Spring Boot 或 Spring Security 内存泄漏

    我一直在浸泡测试下运行带有 Spring Security 的 Spring Boot 应用程序 发现它逐渐填满了内存分配 我用以下命令启动了应用程序 java Xmx128m XX PrintGCDetails XX PrintGCTim
  • Appengine 网站的架构指南?

    我使用 PHP 创建了难以维护的网站 因为它很容易做一些又快又脏的事情 我不想在 Google 的 appengine 上使用 Python Django 做同样的事情 使用 Django 和 appengine 创建网站有什么好的架构参考
  • YTPlayerView 加载视频列表

    我正在尝试在我的应用程序上播放 Youtube 视频 我在用YTPlayerView用于按视频 ID 播放视频的库 问题是 当我尝试播放视频播放器列表时 显示错误 发生错误 请稍后再试 播放 ID someid 我使用以下代码来播放单个视频
  • 无法挂载内存cgroup

    我尝试使用以下命令挂载内存 cgroup sudo mount t cgroup none sys fs cgroup memory o memory 我收到错误 mount sys fs cgroup memory wrong fs ty
  • 如何在 JavaScript 中查找对象数组中的值?

    我有一个对象数组 Object 1 name bob dinner pizza 2 name john dinner sushi 3 name larry dinner hummus 我希望能够在对象 数组中搜索键为 晚餐 的位置 并查看它
  • Tomcat 的未知版本被指定为 8.0.24 / Eclipse 4.4.2 (Luna)

    几个月前 我下载并解压了 tomcat 8 0 24 它运行得很好 我做了一些测试 在记事本中创建 servlet 用 javac exe 编译并放置在 webapps 中 有效 我的 Eclipse 版本是 4 4 2 称为 Luna 我
  • WGET 从网站下载 pdf 时出现问题

    我正在尝试从此网站下载所有 pdf 和 ppt http mlss2011 comp nus edu sg index php n Site Slides http mlss2011 comp nus edu sg index php n