parsedhtml 不再响应

2023-12-11

因此,我尝试从网站获取一些文本,一旦我尝试使用 ParsedHtml 返回对象,powershell 就会停止响应(即使我让它在后台运行几分钟,它也不会再执行任何操作)。 造成这种情况的原因是什么?

PS P:\> $url = "mywebsite"
PS P:\> $result = invoke-WebRequest $url
PS P:\> $result | Get-Member

TypeName: Microsoft.PowerShell.Commands.HtmlWebResponseObject

Name              MemberType Definition
----              ---------- ----------
Dispose           Method     void Dispose(), void IDisposable.Dispose()
Equals            Method     bool Equals(System.Object obj)
GetHashCode       Method     int GetHashCode()
GetType           Method     type GetType()
ToString          Method     string ToString()
AllElements       Property               
Microsoft.PowerShell.Commands.WebCmdletElementCollection AllElements {get;}
BaseResponse      Property   System.Net.WebResponse BaseResponse {get;set;}
Content           Property   string Content {get;}
Forms             Property           
Microsoft.PowerShell.Commands.FormObjectCollection Forms {get;}
Headers           Property           
System.Collections.Generic.Dictionary[string,string] Headers {get;}
Images            Property   
Microsoft.PowerShell.Commands.WebCmdletElementCollection Images {get;}
InputFields       Property   
Microsoft.PowerShell.Commands.WebCmdletElementCollection InputFields {get;}
Links             Property       
Microsoft.PowerShell.Commands.WebCmdletElementCollection Links {get;}
ParsedHtml        Property   mshtml.IHTMLDocument2 ParsedHtml {get;}
RawContent        Property   string RawContent {get;set;}
RawContentLength  Property   long RawContentLength {get;}
RawContentStream  Property   System.IO.MemoryStream RawContentStream {get;}
Scripts           Property       
Microsoft.PowerShell.Commands.WebCmdletElementCollection Scripts {get;}
StatusCode        Property   int StatusCode {get;}
StatusDescription Property   string StatusDescription {get;}

PS P:\> $result.ParsedHtml | Get-Member

然后程序在最后一个命令后冻结。 弹出一个窗口询问我是否允许在我的电脑上保存cookie,但单击“是”或“否”都没有任何帮助。 这可能是什么原因造成的?

$result.RawContent

例如工作得很好并打印出所有的 html 文本,但没有 getelementsby-Method,我猜它在 ParsedHtml 中,因此为什么我需要它..它可以在 youtube 上工作,但在我想要的特定网站上检查它是否冻结。 任何帮助是极大的赞赏!


From learn.microsoft.com 上的 Invoke-WebRequest 参考页面:

该参数已被弃用。从 PowerShell 6.0.0 开始, 所有 Web 请求仅使用基本解析。包含此参数 仅用于向后兼容,任何使用它都不会影响 cmdlet 的操作。

以及 MS 工作人员评论的更详细解释PowerShell Github 存储库问题 #2867:

Windows PowerShell 依赖 Internet Explorer 来解析 html。 由于 Internet Explorer 在我们支持的大多数平台上不可用 使用 PowerShell Core 6(nanoserver、Linux、macOS),有意义 默认为-UseBasicParsing。 @MSAdministrator 的建议 ConvertFrom-Html 是一个更好的解决方案,而不是与解析结合 Web cmdlet 的功能(例如解析本地 html 文件)。 然后: 社区似乎已经通过 PowerShellGallery 上的模块来帮助填补这一空白,以专门处理解析 html。

今天似乎没有 ConvertFrom-Html,所以我猜你的选择是:提供解析的 PowerShell Gallery 模块,或者下面是有限的替代方案。看起来他们不会为您提供 ParsedHTML 属性本身,但它们确实为您提供了一些可遍历/结构化的内容might服务于您的目的:

https://stackoverflow.com/a/53878303/537243

在非常非常有限的情况下,您可以尝试使用“html 是 xml 的子类型”的方式,但是 xml 解析器会因 html 中允许的许多语法“偏差”而感到困惑并失败,因此源代码必须非常有规律且非常普通:

$webresponse = Invoke-WebRequest -Uri "https://w3.org"
$xmldoc = [xml]$webresponse.Content
write-output $xmldoc.html.body.div[0].div.h1.span |select '#text'
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

parsedhtml 不再响应 的相关文章

  • 如何强制网络浏览器不缓存图像

    背景 我正在为两个公益网站编写并使用一个非常简单的基于 CGI Perl 的内容管理工具 它为网站管理员提供了事件的 HTML 表单 他们可以在其中填写字段 日期 地点 标题 描述 链接等 并保存 在该表格上 我允许管理员上传与该活动相关的
  • 方向改变后的javascript最大视口高度Android和iOS

    目标 查找设备的最大视口高度 包括设备的空间address bar这样我们就可以动态调整 min body 的大小并将内容向上推 问题 移动浏览器处理方向状态的方式不同 方向变化时更新 DOM 属性的方式也不同 使用 JavaScript
  • 粉碎一个元素,向随机方向发送碎片

    我试图 粉碎 一个元素 例如 一个图像 并将其碎片朝随机方向飞行 当碎片到达目的地时 即x距离 以像素为单位 它们变成原始图像的较小版本 jQuery UI 的explode http api jqueryui com explode ef
  • 元素在主体内找不到足够的空间 - JavaScript 样式

    相关信息 该页面包含两个元素 An
  • jQuery 如何通过不同的列值计算表中的行数

    如何按表列计算不同的表行 Example table thead tr th NAME th th TECHNOLOGY th tr thead tbody tr td john td td jQuery td tr tr td mark
  • Firefox 和 Chrome 为 offsetTop 提供了不同的值

    我试图相对于输入字段定位一个跨度元素 让我们称之为 工具提示跨度 为此 我将工具提示跨度和输入字段包装在另一个跨度元素中 我们称之为 包装器跨度 该元素具有position relative 然后我设置position absolute在工
  • Modernizr 未将类应用于 html 标签

    我目前正在构建一个网站 我需要使用 Modernizr 但由于某种原因 它没有将类应用到 html 标签 因为它应该 我的代码如下所示
  • 如何从 HTML 中的列数据而不是行数据创建表格?

    根据这篇文章W3学校 http www w3schools com html html tables asp 可以像这样在 HTML 中创建一个基本表格 table border 1 tr td row 1 cell 1 td td row
  • Powershell - 从图像网址下载图像

    对 powershell 的了解有限 我尝试从图像网址下载图像 例如这样 http hdwallpaperia com wp content uploads 2014 01 Mc Laren P1 Wallpaper Image Pictu
  • Bootstrap - 为反向行模式创建移动自适应

    我想用 Bootstrap 创建一个反向效果 第一行 左边是文字 右边是图像 第二行 左边是图片 右边是文字 第三行 左边是文字 右边是图片 第四行 左边是图片 右边是文字 而且这种情况一直持续下去 它在大型设备上看起来非常漂亮 但当它在设
  • Firefox 页面源中的红色字体

    我一直在摆弄我的元描述 试图通过显示数据库中的相关数据来使它们更加独特 但是当我在 Firefox 中右键单击并显示页面源代码检查元描述时 元描述标签呈红色 让我觉得我犯了某种错误 红色文字通常代表什么意思 如果您将鼠标悬停在该红线上 Fi
  • HTML5 安卓开发

    我对制作 Android 应用程序很感兴趣 而我的主要爱好是 Web 开发 现在让我困惑的是 人们用 HTML5 CSS3 JavaScript 语言制作应用程序 这些应用程序是在 Android 手机上的网络浏览器上运行还是像 Andro
  • jQuery mouseover 显示隐藏的 div 并显示 div(如果鼠标仍在 div 上)

    我的鼠标悬停和鼠标移出功能有问题 当我将鼠标悬停在链接上时 它会显示隐藏的 div 当我将鼠标移出 div 时 它会隐藏该 div 问题是 如果我将鼠标悬停在链接上 然后将鼠标移动到不在 div 上方的其他位置 div 不会消失 如果我使用
  • 当按下 html 键盘按钮时,将文本添加到输入字段(具有焦点的字段)

    我使用 HTML 创建了一个屏幕键盘 div and a 标签 页面上有六个文本输入 名字 昵称 姓氏 注释 过敏 手机号码 我不太擅长 JS 但如果页面上只有一个输入 我确实知道该怎么做 但我不确定当有多个输入时该怎么做 我遇到的问题之一
  • 无法索引空数组

    我正在使用一个模板 该模板根据服务器备份是否成功的条件设置单元格颜色 我有下面的代码 它不断抛出错误 无法索引到空数组 Cannot index into a null array At C Users admin Desktop new
  • .addClass 仅添加到无序列表中单击的项目符号

    我有一个简短的无序列表 其中有两个项目符号 我添加了一些 Javascript 这样当我单击项目符号时 它会向其中添加一个类 问题是 它将该类添加到所有现有的 li 中 而不仅仅是我单击的那个 这是 JSFiddle http jsfidd
  • 如何在 django 表单中设置自定义 HTML 属性?

    我有一个 Django 表单 它是页面的一部分 假设我有一个字段 search input forms CharField u Search word required False 我只能通过模板访问它 form search input
  • svg路径指针事件-点击检测

    我正在编写一些 HTML 以便可以使用 HTML SVG 和 PATH 标签绘制贝塞尔曲线 我的曲线效果非常好 现在我想添加一项功能 如果用户将鼠标悬停在曲线上 我会更改颜色 但实际情况是 SVG 创建了一个包含路径的大框 并捕获所有点击
  • HTML 和 CSS 的基本编码标准 [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我想知道它们是否是像 PSR 01 这样的 HTML 和 CSS 基本编码标准 我尝试谷歌搜索和搜索 但没有找到 我建议看看类似的东西
  • 脚本块上的新闭包

    考虑这段代码 PS gt timer New Object Timers Timer PS gt timer Interval 1000 PS gt i 1 PS gt Register ObjectEvent timer Elapsed

随机推荐

  • 在地址栏中显示 iFrame url

    是否可以在url地址栏中包含iframe内容的url 例如 我有一个域sub test com它有一个带有 src 的 iframerealpage com 逻辑上浏览页面不会改变地址栏中的任何内容 因为我们在其他域的 iframe 中打开
  • R oauth 身份验证期间 twitteR PIN 码出现在哪里?

    我正在尝试使用 twitteR 包 因为我已经阅读了 Jeffrey Stanton 关于数据科学的免费电子书中的 Twitter 章节 我使用此代码来注册我的凭据 requestURL lt https api twitter com o
  • 第一次使用Hadoop,MapReduce Job不运行Reduce Phase

    我编写了一个简单的映射缩减作业 该作业将从 DFS 读取数据并对其运行简单的算法 当尝试调试它时 我决定简单地让映射器输出一组键和值 而减速器输出一组完全不同的键和值 我在单节点 Hadoop 20 2 集群上运行此作业 当作业完成时 输出
  • 用于选择 x、y 和颜色(绘图)的下拉菜单

    我正在尝试创建一个带有可选 x y 和颜色变量的绘图 部分基于上一个问题 x 和 y 变量选择似乎有效 但是当选择新的 x 和 y 变量时 点颜色会丢失 此外 我尝试使用类似的策略来选择点颜色 但不幸的是这似乎不起作用 另一种选择是在前面链
  • 通过 ODBC 从 C# 读取 Netezza 数据库表在 Windows 7 中不起作用

    为什么 NET 无法通过已安装的 NetezzaSQL 驱动程序连接到我的 Netezza 盒子 64 位应用程序也无法通过此 ODBC 连接进行连接 为什么会这样呢 我已在控制面板中构建了用户和系统 Netezza ODBC 连接 当我单
  • 在unix中如何删除文件的最后一个字符?

    假设我有一些任意的多行文本文件 sometext moretext lastline 如何仅删除文件的最后一个字符 e 而不是换行符或空 而不使文本文件无效 更简单的方法 输出到标准输出 不更新输入文件 sed s somefile 是一个
  • 制作模态 JInternalFrame

    我需要从 MDI JFrame 中的用户获取大量数据 文件选择 文本 日期 我需要的输入表格是JInternalFrame是模态的 我怎样才能做一个JInternalFrame modal 根据我的经验 我从来没有成功过JInternalF
  • 如何从 QListWidgetItem 获取小部件

    我制造了一个QListWidget In QLisitWidgetItems 我添加了一个QVBoxLayout That QVBoxLayout包含三个QLabels 如何获取里面的值QLabel点击时QListWidgetItem 创建
  • 有可用的 Linux RDAP 客户端吗? [关闭]

    Closed 这个问题需要多问focused 目前不接受答案 我四处寻找 认为这里可能是最快的 我在哪里可以得到任何RDAP客户端 它实际上被任何人使用吗 您可以使用用 Perl 编写的 rdapper git clone https gi
  • Kurento Media WebRTC 转 RTP

    我正在使用 kurento 的主 git 来制作 WebRTC 到 RTP 的桥接器 MediaPipeline pipeline kurento createMediaPipeline WebRtcEndpoint webRtcEndpo
  • Javascript 书签在 Firefox 中输出“true”而不是执行脚本

    我们正在运行一个快速的 JavaScript 函数来填写和保存表单 以便在工作流程中快速前进 用于测试目的 它在除 Firefox 之外的所有浏览器中运行良好 并且仅在少数人的计算机上运行 javascript function ruleD
  • 如何在 SQL Developer 中输入多值参数的绑定

    我有很多带有命名参数的 SQL 我需要能够在 SQL Developer 中执行它们 对于参数为标量值的 SQL 可以轻松地将 SQL 粘贴到工作表中 并且 SQL Developer 将提示我 在标题为 Enter Binds 的对话框中
  • Azure 构建上的 JavaScript 堆内存不足

    我将 aspnetboilerplate 与 Angular 和 NET Core 一起使用 当我尝试在 Azure 上部署应用程序时 它显示 致命错误 接近堆限制的无效标记压缩分配失败 JavaScript 堆内存不足 这是我的天蓝色管道
  • 如何在 Yii2 中的 $content 之前在主布局页面中传递全局变量

    我正在尝试使用 Nav widget 在 yii2 中创建动态菜单 这是我在主布局页面的菜单部分中的代码 echo Nav widget options gt class gt navbar nav navbar right items g
  • java.lang.IllegalStateException:在 JSF 2 中已为此响应调用 getOutputStream()

    我有一个用 xml 编写 jsp 页面的遗留代码 我正在尝试将其转换为 JSF 2 但我收到以下异常 Jul 10 2012 11 34 57 AM com sun faces application view FaceletViewHan
  • JS Canvas:如何使矩形到达边界后来回移动

    所以我有一个向右移动的矩形 我怎样才能让矩形在触及边界时反转它 我正在努力让它来回
  • CLI 中的 JUnit 测试等效项

    我编写了某些代码 但它并没有主要方法 但我想知道代码是否有问题 基本上我可以使用 Eclipse 中的 JUnit 测试用例来完成它 我使用的是 Linux 但我面临的情况是 我必须在目前没有 Eclipse 的 Windows 中测试它
  • 在 SQL 数据库上强制执行“零或一对一”关系?

    我有一个Post实体和一个FbPost entity Post FbPost为 null 或FbPost 并且没有两个Post实体可以引用相同的FbPost实体 换句话说 zero or one to one 强制执行此操作的正确方法是什么
  • 按分隔符分割字符串,但如果它被转义则不会

    如何用分隔符分割字符串 但如果它被转义则不能分割 例如 我有一个字符串 1 2 2 3 4 4 分隔符是 转义分隔符是 此外 我想忽略转义的反斜杠 所以在 the 仍然是一个分隔符 因此 使用上面的字符串 结果应该是 0 gt 1 1 gt
  • parsedhtml 不再响应

    因此 我尝试从网站获取一些文本 一旦我尝试使用 ParsedHtml 返回对象 powershell 就会停止响应 即使我让它在后台运行几分钟 它也不会再执行任何操作 造成这种情况的原因是什么 PS P gt url mywebsite P