这个错误是编码错误吗?我该如何解决?

2023-12-10

我正在做网络抓取。

下面是我使用的代码。

我在评论上写了一些评论。

library(httr)
library(rvest)
library(stringr)


# Bulletin board url
List.of.questions.url<- 'http://kin.naver.com/qna/list.nhn?m=noanswer&dirId=70108'

# Vector to store title and body
answers <- c()

#  get the posts from page 1 to page 2.
for(i in 1:2){
  url <- modify_url(List.of.questions.url, query=list(page=i))  
  list <- read_html(url, encoding = 'utf-8') #I think I encoded, but I'm getting an error.


  # Gets the url of the post.
  # TLS = title.links, CLS = content.links 
  TLS <- html_nodes(list, '.basic1 dt a') 
  CLS <- html_attr(TLS, 'href')
  CLS <- paste0("http://kin.naver.com",CLS) 

  #Gets the required properties.
  for(link in CLS){
    h <- read_html(link)  

    # answer    
    answer <- html_text(html_nodes(h, '#contents_layer_1'))
    answer <- str_trim(repair_encoding(answer)) #I think I encoded, but I'm getting an error.
    answers<-c(answers,answer)

    print(link)

  }
}

但是,在抓取时会出现此错误。

也许与编码有关。

(但正如我在评论中所写,我认为我的编码正确。)

[1] "http://kin.naver.com/qna/detail.nhn?d1id=7&dirId=70111&docId=280474910"
Error: No guess has more than 50% confidence
In addition: There were 43 warnings (use warnings() to see them)  
> warnings()

1: In stringi::stri_conv(x, from = from) :
  the Unicode codepoint \U000000a0 cannot be converted to destination encoding
2: In stringi::stri_conv(x, from = from) :
  the Unicode codepoint \U000000a0 cannot be converted to destination encoding
3: In stringi::stri_conv(x, from = from) :
  the Unicode codepoint \U000000a0 cannot be converted to destination encoding
4: In stringi::stri_conv(x, from = from) :
  the Unicode codepoint \U000000a0 cannot be converted to destination encoding
5: In stringi::stri_conv(x, from = from) :  
#All the same contents, so omitted

我如何解决它?

感谢您的建议


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

这个错误是编码错误吗?我该如何解决? 的相关文章

  • Shiny:从DT数据表中选定的行获取信息

    我们正在尝试重新创建示例 https demo shinyapps io 029 row selection https demo shinyapps io 029 row selection 使用DT包来渲染数据帧而不是shiny包 DT
  • 如何将数据从长格式重塑为宽格式

    我在重新排列以下数据框时遇到问题 set seed 45 dat1 lt data frame name rep c firstName secondName each 4 numbers rep 1 4 2 value rnorm 8 d
  • 使用 R 下载压缩数据文件、提取并导入 .csv

    我正在尝试使用以下方法从网页下载并提取 csv 文件R 这个问题是重复的使用 R 下载压缩数据文件 提取和导入数据 https stackoverflow com questions 3053833 using r to download
  • 如何不显示 ggplot 轴上的所有标签?

    I m trying to using ggplot2 to plot this But as you can see on the x axis you can t read anything 那么如何在 x 轴上显示每 10 年的值呢
  • 在zooreg时间序列中查找非唯一索引条目时遇到问题

    我有几年的数据正在尝试将其转化为动物园对象 Dropbox 上的 csv https www dropbox com sh vg8w8pt16e0v3xs AABKtWqDkPu9JVKpwBXO36VOa dl 0 一旦数据被强制转换为动
  • R 无法回忆起内存中的对象

    我正在构建一个包含多个步骤的函数 其中每个步骤都会创建一个对象 某个步骤失败 temp3 并且无法找到前面的步骤对象 错误 未找到对象 temp2 我不知道为什么 我有类似的函数 遵循完全相同的结构 每个步骤都遵循先前创建的对象 在函数内
  • Google 地图查询返回的 JSON 包含像 \x26 这样的编码字符(如何解码?)

    在 Java 应用程序中 我获取 JSON 来自 Google 地图 其中包含以下字符 x26我想将其转换为其原始字符 据我所知 这是一个 UTF 8 表示法 但我不完全确定 在源 JSON 中 可能会出现各种编码字符 例如 x3c div
  • 将 char* 转换为字符串 C++

    我知道字符串的起始地址 例如 char buf 和最大长度int l 字符串的 即字符总数小于或等于l 获取值的最简单方法是什么string来自指定的内存段 换句话说 如何实现string retrieveString char buf i
  • 使用 R 将日期格式的字符串列表/向量转换为 posix 日期类

    我有一个日期格式的字符串列表 我想将其转换为可以使用 R 操作的 posix 日期列表 我该怎么做 这就是我所拥有的 但我最终得到了一个列表 a lt c 2009 01 01 00 00 00 2009 01 01 00 00 00 z
  • 在python中将文本文件解析为列表

    我对 Python 完全陌生 我正在尝试读取包含单词和数字组合的 txt 文件 我可以很好地读取 txt 文件 但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
  • R ggplot2 分面保持比率但覆盖/定义输出图大小

    我目前正在使用 ggplot2 来比较不同组的统计数据 每个组属于不同的区域 这是通过运行 R 脚本的 Web 应用程序 tikiwiki CMS 插件 R 完成的 每个区域我可以有 2 到 30 个或更多组 相同的 R 脚本针对唯一网页中
  • 将字符串存储在 constexpr 结构中

    是否可以将字符串存储在constexpr struct 到目前为止我只能想出 struct A constexpr A std string view n m name n constexpr auto name return m name
  • 在列标题和配对变量中嵌入数据的数据透视表

    假设我有这样的数据 不幸的是 变量值嵌入在列名称中 library tidyr library dplyr dat lt tribble group var1 var meta1 var2 var meta2 group1 5 2 cat
  • 如何使用 Facet R 添加线条[重复]

    这个问题在这里已经有答案了 所以我有一个多面图 我希望能够向其中添加随每个面而变化的线 这是代码 p lt ggplot mtcars aes x wt geom histogram bins 20 aes fill factor cyl
  • 如何将 Shiny 中生成的反应图传递到 Rmarkdown 以生成动态报告

    简而言之 我希望能够通过单击按钮从我的闪亮应用程序生成动态 Rmarkdown 报告文件 pdf 或 html 为此 我想我将使用 Shiny 的参数化报告 但不知何故 我无法将单个谜题转移到所需的目标 使用此代码 我们可以在 R Shin
  • 按名称包含在单个对象中的多个列对 data.frame 进行排序?

    我想排序一个data frame由多列组成 理想情况下使用基础 R 无需任何外部包 尽管如果有必要 就这样吧 读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
  • 使用安全函数在 C 中将字符串添加到字符串

    我想将文件名复制到字符串并附加 cpt 但我无法使用安全函数 strcat s 来做到这一点 错误 字符串不是空终止的 我确实设置了 0 如何使用安全函数修复此问题 size strlen locatie size nieuw char m
  • ggplot 按因子和梯度颜色

    我正在尝试绘制一个对两个变量 一个因子和一个强度 进行着色的图 我希望每个因素都是不同的颜色 并且我希望强度是白色和该颜色之间的渐变 到目前为止 我已经使用了诸如对因子进行分面等技术 将颜色设置为两个变量之间的相互作用 并将颜色设置为因子并
  • 如何在闪亮的observeEvent中监听多个事件表达式

    我想要两个不同的事件触发观察者 有人建议here https stackoverflow com questions 34731975 how to listen for more than one event expression wit
  • 解压 R 数据框中的列表

    我有一个dataframe其中一个字段包含不同长度的列表 我想将该字段中列表的每个元素提取到其自己的字段中 以便我可以将结果收集到一个很长的字段中dataframe每个列表元素都有一个 id 这是一个例子dataframe dat lt s

随机推荐

  • 如何在 UIWebView 中从 Javascript 调用 Objective-C 方法?

    我正在使用 Phonegap 开发一个本机 iPhone 应用程序 因此一切都是用 HTML 和 JS 完成的 我正在使用 Flurry SDK 进行分析并希望使用 FlurryAPI logEvent EVENT NAME 跟踪事件的方法
  • 通过 AFNetworking 上传到 Amazon-S3

    我在通过 AFNetworking 将文件上传到 S3 时遇到困难 当我尝试上传时 我收到回调 表明文件的一小部分已上传 然后回调停止 一两分钟后我收到一条超时消息 我在用着亚马逊S3客户端但它似乎是 AFHTTPClient 的一个非常直
  • ADF - 迭代选择输出到复制活动

    我们有一个 SP 其中 SP 执行并返回多个结果集 其中列号发生变化 如下所示 create proc test ab as select 1 as num1 select 1 as num1 2 as num2 select 1 as n
  • 对 AVPlayerLayer videoGravity 属性进行动画处理

    我试图复制苹果在视频播放方面的行为 允许用户拉伸视频图像以填充边界 interface FHVideoPlayerView UIView end interface FHVideoPlayerView Class layerClass re
  • 如何根据其他微调器获取微调器值

    我有两个旋转项目 一个是我的日旋转器 另一个是我的月旋转器 如果我从月份微调器中选择二月 并且如果我选择日期为 30 则不应执行此操作 另一个例子 四月有 30 天 所以如果有人选择月份为四月 日期为 31 日 那么这是不正确的 请告诉我如
  • 在 Android Studio 中禁用“添加到 VCS”

    我已经在 Android 开发中使用 Intellij IDEA w git 集成有一段时间了 我最近升级到 Android Studio v0 1 1 现在我最喜欢的快捷键之一 Ctrl Command A 添加到 VCS 始终被禁用 这
  • iOS 选项弹出窗口 - 类似于剪切/复制/粘贴

    对于我正在开发的应用程序 我需要一些弹出选项 类似于在 UITextView 或 UIWebView 中选择文本时剪切 复制 粘贴的显示方式 但是 我无法找到这种弹出窗口的名称 是否有针对它们的公共 API 或者是否必须从头开始实现 您要查
  • 通知:本地通知的自定义声音在 iOS10 中不播放

    我正在发出本地通知 自从UILocalNotification类在 iOS 10 中已弃用 我已经使用过UserNotifications framework 当我尝试设置通知的自定义声音时 默认声音始终播放 这是我的代码 IBAction
  • Spring mvc:访问外部文件夹的资源

    我已将媒体 图片和电影 存储在文件夹中 例如 C test tes png 并且我尝试使用以下网址访问图片 http localhost 8080 app picture test png 为此 我使用了资源标签 spring 3 如下所示
  • Mozilla 浏览器上的高对比度模式

    我无法在 Mozilla Firefox 浏览器中使用任何高对比度模式的媒体查询 给出的媒体查询在 IE 和 Edge 上运行良好 但在 Mozilla 上不起作用 这些图像不会以高对比度模式出现在 Mozilla 上 有人可以建议任何以高
  • 使用 PDO 时“注意:未定义的变量:db”[关闭]

    很难说出这里问的是什么 这个问题模棱两可 含糊不清 不完整 过于宽泛或言辞激烈 无法以目前的形式合理回答 如需帮助澄清此问题以便重新打开 访问帮助中心 为了学习 PDO 我编写了以下代码 sql SELECT FROM category O
  • 如何将不同模式的通用数据插入到临时表中?

    我不知道如何解决这个问题 我们从各种在线供应商 亚马逊 新蛋等 导入订单信息 每个供应商都有自己特定的订单术语和结构 我们已将其镜像到数据库中 我们的数据导入数据库没有任何问题 但是我面临的问题是编写一个方法 从数据库中提取所需的字段 而不
  • 如何从一个视图到另一个视图访问/打印 NSMutableArray 元素?

    我有一个NSMutableArray named mArray in view1它存储一些字符串 现在我想访问 打印 比较这些元素view2 请指导我 在view1类中为marray编写属性synthesize 然后在view2中创建vie
  • 从元组中获取随机元素的最快方法是什么? (Python)

    你能比这个基本实现做得更好吗 import random def get random element tuple return tuple randint 0 len tuple 1 gt gt gt import random gt g
  • 为什么 Microsoft Edge(以前称为 Project Spartan)提示在 Internet Explorer 中打开此网站?

    有谁知道是什么触发 MS Edge 不打开特定网页 网站 而是提示用户在 Internet Explorer 中打开该网站 消息说 该网站需要 Internet Explorer 本网站使用的技术在 Internet Explorer 中效
  • python 中的原子 `ln -sf` (符号链接覆盖现有文件)

    我想创建一个符号链接 如果需要的话覆盖现有文件或符号链接 我发现os path exists只返回True对于未损坏的符号链接 所以我猜测任何测试还必须包括os path lexists 最原子的实现方式是什么ln sf在Python中 即
  • Angular 中的交叉口观察者

    我正在尝试设置IntersectionObserver在 Angular 中 但我无法让它工作 我想在向下滚动时加载数据HttpClient从服务器 我正在做这样的事情 在页面底部的 HTML 中 我有以下内容 div div 在我正在使用
  • VS2013下marshal.cxx中未处理的异常

    调试我的 C 应用程序时 我在 marshal cxx 中遇到了一次未处理的异常 并具有以下堆栈跟踪 ole32 dll CStdMarshal Disconnect unsigned long dwType 第 3420 行 C ole3
  • 如何在 DataFormatter 中编辑模式?

    我想用Java读取Excel中的数据 Excel中单元格的数据有2种类型是NUMERIC and STRING 所以当我想将数据读取为NUMERIC 它只显示数字101125340004 不是这样的1 01E 11因为它是电话属性 我的代码
  • 这个错误是编码错误吗?我该如何解决?

    我正在做网络抓取 下面是我使用的代码 我在评论上写了一些评论 library httr library rvest library stringr Bulletin board url List of questions url lt ht