利用在线词典批量查询英语单词

2023-05-16

进来遇到很多英语生词,工具书上给的解释错误百出,而很多在线词典不但可以给出某个单词的解释,而且有大量的示例,因此猜想利用在线词典批量查询这些单词。怎么实现呢?

首要问题是如何自动获取某个单词的解释。搜索之后,发现可以用curl实现,如

 

请参见http://ubuntuforums.org/showthread.php?t=1591389 和 http://stackoverflow.com/questions/1617152/using-google-as-a-dictionary-lookup-via-bash-how-can-one-grab-the-first-definiti。

 

试过Google Dictionary之后发现, curl下来的网页用html2text转换时会报错:Input recoding failed due to invalid input sequence. 尝试了Python版的html2text之后,依然有大量的javascript和HTML代码残留。于是转而求助于百度词典——因为百度词典的搜索结果中没有Javascript语句,html2text一般可以完美转换。

 

转换完之后的文件如下,编码为UTF-8.

 

 

显然上面的内容是不便于阅读的。为了提取有用信息,需要对上面的内容进行处理——下面的脚本参考了http://blog.csdn.net/jallin2001/archive/2009/11/13/4808618.aspx。

 

运行上面的脚本后,可以得到如下的输出:

 

另外,如果要自动化查询一批英文单词,可以把它们写到一个文件中,然后用下面的脚本进行自动查询

 

Update 2011-01-02:

 

终于找到了查询Google Dictionary的一种方法。

Google Dictionary对于单词abandon的解释可以利用URL:http://www.google.com/dictionary?langpair=en|zh-CN&q=abandon&hl=en&aq=f 得到,而网页的信息如下:

 

注意到有一行信息:

 

 包含单词abandon的中文释义。于是可以利用curl获取到Google Dictionary的翻译网页,然后直接在获取的网页中查找上面那一行信息。

 

 

2011-01-03 Update:

奉上完整版的程序:

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

利用在线词典批量查询英语单词 的相关文章

  • Linux 下 FTP 连接使用方式及常用配置

    Linux 下 FTP 连接使用方式及常用配置 FTP 协议介绍传输方式支持模式FTP 客户端注意事项FTP 协议连接步骤FTP 常用命令 Linux下 FTP 常用命令Linux 下连接 FTP 服务器Linux下 FTP 目录操作Lin
  • IDEA开发工具使用 git 创建项目、拉取分支、合并分支

    工作中多人使用版本控制软件协作开发 xff0c 常见的应用场景归纳如下 xff1a 假设小组中有两个人 xff0c 组长小张 xff0c 组员小袁 场景一 xff1a 小张创建项目并提交到远程Git仓库 场景二 xff1a 小袁从远程Git
  • CSS应用

    任务4 1 使用CSS样式美化购物列表页面中的菜单导航栏 任务4 2 使用CSS样式美化购物列表页面中的商品展示区 任务5 1 使用CSS样式实现购物列表页面的整体布局 任务5 2 使用CSS样式实现购物列表页面的左侧导航栏部分
  • XPath的使用(基本的使用方式,心得,持续添加)

    1 心得 xff1a 解析网页时 xff0c 使用过HtmlAgilityPack这个类库 xff0c 里面用到了XPath来查找结点 在使用过程中 xff0c 因为html文本的标签十分多 xff0c 大部分元素是没有id属性的 xff0
  • 姿态解算原理(一)——旋转矩阵

    像我们常见的MPU6050 MPU9250等等都是一种捷联式的惯性元件 xff0c 还是一种低成本的 xff0c 还有一种是平台式的惯性导航 xff0c 不过我们能够用得起的就是低成本的MEMS惯性元件 xff0c 本文的内容是姿态解算的原
  • linux 设置自动关机和重启命令shutdown

    1 shutdown使用命令 xff1a Shutdown 选项 时间 参数解释 xff1a k 不真关机向所有用户提示警告信息 r 关机后立即重新启动 h 关机 f 快速关机重启动时跳过fsck n 快速关机不经过init 程序 c 取消
  • manifest.json

    34 name 34 34 Shopro开源商城 34 34 appid 34 34 UNI 34 34 description 34 34 Shopro开源商城 34 34 versionName 34 34 1 3 2 34 34 ve
  • 普通人对AI的看法

    就发展前景来看 xff0c 人工智能无疑将是现阶段与今后很长时间内的全球性热点 这是一个可以预见性的历史潮流 xff0c 无可阻挡 xff0c 一旦它出现一定会对现代互联网的结构会产 生颠覆性的改变 它将重新定义现代互联网的理念 xff0c
  • expect_out(buffer)中包含send的数据

    expect out buffer 中包含send的数据 我一直以为在Expect中一旦执行send之后 xff0c expect out buffer 就会被清空 xff0c 直到有新的数据被填入 xff0c 而恰恰就是这些数据被用在ex
  • Python在Linux环境中获取文件名并读取文件内容格式化输出

    Python在Linux环境中获取文件名并读取文件内容格式化输出 代码示例 xff1a span class token comment usr bin python3 span span class token comment codin
  • FindBugs 汇总(持续修改)

    FindBugs 所有的问题 xff0c 个人遇到的会进行简单的记录 BC Equals method should not assume anything about the type of its argument BC EQUALS
  • 使用原版镜像安装windows时install.wim文件过大的解决方案

    现在安装win10系统一般使用微软的原版镜像 xff0c 去msdn i tell you 这个网站下载合适版本的ISO镜像解压到u盘中即可引导安装 如果使用uefi引导的话 xff0c u盘的文件系统需要为fat32格式才能正确引导 xf
  • 对比学习:MoCo代码详解

    MoCo算法代码详解 本文代码来源 xff1a 1 导入包2 参数设置3 数据预处理4 模型4 1moment update key encoder4 2进队出队4 3shuffle4 4损失计算 5 训练6 测试6 1 Knn monit
  • 【Linux】centos sudo: java: command not found解决方案

    一 解决方案 1 登入能执行命令的用户 xff0c 修改用户系统变量 比如centos登入 vim bashrc 2 赋予sudo环境变量 xff0c 设置别名 alias sudo 61 34 sudo env PATH 61 PATH
  • linux 中.sh文件如何打开运行

    1 sh是linux中运行shell的命令 xff0c 是shell的解释器 xff0c shell脚本是linux中壳层与命令行界面 xff0c 用户可以在shell脚本输入命令来执行各种各样的任务 要运行shell脚本 xff0c 首选
  • 2022-04-21 Android 使用getPackageManager().hasSystemFeature方法来检查当前设备硬件是否支持某些功能

    一 android frameworks里面经常会看到getPackageManager hasSystemFeature xff0c 比如frameworks base packages SystemUI src com android
  • 2022-08-19 AndroidR 实现根据触摸状态动态显示隐藏状态栏

    一 修改systemui xff0c 处理触摸消息 xff0c 发从广播 xff0c 接收广播后显示或者隐藏状态栏 diff git a packages SystemUI src com android systemui statusba
  • RabbitMQ消息持久化和消息确认机制 RabbitMQ消息持久化和消息确认机制

    消息持久化 消息在传输过程中 可能会出现各种异常失败甚至宕机情况 为了保证消息传输的可靠性 需要进行持久化 也就是在数据写在磁盘上 消息队列持久化包括三部分 1 Message持久化 也就是发送时消息持久化 Message包含body bo
  • Tcl/Expect中利用exec调用管道"|"和awk的注意事项

    Tcl Expect中利用exec调用稍微复杂的shell命令时 xff0c 经常会遇到一些小问题 xff0c 常见的就是pipeline 和awk Tcl Expect调用多个shell命令并使用 将其串接在一起时 xff0c 需要注意的
  • pycharm中使用jupyter使用

    步骤 1 安装Jupyter pip install jupyter 2 新建一个IPython文件 3 在Terminal里启动Jupyter Notebook 2 编写程序 随便写点什么测试一下 xff0c 应该得到的结果是这样的 xf

随机推荐