我有一个引文表,其中包括第一作者的姓氏、标题、期刊、年份和每次引文的页码。
我已将表格的前几行发布在;它也可以以。 (请注意,有些记录确实not有 DOI。)
我希望能够查询这些引文的 DOI。对于标题,最好查询能够处理某种形式的模糊匹配。
我怎样才能做到这一点?
该表当前位于 MySQL 中,但以 CSV 文件开始和结束就足够了,或者因为我主要使用 R,所以以 R 数据框开始和结束就足够了。 (我希望得到一个从头到尾的答案。)
我不知道有任何完整的包或函数可以做到这一点,但这是我会使用的一般方法。这Crossref https://www.crossref.org/DOI 注册机构提供基于 Web 的方法,用于根据书目数据确定 DOIhttps://www.crossref.org/guestquery/ https://www.crossref.org/guestquery/.
该页面上有几种不同的搜索方式,包括最后一种采用 XML 格式搜索的方式。该页面包含有关如何创建适当的 XML 的信息。您需要通过 HTTP 提交 XML(通过拆开页面来确定表单目标以及需要包含的任何其他信息来确定详细信息),然后解析响应。
此外,您需要验证以自动方式执行此操作不会以任何方式违反网站的服务条款。
下面是 Crossref 免费 DOI 查找的 XML 表单,其中可搜索的术语包括article_title
, author
, year
, journal_title
, volume
, and first_page
:
<?xml version = "1.0" encoding="UTF-8"?>
<query_batch xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" version="2.0" xmlns="http://www.crossref.org/qschema/2.0"
xsi:schemaLocation="http://www.crossref.org/qschema/2.0 http://www.crossref.org/qschema/crossref_query_input2.0.xsd">
<head>
<email_address>[email protected] /cdn-cgi/l/email-protection</email_address>
<doi_batch_id>test</doi_batch_id>
</head>
<body>
<query enable-multiple-hits="false|exact|multi_hit_per_rule|one_hit_per_rule|true"
list-components="false"
expanded-results="false" key="key">
<article_title match="fuzzy"></article_title>
<author search-all-authors="false"></author>
<component_number></component_number>
<edition_number></edition_number>
<institution_name></institution_name>
<isbn></isbn>
<issn></issn>
<volume></volume>
<issue></issue>
<year></year>
<first_page></first_page>
<journal_title></journal_title>
<proceedings_title></proceedings_title>
<series_title></series_title>
<volume_title></volume_title>
<unstructured_citation></unstructured_citation>
</query>
</body>
</query_batch>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)