Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？

2024-04-09

我正在使用scholarlypython 中的模块用于搜索关键字。我正在返回一个生成器对象，如下所示：

import pandas as pd
import numpy as np
import scholarly

search_query = scholarly.search_keyword('Python')
print(next(search_query))

{'_filled': False,
 'affiliation': 'Juelich Center for Neutron Science',
 'citedby': 75900,
 'email': '@fz-juelich.de',
 'id': 'zWxqzzAAAAAJ',
 'interests': ['Physics', 'C++', 'Python'],
 'name': 'Gennady Pospelov',
 'url_picture': 'https://scholar.google.com/citations?view_op=medium_photo&user=zWxqzzAAAAAJ'}

我想访问元素“citedby”，但是当我尝试这样做时next(search_query)['citedby']它返回TypeError: 'Author' object is not subscriptable.

我的问题是如何访问生成器对象中的元素？以及如何将该对象转换为 Pandas 数据框？

这不是发电机问题。生成器生成的对象是不是字典.

诚然，scholary图书馆并没有通过提供帮助解决问题Author给你一个类似字典的字符串转换的实例，但实际上并没有记录该类的 APIdoes支持。

中的每个“键”Author表示实际上是一个属性在物体上：

author = next(search_query)
print(author.citedby)

You can使用以下方法获取对象的字典vars()功能 https://docs.python.org/3/library/functions.html#vars:

author_dict = vars(author)

不过，数据不一定直接映射到数据帧。将如何interests例如，列表可以在数据框表格数据结构中表示？而且你不想包括_filled内部属性（这是一个记录如果author.fill()已被调用）。

也就是说，您可以通过将生成器映射到vars功能：

search_query = scholarly.search_keyword('Python')
df = pd.DataFrame(map(vars, search_query))

然后放下_filled如有必要，请转换列interests将列转换为更结构化的内容，例如具有 0 / 1 值或类似值的单独列。

请注意，这将是slow，因为scholarly按顺序浏览 Google 搜索结果的图书馆页面，以及图书馆故意地每次以 5-10 秒的随机睡眠间隔延迟请求，以避免 Google 阻止请求。所以你必须要有耐心Python关键字搜索轻松产生近 30 页的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？的相关文章

2d 图像点和 3d 网格之间的交点

Given 网格源相机我有内在和外在参数图像坐标 2d Output 3D 点是从相机中心发出的光线穿过图像平面上的 2d 点与网格的交点我试图找到网格上的 3d 点 This is the process From Multip
通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
LibreOffice 并行将 .docx 转换为 .pdf 效果不佳

我有很多 docx 文件需要转换为 pdf 将它们一一转换需要很长时间所以我编写了一个 python 脚本来并行转换它们 from subprocess import Popen import time import os os chdi
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
如何使用 python 的 http.client 准确读取一个响应块？

Using http client在 Python 3 3 或任何其他内置 python HTTP 客户端库中如何一次读取一个分块 HTTP 响应一个 HTTP 块我正在扩展现有的测试装置使用 python 编写 http clie
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
Python 2 的 `exceptions` 模块在 Python3 中丢失了，它的内容到哪里去了？

一位朋友提到对于 Python 2 假设您在命令行上的路径环境变量中有它 pydoc exceptions 非常有用知道它应该可以为他每周节省几分钟的网络查找时间我自己每周都会用谷歌搜索一次例外层次结构所以这对我来说也是一个有用的提
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
如何在 scikit 中加载 CSV 数据并将其用于朴素贝叶斯分类

尝试加载自定义数据以在 Scikit 中执行 NB 分类需要帮助将示例数据加载到 Scikit 中然后执行 NB 如何加载目标的分类值使用相同的数据进行训练和测试或使用完整的数据集进行测试 Sl No Member ID Membe

随机推荐

bodyParser 已弃用 Express 4

我正在使用express 4 0 我知道正文解析器已从express 核心中删除我正在使用推荐的替代品但是我得到了 body parser deprecated bodyParser use individual json urlenc
ReactJS “导入”和“导出”可能只出现在顶层，这是怎么回事？

我的代码反应出了什么问题 export const BeritaView match gt const article articles find item gt item id match params id console log ar
为什么 std::condition_variable::wait 需要互斥锁？

TL DR 为什么std condition variable 等待 http en cppreference com w cpp thread condition variable wait需要互斥锁作为其变量之一吗 Answer 1 您
Qt圆角矩形，为什么角不一样？

我尝试绘制一个圆角矩形drawRoundedRect方法直接在QPixmap 这里不涉及渲染引擎除了纯 Qt 引擎我仔细检查了矩形的大小与像素图的大小 Pixmap QSize 50 73 Rectangle QRect 0 0 48x
igraph 对象的顶点/节点属性

我正在 igraph 中处理网络分析数据这是一个示例数据框 df edgelist structure list Nominator structure c 6L 4L 7L 8L 1L 2L 3L 5L Label c Andrea D
为什么这段代码会产生死锁？ [复制]

这个问题在这里已经有答案了 class A static final int i static i 128 Thread t new Thread public void run System out println i i t start
Pandas to_sql 中的行排序

我有一个已订购的 Pandas Dataframe a0 b0 c0 d0 370025442 370020440 370020436 1 31 08 2014 First Yorkshire 53 05 10 0 0 8333 1 216
将 Firebase Analytics 与 Xamarin Android 集成

没有关于与 xamarin 进行分析集成的官方文档仅Xamarin谷歌分析示例 https developer xamarin com samples monodroid google services Analytics 是正式可用的
User.Identity.IsAuthenticated 在通用 asp.net 处理程序中的使用

我已经使用 WIF 设置了 STS 并希望公开用户是否已登录以便 RP 可以确定用户是否已登录而不需要用户重定向到 STS 并返回如果用户登录 RP 上将出现不同的流程因此了解这一点很重要但不要在流程的此时强制登录我的计划是在
将某些对象从一个数据库迁移到另一个数据库

我如何从一个数据库开发 sqlite 转储一个用户及其所有关联评论帖子等以将其插入另一个数据库生产 mysql 我应该将其转储到 yaml 或 sql 或其他东西中 Ok God Save the YAML 我已经使用 YAML
如何将 DevExPress 从 9.3 升级到 12.1 ASP.NET

我们有使用 DevExpress 9 3 版本的 asp net 应用程序我们必须升级到 12 1 最好的升级方法是什么 Use the 项目转换器 http help devexpress com ProjectConverter Cu
删除程序标题栏中的关闭按钮

Goal 不希望用户使用 X 标记程序屏幕的右上角退出程序 Problem 不知道如何删除允许用户退出程序的图标您可以设置ControlBox http msdn microsoft com en us library system
如何防止移动设备调整大小并使用正确的css文件

为了防止网页中出现水平滚动我为移动设备平板电脑和桌面设备使用了 3 种不同的样式表我尝试告诉浏览器使用正确的 css 文件并在 html 文件的头部添加以下标签
Azure AD 未在 .NET Core 3.1 中进行身份验证

我正在尝试让 Azure AD 在现有应用程序中运行我已按照说明进行操作并查看了 Microsoft 网站上的示例代码 https learn microsoft com en us azure active directory deve
将 GCC 4.2 设置为 Mac OS X Leopard 上的默认编译器

我确信一定有办法做到这一点您可能知道 Leopard 上最新版本的 Xcode 事实上我认为所有版本的 Xcode 都附带 GCC 4 0 1 和 GCC 4 2 GCC 4 0 1 是默认的系统编译器而 GCC 4 2 是可选编译器
有没有办法在不发送推送通知的情况下调用 saveCurrentTurnWithMatchData？

我有一个游戏中心游戏允许玩家每回合进行多次移动在 iOS 6 中 Apple 实现了一个很棒的功能保存当前回合与匹配数据这允许您做到这一点它将数据保存到游戏中心以防止通过重复重做动作而作弊例如而不前进到下一个玩家问题是我发现
使 Swift 中的类默认符合 Codable

Swift 的这样的特性Codable Decodable Encodable 协议非常有用但我发现这样的问题让我们的 Parent 类符合Codable class Parent Codable var name String var
ViewPager 在屏幕旋转后重新实例化无序的项目

我正在使用一个ViewPager包含多个 ListView 其代码类似于答案中的代码无限ViewPager https stackoverflow com questions 7440012 infinite viewpager 这个想法是
Chrome 不会发送“If-Modified-Since”

我希望浏览器始终添加第一次除外 If Modified Since 请求标头以避免不必要的流量响应头是 Accept Ranges bytes Cache Control max age 0 must revalidate Conne
Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？

我正在使用scholarlypython 中的模块用于搜索关键字我正在返回一个生成器对象如下所示 import pandas as pd import numpy as np import scholarly search query

Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？

Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？ 的相关文章

随机推荐

热门标签

Python：如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中？的相关文章