在 Python 中创建 Pandas DataFrame 的 14 种方法

2023-10-20

A pandasDataFrame是一种二维标记数据结构,可以容纳整数、字符串、浮点等不同类型的数据。

在本教程中,我们将揭示创建 pandas DataFrame 的几种不同方法,使用列表、字典、系列等数据结构,NumPy 数组,甚至其他 DataFrame。

 

 

从列表创建 Pandas DataFrame

从列表创建 pandas 数据框是一种基本且简单的方法。您可以通过多种方式做到这一点。

简单列表

考虑以下示例,我们使用单个列表来创建 DataFrame:


import pandas as pd

# create a simple list
data = ['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy']

# create dataframe from list
df = pd.DataFrame(data, columns=['Name'])
print(df)
  

Output:


      Name
0     Adam
1      Tom
2     Lisa
3      Dan
4      Eve
5    Frank
6    Grace
7    Heidi
8     Ivan
9     Judy
  

在上面的代码片段中,我们从名为的列表中创建一个 pandas 数据框data其中有 10 个字符串元素。

通过将此列表传递给 DataFrame 构造函数,pd.DataFrame(),我们告诉 pandas 创建一个包含一列的 DataFrame。我们还通过提供列名称“Name”columns范围。

 

嵌套列表或列表列表

接下来,我们来看看如何使用列表列表创建 DataFrame:


# create a list of lists
data = [['Adam', 25], ['Tom', 30], ['Lisa', 35], ['Dan', 40], ['Eve', 45], ['Frank', 50], ['Grace', 55], ['Heidi', 60], ['Ivan', 65], ['Judy', 70]]

# create dataframe from list of lists
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
  

Output:


      Name  Age
0     Adam   25
1      Tom   30
2     Lisa   35
3      Dan   40
4      Eve   45
5    Frank   50
6    Grace   55
7    Heidi   60
8     Ivan   65
9     Judy   70
  

在此代码片段中,我们从列表列表创建一个 DataFrame,其中每个子列表都可以视为生成的 DataFrame 中的一行。

参数columns用于显式指定列名称“Name”和“Age”。

 

词典列表

从列表创建 pandas 数据框的更灵活的方法是使用字典列表:


# create a list of dictionaries
data = [
    {'Name': 'Adam', 'Age': 25}, 
    {'Name': 'Tom', 'Age': 30}, 
    {'Name': 'Lisa', 'Age': 35},
    {'Name': 'Dan', 'Age': 40},
    {'Name': 'Eve', 'Age': 45},
    {'Name': 'Frank', 'Age': 50},
    {'Name': 'Grace', 'Age': 55},
    {'Name': 'Heidi', 'Age': 60},
    {'Name': 'Ivan', 'Age': 65},
    {'Name': 'Judy', 'Age': 70},
]

# create dataframe from list of dictionaries
df = pd.DataFrame(data)
print(df)
  

Output:


      Name  Age
0     Adam   25
1      Tom   30
2     Lisa   35
3      Dan   40
4      Eve   45
5    Frank   50
6    Grace   55
7    Heidi   60
8     Ivan   65
9     Judy   70
  

在本例中,我们从字典列表创建了一个 DataFrame。列表中的每个字典代表 DataFrame 中的一行。

字典键成为列名。如果字典中缺少键,pandas 会用以下内容填充该空间NaN values.

 

从字典创建数据框

您可以使用不同结构的字典:列表字典、系列字典或字典字典。

列表词典

创建 DataFrame 的常见方法是使用列表字典:


data = {
    'Name': ['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'], 
    'Age': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70]
}
df = pd.DataFrame(data)
print(df)
  

Output:


      Name  Age
0     Adam   25
1      Tom   30
2     Lisa   35
3      Dan   40
4      Eve   45
5    Frank   50
6    Grace   55
7    Heidi   60
8     Ivan   65
9     Judy   70
  

在上面的代码中,我们将一个字典传递给 DataFrame 构造函数。每个键值对对应一列;键成为列名,值构成列中的数据。

 

系列词典

您还可以从 Series 字典创建 DataFrame。字典中的每个系列在 DataFrame 中形成一列:


data = {
    'Name': pd.Series(['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy']), 
    'Age': pd.Series([25, 30, 35, 40, 45, 50, 55, 60, 65, 70])
}
df = pd.DataFrame(data)
print(df)
  

Output:


      Name  Age
0     Adam   25
1      Tom   30
2     Lisa   35
3      Dan   40
4      Eve   45
5    Frank   50
6    Grace   55
7    Heidi   60
8     Ivan   65
9     Judy   70
  

在这种情况下,字典中的每个系列代表一列。字典的键用作列标签。该索引是所有系列索引的并集。

 

字典字典(嵌套字典)

从字典创建数据帧的另一个示例是传递字典的字典。在这种情况下,每个字典代表一列:


data = {'Adam': {'Age': 25}, 'Tom': {'Age': 30}, 'Lisa': {'Age': 35}, 'Dan': {'Age': 40}, 'Eve': {'Age': 45}, 'Frank': {'Age': 50}, 'Grace': {'Age': 55}, 'Heidi': {'Age': 60}, 'Ivan': {'Age': 65}, 'Judy': {'Age': 70}}
df = pd.DataFrame(data)
print(df)
  

Output:


      Adam  Tom     Lisa  Dan  Eve  Frank  Grace  Heidi  Ivan  Judy
Age     25   30       35   40   45     50     55     60    65    70
  

外部字典的键用作列标签。

内部字典的键作为行标签,如果内部字典之间有公共键,则成为行标签;如果没有,pandas 会填写NaN缺失数据的值。

但是,如果您想要与前面的示例相同的输出,您可以使用 Transpose 转换数据,如下所示:


data = {'Adam': {'Age': 25}, 'Tom': {'Age': 30}, 'Lisa': {'Age': 35}, 'Dan': {'Age': 40}, 'Eve': {'Age': 45}, 'Frank': {'Age': 50}, 'Grace': {'Age': 55}, 'Heidi': {'Age': 60}, 'Ivan': {'Age': 65}, 'Judy': {'Age': 70}}
df = pd.DataFrame(data).T.reset_index()
df.columns = ['Name', 'Age']
print(df)
  

Output:


    Name  Age
0   Adam   25
1    Tom   30
2   Lisa   35
3    Dan   40
4    Eve   45
5  Frank   50
6  Grace   55
7  Heidi   60
8   Ivan   65
9   Judy   70
  

The T转置 DataFrame(切换轴)并且reset_index使索引成为一列。

 

单系列

从单个 Series 创建 DataFrame 非常简单:


data = pd.Series(['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'], name='Name')
df = pd.DataFrame(data)
print(df)
  

Output:


      Name
0     Adam
1      Tom
2     Lisa
3      Dan
4      Eve
5    Frank
6    Grace
7    Heidi
8     Ivan
9     Judy
  

在上面的代码中,我们从 Series 创建了一个 DataFrame,其中 Series 形成了 DataFrame 中的一列。系列的名称用作列名称。

 

多系列

创建 DataFrame 的另一个示例是从多个 Series 创建它:


series_1 = pd.Series(['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'], name='Name')
series_2 = pd.Series([25, 30, 35, 40, 45, 50, 55, 60, 65, 70], name='Age')
df = pd.DataFrame([series_1, series_2]).transpose()
print(df)
  

Output:


      Name Age
0     Adam  25
1      Tom  30
2     Lisa  35
3      Dan  40
4      Eve  45
5    Frank  50
6    Grace  55
7    Heidi  60
8     Ivan  65
9     Judy  70
  

在此示例中,我们通过首先创建系列列表然后转置 DataFrame,从两个 Series 创建一个 DataFrame。

每个系列的名称成为 DataFrame 中的列名称。

 

一维 NumPy 数组

以下是如何从一维 NumPy 数组创建 DataFrame:


import numpy as np
import pandas as pd
data = np.array(['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'])
df = pd.DataFrame(data, columns=['Name'])
print(df)
  

Output:


      Name
0     Adam
1      Tom
2     Lisa
3      Dan
4      Eve
5    Frank
6    Grace
7    Heidi
8     Ivan
9     Judy
  

在上面的代码片段中,我们将一维 NumPy 数组传递给 DataFrame 构造函数。

这将创建一个具有单列的 DataFrame。我们使用以下方式提供列名称“Name”columns范围。

 

二维 NumPy 数组

让我们看看如何从二维 NumPy 数组创建 DataFrame:


data = np.array([['Adam', 25], ['Tom', 30], ['Lisa', 35], ['Dan', 40], ['Eve', 45], ['Frank', 50], ['Grace', 55], ['Heidi', 60], ['Ivan', 65], ['Judy', 70]])
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
  

Output:


      Name Age
0     Adam  25
1      Tom  30
2     Lisa  35
3      Dan  40
4      Eve  45
5    Frank  50
6    Grace  55
7    Heidi  60
8     Ivan  65
9     Judy  70
  

在此示例中,我们将二维 NumPy 数组传递给 DataFrame 构造函数。这将创建一个 DataFrame,其中每个内部数组都被视为一行。

我们通过以下方式指定列名称“Name”和“Age”columns范围。

 

多维 NumPy 数组

从多维数组创建 DataFrame 需要特殊考虑,因为 DataFrame 是二维结构。

例如,您可以通过创建多索引 DataFrame 来处理三维数组。
这是一个例子:


import numpy as np
import pandas as pd
# create a three-dimensional numpy array
data = np.random.randint(1, 10, (2, 10, 3))  # 2 sets, 10 rows, 3 columns

# create multi-index
index = pd.MultiIndex.from_product([range(s)for s in data.shape], names=['Set', 'Row', 'Column'])

# create dataframe from 3d numpy array
df = pd.DataFrame({'Value': data.flatten()}, index=index)
print(df)
  

Output:


                 Value
Set Row Column       
0   0   0           3
        1           5
        2           6
    1   0           4
        1           2
...                ...
1   8   2           7
    9   0           3
        1           9
        2           4
  

在此示例中,我们创建一个具有随机值的三维 NumPy 数组。

由于 DataFrame 是二维结构,我们必须使用以下方法展平 3D 数组flatten()方法,然后创建一个 MultiIndex DataFrame,显示原始 3D 数组的“集合”、“行”和“列”。

您需要决定如何表示数据,因为 pandas DataFrame 本质上是一个 2D 结构。

请注意,此方法也可以处理三个以上的维度。

然而,有很多方法可以转换NumPy 数组到 Pandas DataFrame.

 

使用 copy() 从其他 DataFrame 创建 DataFrame

我们可以使用以下命令创建一个新的 DataFrame,它是现有 DataFrame 的副本copy() method.

如果您想创建一个新的 DataFrame 来进行操作而不影响原始数据,这非常有用。
具体做法如下:


data = {
    'Name': ['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'], 
    'Age': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70]
}
df1 = pd.DataFrame(data)

# create a new dataframe that is a copy of df1
df2 = df1.copy()
print(df2)
  

Output:


      Name  Age
0     Adam   25
1      Tom   30
2     Lisa   35
3      Dan   40
4      Eve   45
5    Frank   50
6    Grace   55
7    Heidi   60
8     Ivan   65
9     Judy   70
  

在此示例中,我们创建一个原始 DataFramedf1一些数据。然后我们使用copy()方法来创建df2,这是一个独立的副本df1。所做的任何更改df2不会影响df1,反之亦然。

 

使用子集选择创建数据框

您可以从现有 DataFrame 的子集创建新的 DataFrame。这可以通过选择某些行、列或两者来完成。
具体做法如下:


# create an original dataframe
data = {
    'Name': ['Adam', 'Tom', 'Lisa', 'Dan', 'Eve', 'Frank', 'Grace', 'Heidi', 'Ivan', 'Judy'], 
    'Age': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Gender': ['F', 'M', 'M', 'M', 'F', 'M', 'F', 'F', 'M', 'F']
}
df = pd.DataFrame(data)

# create a new dataframe from a subset of the original dataframe
subset_df = df[df['Gender'] == 'F']
print(subset_df)
  

Output:


    Name  Age Gender
0   Adam   25   F
4    Eve   45   F
6  Grace   55   F
7  Heidi   60   F
9   Judy   70   F
  

在此示例中,我们从 DataFrame 开始df包含“姓名”、“年龄”和“性别”列。然后我们创建一个新的DataFramesubset_df仅包含“性别”为“F”的行。

这是使用布尔索引完成的,其中df['Gender'] == 'F'返回一个布尔系列True对于“性别”为“F”的所有行。该系列用于选择行的子集df.

 

从文本创建数据框(使用正则表达式)

我们可以通过使用正则表达式解析和提取所需的数据,从文本数据创建一个 DataFrame,无论分隔符是什么:


import re

# sample text data
text = '''
Adam is 25 years old
Tom is 30 years old
Lisa is 35 years old
Dan is 40 years old
Eve is 45 years old
Frank is 50 years old
Grace is 55 years old
Heidi is 60 years old
Ivan is 65 years old
Judy is 70 years old
'''

# use regex to extract names and ages
names = re.findall(r'(\w+) is \d+ years old', text)
ages = re.findall(r'\w+ is (\d+) years old', text)

# create dataframe from the extracted data
df = pd.DataFrame({
    'Name': names,
    'Age': ages
})
print(df)
  

Output:


      Name Age
0     Adam  25
1      Tom  30
2     Lisa  35
3      Dan  40
4      Eve  45
5    Frank  50
6    Grace  55
7    Heidi  60
8     Ivan  65
9     Judy  70
  

在此示例中,我们从包含文本数据的字符串开始。我们使用re.findall()使用正则表达式的函数从文本中提取姓名和年龄。

提取的姓名和年龄用于创建数据帧。

注意re.findall()返回列表,这些列表用作传递给 DataFrame 构造函数的字典中的值。

 

要避免的常见错误

创建 DataFrame 是 pandas 中的一项基本操作,有时由于各种原因可能会很棘手。您应该注意一些常见的陷阱。

意识到这些错误将提高您的 DataFrame 创建效率并减少调试时间。

 

数据和列长度不匹配

一个常见的错误是尝试创建一个 DataFrame,其中传递的数据长度与指定列的长度不匹配。

所有输入数据和列的长度必须相等,否则 pandas 将引发错误。


import pandas as pd
try:
    df = pd.DataFrame({
        'Name': ['Adam', 'Tom', 'Lisa'],  # 3 items
        'Age': [25, 30]  # 2 items
    })
except ValueError as e:
    print(e)
  

这将引发一个ValueError这就是说“数组的长度必须相同”。因此,在创建 DataFrame 时,请始终确保数据数组和列的长度相同。

不指定列表列表的列名称

当从列表列表创建 DataFrame 而不指定列时,pandas 将自动分配从 0 开始的整数列名称。这可能不是您想要的。


data = [['Adam', 25], ['Tom', 30], ['Lisa', 35]]
df = pd.DataFrame(data)
print(df)
  

这将创建一个包含名为 0 和 1 的列的 DataFrame。为避免这种情况,请在创建 DataFrame 时始终指定列名称。

数据类型不一致

DataFrame 可以保存不同的数据类型,但是当单个列中的数据类型不一致时,可能会导致意外结果。

例如,如果您有一列主要是整数,但只有一行包含字符串,则 pandas 会将整个列向上转换为对象数据类型。


import pandas as pd
data = {
    'Name': ['Adam', 'Tom', 'Lisa', 'Dan', 'Eve'],
    'Age': [25, 'Thirty', 35, 40, 45]
}
df = pd.DataFrame(data)
print(df)
print("\nData types:")
print(df.dtypes)
  

Output:


      Name     Age
0     Adam      25
1      Tom  Thirty
2     Lisa      35
3      Dan      40
4      Eve      45

Data types:
Name    object
Age     object
dtype: object
  

在此示例中,大多数“Age”值都是整数,但由于一个值​​(“Thirty”)是一个字符串,pandas 会自动将整个“Age”列向上转换为object.

最好为每列保持统一的数据类型,以提高存储和操作的效率。

 

深复制与浅复制

当从另一个 DataFrame 创建 DataFrame 时,一个常见的错误是忽略了这样一个事实:默认情况下,pandas 返回一个视图(浅拷贝)而不是数据的副本。

这意味着如果您基于另一个 DataFrame 创建一个新的 DataFrame 并修改它,您最终将修改原始 DataFrame。

为了避免这种情况,请使用copy()如果您不希望新的 DataFrame 链接到原始 DataFrame,则在从另一个 DataFrame 创建 DataFrame 时使用该函数。

了解这些常见错误可以帮助您更有效地使用 pandas DataFrame。请记住,熟能生巧,因此您使用这些结构的次数越多,您的效率就会越高。

 

这要花一条胳膊和一条腿

在我作为一名 Python 开发人员的这些年里,我参与过许多复杂的项目,但当我们讨论 Pandas 中的 DataFrame 创建时,有一个特别突出。

该项目是为埃及的一家大型电信公司服务的,涉及分析用户行为、网络性能和人口统计的大量数据集,以更好地定制他们的服务和营销工作。

我们正在处理数 TB 的数据,其中大部分数据是从网络传感器和用户行为日志实时传输的。

每天都会产生大量数据,数据量之大给处理和分析带来了挑战。我们使用 Python 的 Pandas 库,因为它具有处理大型数据集和执行复杂数据操作的卓越能力。

一天晚上,当我正在努力进行一项特别棘手的分析时,我的脚本开始抛出 ValueErrors。 “数组的长度必须相同”。

我以前就见过这样的情况,但在这种情况下却出乎意料。我的所有数据都应该来自我们的数据管道的完整记录。

我开始调试,首先检查传入的最新数据块。结果发现我们的一个数据源出现了问题——故障的网络传感器正在发送不完整的数据。

对于大多数记录,有七个数据点,但有故障的传感器只发送六个数据点。

当我尝试创建列长度不匹配的 DataFrame 时,这导致“数组必须具有相同的长度”错误。

一旦发现问题,我就采取了两管齐下的方法来避免将来再出现此类问题。

首先,我在尝试创建 DataFrame 之前开始实施数据验证检查。

这些检查确保每个记录在尝试将其加载到 DataFrame 之前具有正确数量的数据点。这使我能够从源头发现数据的任何问题。

其次,我在 DataFrame 创建脚本中添加了更强大的错误处理。

现在,如果数据存在导致 ValueError 的问题,脚本将记录有问题的数据并继续处理数据集的其余部分。

这样,单个有问题的记录就不会停止对数百万条良好记录的分析。

这一事件提醒我们,在处理现实世界的数据时,为异常和错误做好准备至关重要。虽然 Pandas 使数据操作变得更容易,但您始终必须对意外情况进行预测和计划。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中创建 Pandas DataFrame 的 14 种方法 的相关文章

  • 基于 Pandas 中的管道分隔列创建多个新列

    我有一个 pandas 数据框 其中有一个管道分隔的列 其中包含任意数量的元素 称为 零件 这些管道串中的元素数量从 0 到超过 10 个不等 所有管道串中包含的唯一元素的数量并不比行数小很多 这使得我无法在创建新列 对于每一行 我想创建一
  • ImportError:尝试在没有已知父包的情况下进行相对导入[重复]

    这个问题在这里已经有答案了 我正在学习使用 python 编程 并且在从包中的模块导入时遇到问题 我正在使用 Visual Studio 代码和 Python 3 8 2 64 位 我的项目目录 https i stack imgur co
  • pip 中的新彩色终端进度条

    我发现新版本的pip Python的包安装程序 有一个彩色进度条来显示下载进度 我怎样才能做到这一点 Like this pip 本身正在使用rich https pypi org project rich 包裹 特别是 他们的进度条文档
  • 查找其他列表项中列表项的列表索引

    我有一个长字符串列表 我想获取与另一个列表中的字符串子字符串匹配的列表元素的索引 使用列表理解可以轻松检查列表项是否包含列表中的单个字符串 例如这个问题 https stackoverflow com questions 4843158 c
  • Boto3 - 打印 AWS 实例平均 CPU 利用率

    我正在尝试仅打印 AWS 实例的平均 CPU 利用率 此代码将打印出 响应 但最后的 for 循环不会打印平均利用率 有人可以帮忙吗 先感谢您 import boto3 import sys from datetime import dat
  • 如何将 pymongo.cursor.Cursor 转换为字典?

    我正在使用 pymongo 查询一个区域内的所有项目 实际上是查询地图上一个区域内的所有场馆 我用了db command SON 在搜索球形区域之前 它可以返回一本字典 字典中有一个名为results其中包含场馆 现在我需要在一个正方形区域
  • 在 ReportLab 中向画布元素添加超链接的最简单方法是什么?

    我正在使用 ReportLab 使用 Python 制作 pdf 我想向画布添加一个形状 并让该形状充当超链接 使以下示例中的矩形链接到 google com 的最简单方法是什么 from reportlab pdfgen import c
  • 在 Python 中打开文本文件时出现问题

    这看起来应该很简单 f open C Users john Desktop text txt r 但我收到此错误 Traceback most recent call last File
  • 使用 Pyodbc + UnixODBC + FreeTDS 设置连接设置

    我使用 Pyodbc UnixODBC 和 FreeTDS 进行了设置 但在其中的某个地方设置了一些选项 但我不知道在哪里 根据 SQL Server Management Studio 我的程序在打开连接时发送一些设置 set quote
  • Spark MLLib 存在问题,导致概率和预测对于所有内容都相同

    我正在学习如何将机器学习与 Spark MLLib 结合使用 目的是对推文进行情感分析 我从这里得到了一个情感分析数据集 http thinknook com wp content uploads 2012 09 Sentiment Ana
  • 重命名 TensorFlow 中保存模型的变量范围

    是否可以在张量流中重命名给定模型的变量范围 例如 我根据教程创建了 MNIST 数字的逻辑回归模型 with tf variable scope my first scope NUM IMAGE PIXELS 784 NUM CLASS B
  • 当按下 flutter 中编写的按钮时,有没有办法运行 python 脚本?

    本质上 我想做的是 按下我在 Flutter 中编程的按钮 当按下该按钮时 Python 脚本应该开始在我的 Android 设备上运行 我想在 python 中使用 youtube dl 用于下载 Youtube 视频 库 但我想知道是否
  • Numpy - 两个矩阵的行之间的协方差

    我需要计算两个不同矩阵的每一行之间的协方差 即第一个矩阵的第一行与第二个矩阵的第一行之间的协方差 依此类推 直到两个矩阵的最后一行 我可以在没有 NumPy 的情况下使用下面附加的代码来完成此操作 我的问题是 是否可以避免使用 for 循环
  • 将数据导入 Django 的好方法

    我想定期将数据导入 Django 项目 我需要告诉我的数据提供者我想要以什么格式接收数据 我应该以 Json XML CSV 格式请求吗 在 Django 中通常如何处理这个问题 Django 有一个用于导入数据的完整框架 称为 Fixtu
  • 如何使用 json 谷歌翻译 api?

    我正在尝试使用来自 python 的 google 翻译和 utf 8 文本 如何调用json api 他们有一个将其嵌入 html 的文档 但我在任何地方都找不到合适的 API 或 wsdl 谢谢 拉斐尔 这是最终对我有用的代码 使用没有
  • 在 python matplotlib 中格式化损坏的 y 轴

    我正在 matplotlib 中处理一个 相当复杂的 条形图 它包含来自多个源的摘要数据 每个源都沿 x 轴标记 y 轴上有一系列结果 许多结果都是异常值 我尝试使用断开的 y 轴来显示这些结果 而不会使用以下组合来扭曲整个图表这个方法 h
  • pytube 在 Android 中传输视频所需的时间太长

    我在用pytube在 Android 中流式传输视频 借助chaquopy 视频文件 py from pytube import YouTube def video link yt YouTube f https www youtube c
  • 如何使用 Pandas 在现有 Excel 文件中保存新工作表?

    我想使用excel文件来存储用python详细说明的数据 我的问题是我无法将工作表添加到现有的 Excel 文件中 在这里 我建议使用示例代码来解决此问题 import pandas as pd import numpy as np pat
  • 导入后属性未添加到模块中

    我做了以下实验室 vagrant ubuntu xenial test tree pack1 init py mod1 py pack2 init py mod2 py mod3 py test py 2 directories 6 fil
  • Pandas - KeyError:“无法使用单个布尔值来索引 setitem”

    我写了以下函数 调用它时 它会抛出 KeyErrordataset loc 称呼 我想了解为什么会发生这种情况以及如何避免这种情况 def ChangeColumnValues dataset columnValues Changes th

随机推荐

  • 如何重命名本地和远程 Git 分支

    您正在与一群人合作开发一个项目 并且您已经为 git 分支定义了命名约定 你创建了一个新分支 将更改推送到远程存储库 并意识到您的分支名称不正确 幸运的是 Git 允许您使用以下命令轻松地重命名分支 git branch m命令 本指南介绍
  • 了解 Linux 文件权限

    在 Linux 中 文件权限 属性和所有权控制系统进程和用户对文件的访问级别 这确保只有授权的用户和进程才能访问特定的文件和目录 Linux 文件权限 基本的 Linux 权限模型的工作原理是将每个系统文件与所有者和组相关联 并为三类不同的
  • Python 字符串替换

    在本文中 我们将讨论如何在 Python 中使用replace method replace 方法 在Python中 字符串被表示为不可变的str对象 这str类附带了许多允许您操作字符串的方法 The replace 方法采用以下语法 s
  • 如何在 Ubuntu 18.04 上安装 Sublime Text 3

    崇高的文字是用于 Web 和软件开发的最广泛使用的文本和源代码编辑器之一 它速度非常快 并且具有许多开箱即用的强大功能 您可以通过安装新插件和创建自定义设置来增强其功能 在本教程中 我们将向您展示如何在 Ubuntu 18 04 计算机上安
  • Linux 中的 rmmod 命令

    每个Linux操作系统的核心组件是Linux内核 它管理系统的资源 并充当计算机硬件和软件之间的中介 Linux内核是一个采用模块化设计的软件 内核模块 通常称为驱动程序 是扩展内核功能的一段代码 模块可以编译为可加载模块或内置到内核中 可
  • 如何在 Windows 上创建可启动的 Ubuntu U 盘

    本教程将引导您完成在 Windows 上创建可启动 Ubuntu U 盘的过程 您可以使用此 U 盘来启动并测试或在任何支持从 USB 启动的计算机上安装 Ubuntu 先决条件 4GB 或更大的 USB 记忆棒驱动器 Microsoft
  • 如何在 CentOS 8 上安装 Ruby

    Ruby 是当今最流行的语言之一 它具有优雅的语法 并且是 Ruby on Rails 框架背后的语言 在本文中 我们将探索在 CentOS 8 上安装 Ruby 的不同方法 我们将展示如何从默认的 CentOS 8 存储库并使用 Rben
  • 如何在 Vim / Vi 中复制、剪切和粘贴

    处理文本文件时 复制 剪切和粘贴文本是最常执行的任务之一 Vim 或其前身 Vi 预装在 macOS 和几乎所有 Linux 发行版上 在您最喜欢的编辑器不可用的情况下 了解 Vim 的基础知识会很有帮助 本文介绍如何在 Vim Vi 编辑
  • 如何创建并列出本地和远程 Git 分支

    分支是软件开发过程的一部分 也是 Git 中最强大的功能之一 分支本质上是指向某个提交的指针 当修复错误或开发新功能时 开发人员正在创建一个新分支 稍后可以将其合并到主代码库中 本文介绍如何创建和列出本地和远程 Git 分支 列出 Git
  • Linux find 命令的高级正则表达式

    The 查找命令Linux 中允许您根据不同的条件在目录层次结构中搜索文件和目录 的一项强大功能find是它使用正则表达式进行搜索的能力 正则表达式 或简称 regex 提供了一种匹配字符串中字符序列的方法 目录 hide 1 正则表达式引
  • Bash While 循环:从基础知识到实际应用

    In Bash 脚本 while 循环用于在指定条件为 true 时执行语句块 基本语法是 while CONDITION do Commands to be executed done 只要 CONDITION 计算结果为 true 循环
  • 使用 Pandas DataFrame iloc 属性进行基于索引的访问

    The iloc财产在Pandas库代表 整数位置 并提供基于整数的索引以按位置进行选择 这意味着您可以通过整数位置选择 DataFrame 中的行和列 在本教程中 我们将介绍使用的各个方面iloc 包括选择单行 多行 特定列 甚至单个单元
  • Python defaultdict 简介:类固醇词典

    在Python中 defaultdict是一个类似于字典的类collections模块允许我们为字典中未显式设置的键定义默认值 它是内置的子类dict class Both dict and defaultdict用于以键值对格式 Pyth
  • 19 个有用的 Linux 命令行提示和技巧

    您可能已经注意到 Linux 是一个非常复杂的操作系统 因此 当发生的事情太多时 工作可能会变得有点乏味 但这正是 Linux 的自然之美的闪光点 有许多技巧和快捷方式可以在命令行中使用 以提供额外的便利 这一系列的技巧包括方便的命令和巧妙
  • Python 编程基础知识与示例

    Python 是一种流行且功能强大的脚本语言 可以做任何事情 您可以执行网页抓取 网络工具 科学工具 Raspberry Pi 编程 Web 开发 视频游戏等等 通过Python编程 无论您使用什么平台 您甚至可以进行系统编程 说到机器学习
  • 退出/终止 Python 脚本(简单示例)

    今天 我们将深入探讨退出 终止 Python 脚本的主题 您可以使用您选择的 IDE 但这次我将使用 Microsoft 的 Linux Subsystem for Windows WSL 软件包 有关该功能以及如何在 Windows 10
  • 使用 Pandas read_sql 将 SQL 查询/表读入 DataFrame

    The read sql函数允许您将数据从 SQL 数据库直接加载到Pandas数据框 它允许您直接解析和执行 SQL 查询或将整个表读入数据框 通过使用pandas read sql 您正在 SQL 数据库和 Pandas 之间建立无缝桥
  • 在 Linux 中使用 for 循环迭代文件

    在 Linux 中循环文件是一项方便的技能 它可以帮助您更轻松地管理和组织文件 在本教程中 我们将学习如何使用 Bash 循环文件 我们将看看如何使用for loop迭代常规文件 名称中带有空格的文件 目录 忽略大小写等等 在本教程结束时
  • 使用 to_gbq 将 Pandas DataFrame 导出到 Google BigQuery

    The to gbq功能允许您从a上传数据Pandas到 BigQuery 表中 在本教程中 您将学习如何从 Pandas 导出数据数据框使用 BigQueryto gbq功能 目录 hide 1 安装所需的库 2 设置 Google Cl
  • 在 Python 中创建 Pandas DataFrame 的 14 种方法

    A pandasDataFrame是一种二维标记数据结构 可以容纳整数 字符串 浮点等不同类型的数据 在本教程中 我们将揭示创建 pandas DataFrame 的几种不同方法 使用列表 字典 系列等数据结构 NumPy 数组 甚至其他