在 Python 中使用 len() 函数

2023-12-05

在许多情况下,您需要查找数据结构中存储的项目数。 Python的内置函数len()是可以帮助您完成此任务的工具。

在某些情况下,使用len()很简单。但是,有时您需要更详细地了解此函数的工作原理以及如何将其应用于不同的数据类型。

在本教程中,您将学习如何:

  • 求长度内置数据类型使用len()
  • 使用len()第三方数据类型
  • 提供支持len()用户定义的类

读完本文后,您将知道何时使用len()Python 函数以及如何有效使用它。您将知道哪些内置数据类型是有效参数len()以及哪些是你不能使用的。您还将了解如何使用len()与第三方类型,例如ndarray数值模拟DataFrame熊猫,以及您自己的课程。

免费奖金: 单击此处获取 Python 备忘单并学习 Python 3 的基础知识,例如使用数据类型、字典、列表和 Python 函数。

Python 入门len()

功能长度()是Python的内置函数之一。它返回对象的长度。例如,它可以返回列表中的项目数。您可以将该函数与许多不同的数据类型一起使用。但是,并非所有数据类型都是有效参数len().

您可以首先查看该函数的帮助:

>>>
>>> help(len)
Help on built-in function len in module builtins:
len(obj, /)
    Return the number of items in a container.

该函数接受一个对象作为参数并返回该对象的长度。这文档为了len()更进一步:

返回对象的长度(项目数)。参数可以是序列(例如字符串、字节、元组、列表或范围)或集合(例如字典、集合或冻结集合)。 (来源)

当您使用内置数据类型和许多第三方类型时len(),该函数不需要迭代数据结构。容器对象的长度存储为该对象的属性。每次在数据结构中添加或删除项目时都会修改此属性的值,并且len()返回长度属性的值。这确保了len()高效工作。

在以下部分中,您将了解如何使用len()与序列和集合。您还将了解一些不能用作参数的数据类型len()Python 函数。

使用len()具有内置序列

A 顺序是一个装有订购物品的容器。列表、元组, 和字符串是 Python 中的三个基本内置序列。您可以通过调用找到序列的长度len():

>>>
>>> greeting = "Good Day!"
>>> len(greeting)
9

>>> office_days = ["Tuesday", "Thursday", "Friday"]
>>> len(office_days)
3

>>> london_coordinates = (51.50722, -0.1275)
>>> len(london_coordinates)
2

当求字符串的长度时greeting, 列表office_days,和元组london_coordinates, 你用len()以相同的方式。所有三种数据类型都是有效参数len().

功能len()始终返回一个整数,因为它正在计算传递给它的对象中的项目数。该函数返回0如果参数是空序列:

>>>
>>> len("")
0
>>> len([])
0
>>> len(())
0

在上面的示例中,您可以找到空字符串、空列表和空元组的长度。该函数返回0在每种情况下。

A range对象也是一个可以使用以下命令创建的序列范围()。 Arangeobject 并不存储所有值,而是在需要时生成它们。然而,你仍然可以找到a的长度range对象使用len():

>>>
>>> len(range(1, 20, 2))
10

该数字范围包括以下整数119增量为2。的长度range可以根据开始值、停止值和步长值确定对象。

在本节中,您使用了len()Python 函数包含字符串、列表、元组和range对象。但是,您也可以将该函数与任何其他内置序列一起使用。

使用len()具有内置集合

在某些时候,您可能需要查找列表或其他序列中唯一项目的数量。您可以使用len()为了达成这个:

>>>
>>> import random

>>> numbers = [random.randint(1, 20) for _ in range(20)]

>>> numbers
[3, 8, 19, 1, 17, 14, 6, 19, 14, 7, 6, 1, 17, 10, 8, 14, 17, 10, 2, 5]

>>> unique_numbers = set(numbers)
{1, 2, 3, 5, 6, 7, 8, 10, 14, 17, 19}

>>> len(unique_numbers)
11

您生成列表numbers用一个列表理解,它包含二十个随机数,范围在120。由于生成随机数,每次运行代码时的输出都会不同。在这次特定的运行中,二十个随机生成的数字列表中有十一个唯一的数字。

您经常使用的另一种内置数据类型是字典。在字典中,每个项目都由一个键值对组成。当您使用字典作为参数时len(),该函数返回字典中的项目数:

>>>
>>> len({"James": 10, "Mary": 12, "Robert": 11})
3

>>> len({})
0

第一个示例的输出显示该字典中有三个键值对。与序列的情况一样,len()将返回0当参数是空字典或空集时。这会导致空字典和空集合是假的。

探索len()使用其他内置数据类型

您不能使用所有内置数据类型作为参数len()。对于不存储超过一项的数据类型,长度的概念不相关。数字和布尔类型就是这种情况:

>>>
>>> len(5)
Traceback (most recent call last):
    ...
TypeError: object of type 'int' has no len()

>>> len(5.5)
Traceback (most recent call last):
     ...
TypeError: object of type 'float' has no len()

>>> len(True)
Traceback (most recent call last):
     ...
TypeError: object of type 'bool' has no len()

>>> len(5 + 2j)
Traceback (most recent call last):
     ...
TypeError: object of type 'complex' has no len()

整数、浮点数, 布尔值, 和复杂的types 是不能与以下一起使用的内置数据类型的示例len()。该函数提出了一个TypeError当参数是没有长度的数据类型的对象时。

您还可以探索是否可以使用迭代器和生成器作为参数len():

>>>
>>> import random

>>> numbers = [random.randint(1, 20) for _ in range(20)]
>>> len(numbers)
20

>>> numbers_iterator = iter(numbers)
>>> len(numbers_iterator)
Traceback (most recent call last):
     ...
TypeError: object of type 'list_iterator' has no len()

>>> numbers_generator = (random.randint(1, 20) for _ in range(20))
>>> len(numbers_generator)
Traceback (most recent call last):
     ...
TypeError: object of type 'generator' has no len()

您已经看到列表有长度,这意味着您可以将其用作参数len()。您使用内置函数从列表创建迭代器迭代器()。在迭代器中,每当需要时都会获取每个项目,例如当函数next()被使用或循环使用。但是,您不能在以下位置使用迭代器len().

你得到一个TypeError当你尝试使用迭代器作为参数时len()。当迭代器在需要时获取每个项目时,测量其长度的唯一方法是耗尽迭代器。迭代器也可以是无限的,例如返回的迭代器itertools.cycle(),因此无法定义其长度。

你不能使用发电机len()为了同样的原因。这些物体的长度如果不消耗完就无法测量。

探索len()进一步举一些例子

在本节中,您将了解一些常见用例len()。这些示例将帮助您更好地了解何时使用此功能以及如何有效地使用它。在某些示例中,您还会看到以下情况len()是一个可能的解决方案,但可能有更多 Pythonic 方法来实现相同的输出。

验证用户输入的长度

一个常见的用例len()是验证用户输入的序列的长度:

# username.py

username = input("Choose a username: [4-10 characters] ")

if 4 <= len(username) <= 10:
    print(f"Thank you. The username {username} is valid")
else:
    print("The username must be between 4 and 10 characters long")

在此示例中,您使用if语句检查返回的整数是否为len()大于或等于4且小于或等于10。您可以运行此脚本,您将获得类似于以下内容的输出:

$ python username.py
Choose a username: [4-10 characters] stephen_g
Thank you. The username stephen_g is valid

在本例中,用户名的长度为九个字符,因此条件中的if语句评估为True。您可以再次运行脚本并输入无效的用户名:

$ python username.py
Choose a username: [4-10 characters] sg
The username must be between 4 and 10 characters long

在这种情况下,len(username)回报2,以及条件if语句评估为False.

根据对象的长度结束循环

你将使用len()如果您需要检查可变序列(例如列表)的长度何时达到特定数字。在以下示例中,您要求用户输入三个用户名选项,并将其存储在列表中:

# username.py

usernames = []

print("Enter three options for your username")

while len(usernames) < 3:
    username = input("Choose a username: [4-10 characters] ")
    if 4 <= len(username) <= 10:
        print(f"Thank you. The username {username} is valid")
        usernames.append(username)
    else:
        print("The username must be between 4 and 10 characters long")

print(usernames)

您现在使用的结果是len()在里面尽管陈述。如果用户输入无效的用户名,您不会保留输入。当用户输入有效字符串时,将其附加到列表中usernames。重复循环直到列表中出现三个项目。

你甚至可以使用len()检查序列何时为空:

>>>
>>> colors = ["red", "green", "blue", "yellow", "pink"]

>>> while len(colors) > 0:
...     print(f"The next color is {colors.pop(0)}")
...
The next color is red
The next color is green
The next color is blue
The next color is yellow
The next color is pink

您使用列表方法.pop()在每次迭代中从列表中删除第一项,直到列表为空。如果您在大型列表上使用此方法,则应该从列表末尾删除项目,因为这样更有效。您还可以使用双端队列数据类型来自collections内置模块,可让您高效地从左侧弹出。

有一种更 Pythonic 的方法可以通过使用来实现相同的输出真实性序列数:

>>>
>>> colors = ["red", "green", "blue", "yellow", "pink"]

>>> while colors:
...    print(f"The next color is {colors.pop(0)}")
...
The next color is red
The next color is green
The next color is blue
The next color is yellow
The next color is pink

空列表是虚假的。这意味着while语句将空列表解释为False。非空列表是真实的,并且while声明将其视为True。返回的值len()决定序列的真实性。当一个序列为真时len()返回任何非零整数和假值len()回报0.

查找序列最后一项的索引

假设您想要生成范围内的随机数序列110并且您想继续向序列中添加数字,直到所有数字的总和超过21。以下代码创建一个空列表并使用while循环填充列表:

>>>
>>> import random

>>> numbers = []
>>> while sum(numbers) <= 21:
...    numbers.append(random.randint(1, 10))

>>> numbers
[3, 10, 4, 7]

>>> numbers[len(numbers) - 1]
7

>>> numbers[-1]  # A more Pythonic way to retrieve the last item
7

>>> numbers.pop(len(numbers) - 1)  # You can use numbers.pop(-1)
7

>>> numbers
[3, 10, 4]

您将随机数添加到列表中,直到总和超过21。当您生成随机数时,您将获得的输出会有所不同。要显示列表中的最后一个数字,您可以使用len(numbers)并减去1因为列表的第一个索引是0。 Python 中的索引允许您使用索引-1获取列表中的最后一项。因此,虽然您可以使用len()在这种情况下,你不需要。

您想要删除列表中的最后一个数字,以便列表中所有数字的总和不超过21。你用len()再次计算出列表中最后一项的索引,将其用作 list 方法的参数.pop()。即使在这种情况下,您也可以使用-1作为论据.pop()从列表中删除最后一项并将其返回。

将列表分成两半

如果需要将序列分成两半,则需要使用表示序列中点的索引。您可以使用len()来找到这个值。在以下示例中,您将创建一个随机数列表,然后将其拆分为两个较小的列表:

>>>
>>> import random

>>> numbers = [random.randint(1, 10) for _ in range(10)]
>>> numbers
[9, 1, 1, 2, 8, 10, 8, 6, 8, 5]

>>> first_half = numbers[: len(numbers) // 2]
>>> second_half = numbers[len(numbers) // 2 :]

>>> first_half
[9, 1, 1, 2, 8]
>>> second_half
[10, 8, 6, 8, 5]

在您定义的赋值语句中first_half,您使用代表从开头开始的项目的切片numbers直到中点。您可以通过分解切片表达式中使用的步骤来计算出切片代表什么:

  1. 第一的,len(numbers)返回整数10.
  2. 下一个,10 // 2返回整数5当你使用整数除法操作员。
  3. 最后,0:5是一个切片,表示前五个项目,其中有索引04。请注意,端点被排除在外。

在下一个作业中,您定义second_half,您在切片中使用相同的表达式。然而,在这种情况下,整数5代表范围的开始。切片现在是5:表示索引中的项目5直到列表末尾。

如果您的原始列表包含奇数个项目,那么其长度的一半将不再是整数。当您使用整数除法时,您将获得地面的号码。列表first_half现在将包含比以下少一项的项目second_half.

您可以通过创建包含 11 个数字(而不是 10 个)的初始列表来尝试此操作。生成的列表将不再是两半,但它们将代表分割奇数序列的最接近的替代方案。

使用len()与第三方库配合使用

您还可以使用Python的len()具有来自第三方库的多种自定义数据类型。在本教程的最后一部分中,您将了解len()取决于类的定义。在本节中,您将查看使用示例len()具有来自两个流行的第三方库的数据类型。

NumPy 的ndarray

数值模拟模块是 Python 编程所有定量应用的基石。该模块介绍了numpy.ndarray数据类型。这种数据类型以及 NumPy 中的函数非常适合数值计算,并且是其他模块中数据类型的构建块。

在开始使用 NumPy 之前,您需要安装该库。您可以使用Python的标准包管理器,pip,然后在控制台中运行以下命令:

$ python -m pip install numpy

您已经安装了 NumPy,现在您可以从列表创建 NumPy 数组并使用len()在数组上:

>>>
>>> import numpy as np

>>> numbers = np.array([4, 7, 9, 23, 10, 6])
>>> type(numbers)
<class 'numpy.ndarray'>

>>> len(numbers)
6

NumPy 函数np.array()创建一个类型的对象numpy.ndarray从您作为参数传递的列表中。

但是,NumPy 数组可以具有多个维度。您可以通过将列表列表转换为数组来创建二维数组:

>>>
>>> import numpy as np

>>> numbers = [
    [11, 1, 10, 10, 15],
    [14, 9, 16, 4, 4],
]

>>> numbers_array = np.array(numbers)
>>> numbers_array
array([[11,  1, 10, 10, 15],
       [14,  9, 16,  4,  4]])

>>> len(numbers_array)
2

>>> numbers_array.shape
(2, 5)

>>> len(numbers_array.shape)
2

>>> numbers_array.ndim
2

列表numbers由两个列表组成,每个列表包含五个整数。当您使用此列表列表创建 NumPy 数组时,结果是一个具有两行五列的数组。当您将此二维数组作为参数传递时,该函数返回数组中的行数len().

要获取两个维度的大小,您可以使用该属性.shape,这是一个显示行数和列数的元组。您可以通过以下方式获取 NumPy 数组的维数:.shapelen()或通过使用该属性.ndim.

一般来说,当你有一个任意维数的数组时,len()返回第一个维度的大小:

>>>
>>> import numpy as np

>>> array_3d = np.random.randint(1, 20, [2, 3, 4])
>>> array_3d
array([[[14,  9, 15, 14],
        [17, 11, 10,  5],
        [18,  1,  3, 12]],
       [[ 1,  5,  6, 10],
        [ 6,  3,  1, 12],
        [ 1,  4,  4, 17]]])

>>> array_3d.shape
(2, 3, 4)

>>> len(array_3d)
2

在此示例中,您将创建一个形状如下的三维数组(2, 3, 4)其中每个元素是一个随机整数120。您使用该功能np.random.randint()这次创建一个数组。功能len()回报2,这是第一维的大小。

查看NumPy 教程:Python 数据科学的第一步了解有关使用 NumPy 数组的更多信息。

熊猫’DataFrame

数据框输入熊猫库是另一种在许多应用程序中广泛使用的数据类型。

在使用 pandas 之前,您需要在控制台中使用以下命令来安装它:

$ python -m pip install pandas

您已经安装了 pandas 包,现在您可以从字典创建 DataFrame:

>>>
>>> import pandas as pd

>>> marks = {
    "Robert": [60, 75, 90],
    "Mary": [78, 55, 87],
    "Kate": [47, 96, 85],
    "John": [68, 88, 69],
}

>>> marks_df = pd.DataFrame(marks, index=["Physics", "Math", "English"])

>>> marks_df
         Robert  Mary  Kate  John
Physics      60    78    47    68
Math         75    55    96    88
English      90    87    85    69

>>> len(marks_df)
3

>>> marks_df.shape
(3, 4)

字典的键是代表班级中学生姓名的字符串。每个键的值是一个包含三个科目分数的列表。当您从此字典创建 DataFrame 时,您可以使用包含主题名称的列表定义索引。

DataFrame 有三行和四列。功能len()返回 DataFrame 中的行数。这DataFrame类型还有一个.shape属性,您可以使用它来显示 DataFrame 的第一个维度表示行数。

你已经看到如何len()适用于许多内置数据类型以及来自第三方模块的某些数据类型。在下一节中,您将学习如何定义任何类,以便它可以用作len()Python 函数。

您可以进一步探索 pandas 模块Pandas DataFrame:让数据处理变得愉快.

使用len()关于用户定义的类

当你定义一个类时,你可以定义的特殊方法之一是.__len__()。这些特殊方法被称为 dunder 方法,因为它们在方法名称的开头和结尾处都有双下划线。 Python 的内置len()函数调用它的参数.__len__()方法。

在上一节中,您已经了解了如何len()当参数是 pandas 时的行为DataFrame目的。这种行为是由.__len__()方法为DataFrame类,您可以在模块的源代码pandas.core.frame:

class DataFrame(NDFrame, OpsMixin):
    # ...
    def __len__(self) -> int:
        """
        Returns length of info axis, but here we use the index.
        """
        return len(self.index)

该方法返回DataFrame的长度.index财产使用len()。此 dunder 方法将 DataFrame 的长度定义为等于 DataFrame 中的行数,如下所示.index.

您可以探索.__len__()dunder 方法进一步使用以下玩具示例。您将定义一个名为YString。该数据类型基于内置的字符串类,但是类型的对象YString使字母 Y 比所有其他字母更重要:

# ystring.py

class YString(str):
    def __init__(self, text):
        super().__init__()

    def __str__(self):
        """Display string as lowercase except for Ys that are uppercase"""
        return self.lower().replace("y", "Y")

    def __len__(self):
        """Returns the number of Ys in the string"""
        return self.lower().count("y")

。__在里面__()的方法YString使用初始化对象.__init__()父母的方法str班级。您可以使用以下函数来实现此目的极好的()。这.__str__()方法定义对象的显示方式。功能str(), print(), 和format()都调用这个方法。对于此类,您将对象表示为全小写字符串,但字母 Y 除外,将其显示为大写。

对于这个玩具类,您将对象的长度定义为字符串中字母 Y 出现的次数。因此,.__len__()方法返回字母 Y 的计数。

您可以创建一个类的对象YString并求出它的长度。上面示例中使用的模块名称是ystring.py:

>>>
>>> from ystring import YString

>>> message = YString("Real Python? Yes! Start reading today to learn Python")

>>> print(message)
real pYthon? Yes! start reading todaY to learn pYthon

>>> len(message)  # Returns number of Ys in message
4

您创建一个类型的对象YString来自类型的对象str并使用显示对象的表示print()。然后你使用该对象message作为论据len()。这调用了类的.__len__()方法,结果是字母 Y 出现的次数message。在本例中,字母 Y 出现了四次。

YString类不是一个非常有用的类,但它有助于说明如何自定义len()以满足您的需求。这.__len__()方法必须返回一个非负整数。否则,它会引发错误。

另一种特殊的方法是.__bool__()方法,它确定如何将对象转换为布尔值。这.__bool__()dunder 方法通常不为序列和集合定义。在这些情况下,.__len__()方法确定对象的真实性:

>>>
>>> from ystring import YString

>>> first_test = "tomorrow"
>>> second_test = "today"

>>> bool(first_test)
True

>>> bool(YString(first_test))
False

>>> bool(second_test)
True

>>> bool(YString(second_test))
True

变量first_string里面没有Y。如输出所示bool(),该字符串是真实的,因为它非空。但是,当您创建类型的对象时YString从这个字符串来看,新对象是假的,因为字符串中没有 Y 字母。所以,len()回报0。相比之下,变量second_string确实包含字母 Y,因此字符串和类型的对象YString是真实的。

您可以阅读有关使用面向对象编程和定义类的更多信息Python 3 中的面向对象编程 (OOP).

结论

您已经探索了如何使用len()确定序列、集合和其他一次保存多个项目的数据类型(例如 NumPy 数组和 pandas DataFrame)中的项目数。

len()Python函数是许多程序中的关键工具。它的一些用途很简单,但正如您在本教程中所看到的,该函数的用途远不止其最基本的用例。了解何时可以使用此功能以及如何有效地使用它将帮助您编写更简洁的代码。

在本教程中,您学习了如何:

  • 求长度内置数据类型使用len()
  • 使用len()第三方数据类型
  • 提供支持len()用户定义的类

您现在已经为理解以下内容奠定了良好的基础:len()功能。了解更多关于len()帮助您更好地理解数据类型之间的差异。您已准备好使用len()在您的算法中,并通过使用以下方法增强某些类定义的功能.__len__()方法。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中使用 len() 函数 的相关文章