Python数据分析的基本技能包括:
1.Python编程语言基础知识
2.数据处理和清洗技能
3.数据可视化技能
4.数据分析和建模技能
—— Notion AI
前言
本文是参加新星计划Python学习方向的学习笔记,感谢“是Dream呀”老师的Python知识分享。下面主要介绍Python库numpy的学习,供各位小伙伴参考。
一、numpy是什么
(一)NumPy是一种用于数值计算和科学计算的Python库。它提供了高效的多维数组对象和相关的操作函数,是进行数据分析和科学计算的重要工具之一。
(二)NumPy数组是指一种包含相同类型元素的网格,可以是一维数组、二维数组、三维数组等。与Python内置的列表相比,NumPy数组提供了更高效的数据存储和操作方式,对于大规模数据的处理和计算更加方便和高效。NumPy提供了丰富的数组操作和函数,可以进行向量化运算,使得相同的操作可以同时作用于数组中的每个元素,从而提高了计算效率。
(三)此外,NumPy还提供了许多用于科学计算的函数和工具,例如线性代数、傅里叶变换、随机数生成等。数值计算中广泛使用的线性代数库、统计函数库、随机数生成函数库等都是基于NumPy实现的。
二、numpy基础
(一)数组对象
- 用np.ndarray类的对象表示n维数组
实际数据:数组中元素
元数据:描述数组中的元素
将实际数据与元数据分开存放,一方面提高了内存空间的使用效率,另一方面减少对实际数据的访问频率,提高性能。
- numpy数组是同质数组,即所有元素的数据类型必须相同。
- numpy数组的下标从0开始,最后一个元素的下标为数组长度减1。
- np.ndarray.dtype/shape/size:类型/维度/大小
- np.arange(起始值,终止值,步长) -> 等差序列
import numpy as np
a = np.arange(1, 10)
print(a, type(a[0]), a.dtype)
import numpy as np
a = np.arange(1, 3)
print(a, a.shape)
b = np.array(
[[1, 2., '3'],
[4, 5, 6]]
)
print(b, b.shape)
c = np.array([np.arange(1, 4),
np.arange(4, 7),
np.arange(7, 10)])
print(c, c.shape)
import numpy as np
a = np.array([[10, 20, 30],
[40, 50, 60]])
print(a.shape, a.size, len(a))
总结
Python数据分析是指使用Python编程语言对数据进行收集、处理、分析和可视化的过程。Python数据分析是数据科学的重要组成部分,也是数据分析师和数据科学家必备的技能之一。