Numpy是高性能科学计算和数据分析的基础包。Numpy本身并没有提供多么高级的数据分析功能,理解 Numpuy 数组以及面向数组的计算将有助于你提高处理数据能力。本节内容介绍ndarray数组和矩阵。
一、ndarray数组基础
使用 ndarray 数组,需要导入 Numpy 函数库。
导入方法1:直接导入该函数库:
from numpy import *
导入方法2:指定导入库的别名(在引入多个库的时候,推荐使用这个方法)。
import numpy as np
下面正式进入Numpy的数组世界。如果没有说明,所称数组均为 Numpy 数组对象,与 Python 的列表和 array模块无关。
1.1 创建数组
创建数组是进行数组计算的第一步,可以通过numpy库包内的array()函数定义数组实例对象,其参数为Python 的序列对象,如果想定义多维数组,则传递多层嵌套的序列。
例如下面这条语句定义了一个二维数组,其大小为(2,3),即有2行,3列。
a = np.array([[1,2,3.0],[2,3,4.0]])
print(a)
以下三种操作,可以帮助我们查看数组的一些属性:
查看行数使用 ndim
a.ndim
查看数组的维数使用shape,返回(n,m), 其中 n 为行数,m 为列数。
a.shape
查看元素的类型使用dtype,比如 numpy.int32、numpy.float64
a.dtype
1.2 特殊数组
Numpy的特殊数组主要有以下三种:
zeros数组:全零数组,元素全为0;
ones数组:全1数组,元素全为1;
empty数组:空数组,元素全近似为0;
创建方法分别为:
zeros数组
np.zeros((2,5))
ones数组
np.ones((6,7))
empty数组
np.empty((3,3))
1.3 序列数组
arange函数:属于Numpy 库,其参数依次为:开始值、结束值、步长。
np.arange(1,100,5)
linspace 函数创建等差序列数组,其参数依次为:开始值、结束值、元素数量。
np.linspace(1,100,5)
1.4 数组索引
Numpy 数组的每个元素、每行元素、每列元素都可以用索引访问。注意:索引是从 0 开始的。
其操作与列表基本相同,以下是三种操作方式。
a = np.array([[1,2,4.0],[3,6,9]])
1.取 a 的第一行元素
a[0]
2.取 a 的第二列元素
a[:,1]
3.取 a 的第一行的第三个元素
a[0,2]
1.5 数组运算,以下介绍10种常用运算
a = np.array([1,2,3])
b = np.array([4.,5,6])
1.加法运算
a + b
2.减法运算
a - b
3.乘法运算
a * b
4.乘方运算:a的2次方
a ** 2
5.除法运算
a/b
6.数组点乘
np.dot(a,b)
7.判断大小,返回 bool 值
a >= 2
8.a中最大的元素
a.max()
9.a中最小的元素
a.min()
10.a的和
a.sum()
1.6 数组拷贝
数组的拷贝分为浅拷贝和深拷贝两种,浅拷贝通过数组变量的复制完成,深拷贝使用数组对象的copy方法完成。
浅拷贝只拷贝数组的引用,如果对拷贝对象修改。原数组也将修改。
以下是浅拷贝的演示:
a = np.ones((2,3))
print(a)
b 为 a 的浅拷贝
b = a
print(b)
对 b 进行修改,a 也会被修改
b[1,2] = 9
print(a)
以下是深拷贝的演示:
深拷贝会复制一份和原数组一样的数组,但他们在内存中是分开存放的,所以改变拷贝数组,原数组不会改变。
a = np.ones((2,3))
print(a)
b = a.copy()
b[1,2] = 9
print(b)
print(a)
1.7 数组重塑、合并与拆分
1.一维数组转变成二维数组
通过reshape( )函数即可实现
data=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
data.reshape((2,5))
作为参数的形状的其中一维可以是-1,它表示该维度的大小由数据本身推断而来,因此上面代码等价于:
data.reshape((2,-1))
data.reshape((-1,2))
2.二维数组转换成一维数组
将多维数组转换成一维数组的运算通常称为扁平化(flattening)或散开(raveling),因此有两个函数可供选择。两者功能是一致的。
ravel函数返回的是源数据的视图而不是副本,对其修改会影响源数组
flatte函数返回的是源数据的副本,对其修改不会影响源数组
data=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
data=data.reshape((2,-1))
data
data2=data.ravel()
data2[0]=10
data2
data
data=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
data=data.reshape((2,-1))
data
data2=data.flatten()
data2[0]=10
data2
data
3.数组的合并
numpy提供许多数组合并的方法,这里只介绍最为常用的一种,即concatenate方法
arr1 = np.array([[1,2,3], [4,5,6]])
print(arr1)
arr2 = np.array([[7,8,9], [10,11,12]])
print(arr2)
data = np.concatenate([arr1, arr2], axis=0) # axis参数指明合并的轴向,0表示按行,1表示按列
data
arr1 = np.array([[1,2,3], [4,5,6]])
print(arr1)
arr2 = np.array([[7,8,9], [10,11,12]])
print(arr2)
data = np.concatenate([arr1, arr2], axis=1) # axis参数指明合并的轴向,0表示按行,1表示按列
data
4.数组的拆分
这里只介绍split函数
np.split(data, [1], axis=0)#data为拆分的数组,[1]为拆分的行号或列号,axis表明按列或者行进行拆分(默认为0,即按行拆分)
np.split(data, [2], axis=1)#data为拆分的数组,[1]为拆分的行号或列号,axis表明按列或者行进行拆分(默认为0,即按行拆分)
np.split(data, [2,4], axis=1)#data为拆分的数组,[1]为拆分的行号或列号,axis表明按列或者行进行拆分(默认为0,即按行拆分)
2.1 创建矩阵
Numpy的矩阵对象与数组对象相似,主要不同之处在于,矩阵对象的计算遵循矩阵数学运算规律。
矩阵使用 matrix 函数创建,以(2,2)大小的矩阵为例(2行2列),定义方法如下:
a = np.matrix([[1.0,2.0],[3.0,4.0]])
print(a)
type函数可以查看a的类型
type(a)
2.2 矩阵运算
矩阵的常用数学运算有转置、乘法、求逆等。分别一一实例讲述。
创建一个矩阵
b=np.matrix([[4.0,6.0],[2.0,8.0]])
print(b)
1.转置操作
b.T
2.矩阵乘法
c=np.matrix([[2.0,2.0],[2.0,2.0]])
b*c
3.逆矩阵
b.I