Numpy使用教程(二)
· 阅读需 10 分钟
numpy随机抽样
随机数生成
numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个数组,并使用 [0, 1) 区间随机数据填充,这些数据均匀分布。
In [1]: import numpy as np
In [2]: np.random.rand(2,3)
Out[2]:
array([[ 0.09887339, 0.75074537, 0.9944429 ],
[ 0.92790081, 0.84365033, 0.3087985 ]])
-
numpy.random.randn(d0, d1, ..., dn): 返回符合标准正态分布的随机数据 -
numpy.random.randint(low, high, size, dtype): 返回[low, high)的随机整数 -
numpy.random.random_integers(low, high, size): 返回[low, high]的随机整数 -
numpy.random.random_sample(size): 在[0,1)区间生成指定size的随机浮点数 与之类似的方法还有: -
numpy.random.random([size]) -
numpy.random.ranf([size]) -
numpy.random.sample([size]) -
numpy.random.choice(a, size, replace, p): 在给定的一维数组里生成随机数
概率密度分布
numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。numpy.random.binomial(n, p, size):从二项分布中生成随机数。numpy.random.chisquare(df,size):从卡方分布中生成随机数。numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。numpy.random.exponential(scale,size):从指数分布中生成随机数。numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。numpy.random.geometric(p,size):从几何分布中生成随机数。numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。numpy.random.logseries(p,size):从对数系列分布中生成随机数。numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。numpy.random.poisson(lam,size):从泊松分布中生成随机数。numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。numpy.random.standard_exponential(size):从标准指数分布中生成随机数。numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。numpy.random.standard_normal(size):从标准正态分布中生成随机数。numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。numpy.random.uniform(low,high,size):从均匀分布中生成随机数。numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随 机数。numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。numpy.random.weibull(a,size):从威布尔分布中生成随机数。numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。
数学函数
三角函数
numpy.sin(x):三角正弦。numpy.cos(x):三角余弦。numpy.tan(x):三角正切。numpy.arcsin(x):三角反正弦。numpy.arccos(x):三角反余弦。numpy.arctan(x):三角反正切。numpy.hypot(x1,x2):直角三角形求斜边。numpy.degrees(x):弧度转换为度。numpy.radians(x):度转换为弧度。numpy.deg2rad(x):度转换为弧度。numpy.rad2deg(x):弧度转换为度。
双曲函数
numpy.sinh(x):双曲正弦。numpy.cosh(x):双曲余弦。numpy.tanh(x):双曲正切。numpy.arcsinh(x):反双曲正弦。numpy.arccosh(x):反双曲余弦。numpy.arctanh(x):反双曲正切。
数值修约
numpy.around与numpy.round_等价,四舍六入五取偶。
>>> a = np.array([1.4, 1.5, 1.6, 2.4, 2.5, 2.6])
>>> np.around(a, 0)
array([ 1., 2., 2., 2., 2., 3.])
numpy.around(a):平均到给定的小数位数。numpy.round_(a):将数组舍入到给定的小数位数。numpy.rint(x):修约到最接近的整数。numpy.fix(x, y):向 0 舍入到最接近的整数。numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).numpy.trunc(x):返回输入的截断 值。
求和、求积、差分
numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。numpy.gradient(f):返回 N 维数组的梯度。numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。
指数和对数
numpy.exp(x):计算输入数组中所有元素的指数。numpy.expm1(x):对数组中的所有元素计算 exp(x) - 1.numpy.exp2(x):对于输入数组中的所有 p, 计算 2 ** p。numpy.log(x):计算自然对数。numpy.log10(x):计算常用对数。numpy.log2(x):计算二进制对数。numpy.log1p(x):log(1 + x)。numpy.logaddexp(x1, x2):log2(2**x1 + 2**x2)。numpy.logaddexp2(x1, x2):log(exp(x1) + exp(x2))。
算术运算
numpy.add(x1, x2):对应元素相加。numpy.reciprocal(x):求倒数 1/x。numpy.negative(x):求对应负数。numpy.multiply(x1, x2):求解乘法。numpy.divide(x1, x2):相除 x1/x2。numpy.power(x1, x2):类似于 x1^x2。numpy.subtract(x1, x2):减法。numpy.fmod(x1, x2):返回除法的元素余项。numpy.mod(x1, x2):返回余项。numpy.modf(x1):返回数组的小数和整数部分。numpy.remainder(x1, x2):返回除法余数。
矩阵和向量积
numpy.dot(a,b):求解两个数组的点积。numpy.vdot(a,b):求解两个向量的点积。numpy.inner(a,b):求解两个数组的内积。numpy.outer(a,b):求解两个向量的外积。numpy.matmul(a,b):求解两个数组的矩阵乘积。numpy.tensordot(a,b):求解张量点积。numpy.kron(a,b):计算 Kronecker 乘积。
其他
numpy.angle(z, deg):返回复参数的角度。numpy.real(val):返回数组元素的实部。numpy.imag(val):返回数组元素的虚部。numpy.conj(x):按元素方式返回共轭复数。numpy.convolve(a, v, mode):返回线性卷积。numpy.sqrt(x):平方根。numpy.cbrt(x):立方根。numpy.square(x):平方。numpy.absolute(x):绝对值, 可求解复数。numpy.fabs(x):绝对值。numpy.sign(x):符号函数。numpy.maximum(x1, x2):最大值。numpy.minimum(x1, x2):最小值。numpy.nan_to_num(x):用 0 替换 NaN。numpy.interp(x, xp, fp, left, right, period):线性插值。
代数运算
numpy.linalg.cholesky(a):Cholesky 分解。numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。numpy.linalg.eigvals(a):计算矩阵的特征值。numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。numpy.linalg.cond(x ,p):计算矩阵的条件数。numpy.linalg.det(a):计算数组的行列式。numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。numpy.linalg.solve(a,b):求解线性矩阵方程或线性标量方程组。numpy.linalg.tensorsolve(a,b ,axes):为 x 解出张量方程a x = bnumpy.linalg.lstsq(a,b ,rcond):将最小二乘解返回到线性矩阵方程。numpy.linalg.inv(a):计算逆矩阵。numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。numpy.linalg.tensorinv(a ,ind):计算N维数组的逆。
索引与切片
基本格式:ndarray[start:stop:step],包含start,不包含stop。
>>> a = np.arange(20).reshape(4,5)
>>> a
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
>>> a[0:3,2:4]
array([[ 2, 3],
[ 7, 8],
[12, 13]])
排序、搜索、计数
排序
numpy.sort(a, axis=-1, kind='quicksort', order=None)
a:数组。axis:要排序的轴。如果为None,则在排序之前将数组铺平。默认值为-1,沿最后一个轴排序。kind:{'quicksort','mergesort','heapsort'},排序算法。默认值为quicksort。
其它排序方法:
numpy.lexsort(keys ,axis):使用多个键进行间接排序。numpy.argsort(a ,axis,kind,order):沿给定轴执行间接排序。numpy.msort(a):沿第 1 个轴排序。numpy.sort_complex(a):针对复数排序。
搜索和计数
argmax(a ,axis,out):返回数组中指定轴的最大值的索引。nanargmax(a ,axis):返回数组中指定轴的最大值的索引,忽略 NaN。argmin(a ,axis,out):返回数组中指定轴的最小值的索引。nanargmin(a ,axis):返回数组中指定轴的最小值的索引,忽略 NaN。argwhere(a):返回数组中非 0 元素的索引,按元素分组。nonzero(a):返回数组中非 0 元素的索引。flatnonzero(a):返回数组中非 0 元素的索引,并铺平。where(条件,x,y):根据指定条件,从指定行、列返回元素。searchsorted(a,v ,side,sorter):查找要插入元素以维持顺序的索引。extract(condition,arr):返回满足某些条件的数组的元素。count_nonzero(a):计算数组中非 0 元素的数量。