当前位置:首页 / 行业资讯 / 搜索资讯 / Pandas Series入门教程
Pandas Series入门教程
发布时间:2022/07/05来源:ylzug

Series 结构,也称 Series 序列,是 Pandas 常用的数据结构之一,它是一种类似于一维数组的结构,由一组数据值(value)和一组标签组成,其中标签与数据值之间是一一对应的关系。

Series 可以保存任何数据类型,比如整数、字符串、浮点数、Python 对象等,它的标签默认为整数,从 0 开始依次递增。Series 的结构图,如下所示:


  通过标签我们可以更加直观地查看数据所在的索引位置。
创建Series对象 Pandas 使用 Series()  函数来创建 Series 对象,通过这个对象可以调用相应的方法和属性,从而达到处理数据的目的:
import pandas as pd s=pd.Series( data, index, dtype, copy) 参数说明如下所示:

参数名称 描述
data   输入的数据,可以是列表、常量、ndarray 数组等。  
index   索引值必须是惟一的,如果没有传递索引,则默认为 np.arrange(n)。  
dtype   dtype表示数据类型,如果没有提供,则会自动判断得出。  
copy   表示对 data 进行拷贝,默认为 False。  

我们也可以使用数组、字典、标量值或者 Python 对象来创建 Series 对象。下面展示了创建 Series 对象的不同方法: 1) 创建一个空Series对象 使用以下方法可以创建一个空的 Series 对象,如下所示: import pandas as pd #输出数据为空 s = pd.Series() print(s) 输出结果如下:

Series([], dtype: float64)

2) ndarray创建Series对象 ndarray 是 NumPy 中的数组类型,当 data 是 ndarry 时,传递的索引必须具有与数组相同的长度。假如没有给 index 参数传参,在默认情况下,索引值将使用是 range(n) 生成,其中 n 代表数组长度,如下所示:

[0,1,2,3…. range(len(array))-1]

使用默认索引,创建 Series 序列对象: import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data) print (s) 输出结果如下: 0 a 1 b 2 c 3 d dtype: object 上述示例中没有传递任何索引,所以索引默认从 0 开始分配 ,其索引范围为 0 到len(data)-1,即 0 到 3。这种设置方式被称为“隐式索引”。

除了上述方法外,你也可以使用“显式索引”的方法定义索引标签,示例如下: import pandas as pd import numpy as np data = np.array(['a','b','c','d']) #自定义索引标签(即显示索引) s = pd.Series(data,index=[100,101,102,103]) print(s) 输出结果: 100 a 101 b 102 c 103 d dtype: object 3) dict创建Series对象 您可以把 dict 作为输入数据。如果没有传入索引时会按照字典的键来构造索引;反之,当传递了索引时需要将索引标签与字典中的值一一对应。

下面两组示例分别对上述两种情况做了演示。

示例1,没有传递索引时: import pandas as pd import numpy as np data = {'a' : 0., 'b' : 1., 'c' : 2.} s = pd.Series(data) print(s) 输出结果: a 0.0 b 1.0 c 2.0 dtype: float64 示例 2,为index参数传递索引时: import pandas as pd import numpy as np data = {'a' : 0., 'b' : 1., 'c' : 2.} s = pd.Series(data,index=['b','c','d','a']) print(s) 输出结果: b 1.0 c 2.0 d NaN a 0.0 dtype: float64 当传递的索引值无法找到与其对应的值时,使用 NaN(非数字)填充。 4) 标量创建Series对象 如果 data 是标量值,则必须提供索引,示例如下: import pandas as pd import numpy as np s = pd.Series(5, index=[0, 1, 2, 3]) print(s) 输出如下: 0 5 1 5 2 5 3 5 dtype: int64 标量值按照 index 的数量进行重复,并与其一一对应。 访问Series数据 上述讲解了创建 Series 对象的多种方式,那么我们应该如何访问 Series 序列中元素呢?分为两种方式,一种是位置索引访问;另一种是索引标签访问。
1) 位置索引访问 这种访问方式与 ndarray 和 list 相同,使用元素自身的下标进行访问。我们知道数组的索引计数从 0 开始,这表示第一个元素存储在第 0 个索引位置上,以此类推,就可以获得 Series 序列中的每个元素。下面看一组简单的示例: import pandas as pd s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e']) print(s[0]) #位置下标 print(s['a']) #标签下标 输出结果:
分享到:
免责声明:本文仅代表文章作者的个人观点,与本站无关,请读者仅作参考,并自行核实相关内容。文章内容来源于网络,版权归原作者所有,如有侵权请与我们联系,我们将及时删除。
资讯推荐
热门最新
精品工具
全部评论(0)
剩余输入数量90/90
暂无任何评论,欢迎留下你的想法
你可能感兴趣的资讯
换一批