Pandas_条件过滤——15行代码
创建一个DataFrame对象,既可以进行Series过滤也可以DataFrame过滤
1. 先看一下怎么进行Series过滤
先创建一个DataFrame对象,代码如下
import pandas as pd data=pd.DataFrame({ 'name':['zhangsan','lisi','wangwu'], 'age':[19,20,18], 'sex':['boy','gilr','boy'], 'score':[100,99,99] },index=('zhangsan','lisi','wangwu'),columns=('age','sex','score')) data
取出DataFrame对象中的某一列,就是一个Series对象,然后就可以对Series对象进行过滤操作
#取出某一列,比如说取出年龄这一列 ages = data['age'] #对取出的这一列进行过滤操作 ages.min(),ages.max(),ages.std()
运行结果如下
还可以排序操作,代码如下
#将年龄按照顺序进行排列 ages.sort_values(),ages.sort_values(ascending=False)
运行结果如下
还可以按照条件进行过滤取值,代码如下
#取出大于平均值的分数 scores = data['score'] scores[scores>scores.mean()]
运行结果如下
2. 再看一下怎么对DataFrame对象进行过滤
直接在data里边写条件
data[scores>scores.mean()]
运行结果
#这一行代码,意思是选其中的两列进行展示,来吧,展示 data[scores>scores.mean()].loc[:,['sex','score']]
运行结果
如果使用多个条件进行过滤,应该这样操作