哈喽,大家好,我们今天继续来总结pandas的面试题。
1、pandas查看数据的方法有哪些?
第一种:查看数据的前几行,可以通过输入相应的数据,调整查看的行数:
df.head
第二种:查看数据的后几行,跟head用法一致:
df.tail
第三种:随机查看数据,同样可以在括号中选择不同的数字,调整随机的数量:
df.sample(5)
2、pandas分析数据的方法都有哪些?
1)查看数据的行列数
df.shape
2)查看数据更加详细的信息,比如索引、数据类型和内存信息:
df.info
3)数据统计,通过这个函数可以大致了解平均数、中位数等信息:
df.describe
4)查看各字段类型
df.dtypes
5)查看数据的行和列名
df.axes
3、如何指定特定的行和列?
df.loc[行的范围, 列的范围]
df.iloc[行的索引, 列的索引]
比如df.iloc[:10,:] 代表着前10行
4、分组聚合:
比如下面的意思是,按照xx进行分组,并且求和,还可以按照xx进行分组求平均数等操作:
df.groupby('xx').sum
df.groupby('xx').mean
5、统计函数有哪些?
1)返回列与列之间的相关系数:df.corr
2)返回每一列中的非空值的个数:df.count
3)返回每一列的标准差:df.std
4) 返回方差:df.var