post on 29 Sep 2019 about 2388words require 8min
CC BY 4.0 (除特别声明或转载文章外)
如果这篇博客帮助到你,可以请我喝一杯咖啡~
Pandas 数据导入;数据变换处理;统计汇总描述;假设检验;可视化等
学习 Pandas 数据分析基础,统计描述及数据可视化等
所用机器型号为 VAIO Z Flip 2016
1
2
3
4
import pandas as pd
import numpy as np
df = pd.read_csv("anscombe.csv")
np.array(df) # 将 df.DataFrame 转换成 Numpy 数据类型
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
array([['I', 10.0, 8.04],
['I', 8.0, 6.95],
['I', 13.0, 7.58],
['I', 9.0, 8.81],
['I', 11.0, 8.33],
['I', 14.0, 9.96],
['I', 6.0, 7.24],
['I', 4.0, 4.26],
['I', 12.0, 10.84],
['I', 7.0, 4.82],
['I', 5.0, 5.68],
['II', 10.0, 9.14],
['II', 8.0, 8.14],
['II', 13.0, 8.74],
['II', 9.0, 8.77],
['II', 11.0, 9.26],
['II', 14.0, 8.1],
['II', 6.0, 6.13],
['II', 4.0, 3.1],
['II', 12.0, 9.13],
['II', 7.0, 7.26],
['II', 5.0, 4.74],
['III', 10.0, 7.46],
['III', 8.0, 6.77],
['III', 13.0, 12.74],
['III', 9.0, 7.11],
['III', 11.0, 7.81],
['III', 14.0, 8.84],
['III', 6.0, 6.08],
['III', 4.0, 5.39],
['III', 12.0, 8.15],
['III', 7.0, 6.42],
['III', 5.0, 5.73],
['IV', 8.0, 6.58],
['IV', 8.0, 5.76],
['IV', 8.0, 7.71],
['IV', 8.0, 8.84],
['IV', 8.0, 8.47],
['IV', 8.0, 7.04],
['IV', 8.0, 5.25],
['IV', 19.0, 12.5],
['IV', 8.0, 5.56],
['IV', 8.0, 7.91],
['IV', 8.0, 6.89]], dtype=object)
1
df.reindex(['a','b','c'])
原图的列下标换成了['a','b','c']
。
1
df.reindex(['a','b','c']).dropna()
在上一步的基础上删去了所有 NaN 值,于是输出了一张空表。
1
df.reindex(['a','b','c']).fillna(17341163)
在第一步的基础上把所有 NaN 换成了我的学号17341163
。
1
df.isnull()
用布尔值填充原表。
1
2
import matplotlib
matplotlib.pyplot.show(df.mean().plot(kind = 'line')) # 折线图
如图(见附件吴坎(17341163)_lab4_1.ipynb
),原数据集的均值先增后减。
1
df.groupby(by="dataset").mean()
一些 Pandas 的基础操作,还是相对比较简单,没有遇到多大问题。
anscombe.csv
dataset,x,y
I,10.0,8.04
I,8.0,6.95
I,13.0,7.58
I,9.0,8.81
I,11.0,8.33
I,14.0,9.96
I,6.0,7.24
I,4.0,4.26
I,12.0,10.84
I,7.0,4.82
I,5.0,5.68
II,10.0,9.14
II,8.0,8.14
II,13.0,8.74
II,9.0,8.77
II,11.0,9.26
II,14.0,8.1
II,6.0,6.13
II,4.0,3.1
II,12.0,9.13
II,7.0,7.26
II,5.0,4.74
III,10.0,7.46
III,8.0,6.77
III,13.0,12.74
III,9.0,7.11
III,11.0,7.81
III,14.0,8.84
III,6.0,6.08
III,4.0,5.39
III,12.0,8.15
III,7.0,6.42
III,5.0,5.73
IV,8.0,6.58
IV,8.0,5.76
IV,8.0,7.71
IV,8.0,8.84
IV,8.0,8.47
IV,8.0,7.04
IV,8.0,5.25
IV,19.0,12.5
IV,8.0,5.56
IV,8.0,7.91
IV,8.0,6.89
Related posts