练习1

读取 catNames2.csv 文件,完成需求如下:

  • 找到所有的使用次数超过800的猫的名字
  • 获取用次数最高的名字
1
2
3
4
5
6
7
8
9
10
11
import pandas as pd


cns = pd.read_csv('./catNames2.csv')
# print(cns)
#找到所有的使用次数超过800的猫的名字
print(cns[cns['Count_AnimalName']>800])
counts_sort = cns.sort_values(by='Count_AnimalName',ascending=False)
#获取用次数最高的名字
maxcounts = counts_sort.iloc[0]
print(maxcounts)

练习2

  • 读取 五粮液2020.xlsx 数据,指定 索引为0列 为 行索引
  • 查看 该数据的基本信息
  • 计算每一天各指标的差异值
  • 计算其 pre_close 的增长率
  • 将 pre_close 的增长率添加至 wly_data 数据中
  • 将 pct_change 该列 呈现的 NaN 用0填充
  • 查看 pre_close 与 pct_change 的相关性
  • 将 pct_change 这列乘以100 保留两位小数 成为百分比
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import pandas as pd


#读取 五粮液2020.xlsx 数据,指定 索引为0列 为 行索引
wly = pd.read_excel('五粮液2020.xlsx',index_col=0)

#查看数据基本信息
print(wly.info())

#计算各指标差异值
chayi = wly.diff()
# print(chayi)

#计算pre_close增长率
chayilv = wly['pre_close'].pct_change()
# print(chayilv)

#将增长率添加至wly_data数据
wly['wly_data'] = chayilv
# print(wly)

#将pct_change呈现的NaN用0进行填充
wly['wly_data'] = wly['wly_data'].fillna(0)
# print(wly)

#查看pre_close与pct_change的相关性
xiangguanxing = wly['pre_close'].corr(wly['wly_data'])
print(xiangguanxing)

#将pct_change这列乘以100保留两位小数成为百分比
f = lambda x:'{:.2%}'.format(x*100)
wly['wly_data'] = wly['wly_data'].apply(f)
wly.to_csv('jiu2020.csv',index=True,header=True)