#每天一点点# python 空气质量AQI数据分析与预测
点击可以查看 分析:用到的库,数据集,数据清洗
点击可以查看 分析:相关系数矩阵
#四:数据分析 #1:空气质量最好/最差的5个城市 #最好的5个城市 #sort_values对列进行排序
t = data[['City','AQI']].sort_values('AQI') #只取城市和空气质量,按照空气质量排序 display(t.iloc[:5]) #取最好的前5个 sns.barplot(x = 'City',y = 'AQI',data = t.iloc[:5]) #柱状图输出结果 ?????????? 输出结果???????????
#最差的5个城市
display(t.iloc[-5:]) #最差的5个,字段可以执行了看下 sns.barplot(x= 'City',y = 'AQI',data = t.iloc[-5:])输出结果 ?????????? 输出结果???????????
#2:临海城市是否空气质量优于内陆城市? #首先统计下临海城市与内陆城市的数量 #根据 "Coastal 是否沿海 "字段来统计城市数量
display(data['Coastal'].value_counts()) sns.countplot(x = 'Coastal',data = data) #直方图输出结果 ??????????
输出结果???????????
#然后观察临海城市和内陆城市的散点图
sns.swarmplot(x = 'Coastal',y = 'AQI',data = data)输出结果 ?????????? 输出结果???????????
#分组计算空气质量的均值
display(data.groupby ('Coastal')['AQI'].mean()) #均值 sns.barplot(x = 'Coastal',y = 'AQI',data = data) #柱状图输出结果 ?????????? 输出结果???????????
#柱形图仅仅能进行均值比较,再用箱线图显示更多信息
sns.boxplot(x = 'Coastal',y = 'AQI',data = data)输出结果 ?????????? 输出结果???????????
#可以绘制小提琴图,看出分布的密度
sns.violinplot(x = 'Coastal', y = 'AQI',data = data)输出结果 ?????????? 输出结果???????????
#将散点与箱线图或小提琴图组合在一起
sns.violinplot(x= 'Coastal',y='AQI',data = data,inner = None) sns.swarmplot(x = 'Coastal',y = 'AQI',color = 'g',data = data)输出结果 ?????????? 输出结果???????????