数据分析启蒙
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。
今天up决定实践一次,对2022年高考录取情况分析。

我们先在文件夹里建立input.txt和output.txt进行输入输出。其中output.txt是空的,而input.txt内容如下。
5.4 30.5 14 4.3
5.8 24.1 12.7 5.8
5.2 21.8 13.6 5.3
34.2 14.0 4.4 1.9
4.0 11.2 12.77 1.73
46.5 14.5 5.2 1.2
38.8 10.9 4.5 1.4
77 10.6 4.4 1.5
56 8.4 4.6 1.3
8.0 19.0 8.6 2.3
4.7 22.64 11.66 3.02
22.8 15.2 3.5 1.5
30.2 14.6 5.7 1.9
54.5 14.2 4.1 1.1
18.2 14.0 6.0 1.5
19.0 13.5 6.7 2.0
22.3 12.9 7.8 1.7
15.2 12.4 9.0 3.6
51.0 10.4 6.5 1.6
33.7 9.8 4.7 1.3
128.0 7.8 4.1 1.1
21.8 18.7 5.4 2.0
46 15.8 5.2 2.1
75 14.6 4.4 1.5
36.1 12.1 5.2 2.1
65.5 11.2 4.5 1.7
70.2 11.2 2.7 1.3
79.5 10.6 4.4 1.5
5.8 25.2 5.66 1.76
15.5 16.1 5.9 2.3
29.0 11.5 5.4 2.1
这是中国除了香港特别行政区,澳门特别行政区,和台湾省以外的31省市高考数据。
接着放入代码:
import sys#调出系统
sys.stdin=open('input.txt','r')#r代表读取数据,打开input.txt读取数据。
sys.stdout=open('output.txt','w')#w代表输出数据,打开output.txt输出数据。
input=sys.stdin.readline#输入数据一行一行的读取
n=31
m=[]
c=0
b=0
a=0
total=0
rate3=0
rate2=0
rate1=0
for i in range(n):
m.append(list(map(float,input().split(" "))))#建立二维数组储存数据
for i in range(0,31):
total=total+m[i][0]
for i in range(0,31):
c=c+m[i][1]*0.01*m[i][0]
for i in range(0,31):
b=b+m[i][2]*0.01*m[i][0]
for i in range(0,31):
a=a+m[i][3]*0.01*m[i][0]
rate3=round(c/total,3)*100
rate2=round(b/total,3)*100
rate1=round(a/total,3)*100
print(f"全国本一率为{rate3}%,全国211率为{rate2}%,全国985率为{rate1}%。")
对于全国985,211,本一录取率,可以先计算每个省市985,211,本一的录取人数相加再除以总的考生人数,算出录取率。



特别注意,数据分析的程序只能在pycharm的界面上运行成功,idle无法得到结果。
