欢迎光临散文网 会员登陆 & 注册

数据分析启蒙

2023-03-26 15:55 作者:温和派的美年达  | 我要投稿

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

今天up决定实践一次,对2022年高考录取情况分析。

我们先在文件夹里建立input.txt和output.txt进行输入输出。其中output.txt是空的,而input.txt内容如下。

5.4 30.5 14 4.3

5.8 24.1 12.7 5.8

5.2 21.8 13.6 5.3

34.2 14.0 4.4 1.9

4.0 11.2 12.77 1.73

46.5 14.5 5.2 1.2

38.8 10.9 4.5 1.4

77 10.6 4.4 1.5

56 8.4 4.6 1.3

8.0 19.0 8.6 2.3

4.7 22.64 11.66 3.02

22.8 15.2 3.5 1.5

30.2 14.6 5.7 1.9

54.5 14.2 4.1 1.1

18.2 14.0 6.0 1.5

19.0 13.5 6.7 2.0

22.3 12.9 7.8 1.7

15.2 12.4 9.0 3.6

51.0 10.4 6.5 1.6

33.7 9.8 4.7 1.3

128.0 7.8 4.1 1.1

21.8 18.7 5.4 2.0

46 15.8 5.2 2.1

75 14.6 4.4 1.5

36.1 12.1 5.2 2.1

65.5 11.2 4.5 1.7

70.2 11.2 2.7 1.3

79.5 10.6 4.4 1.5

5.8 25.2 5.66 1.76

15.5 16.1 5.9 2.3

29.0 11.5 5.4 2.1

这是中国除了香港特别行政区,澳门特别行政区,和台湾省以外的31省市高考数据。

接着放入代码:

import sys#调出系统
sys.stdin=open('input.txt','r')#r代表读取数据,打开input.txt读取数据。
sys.stdout=open('output.txt','w')#w代表输出数据,打开output.txt输出数据。
input=sys.stdin.readline#输入数据一行一行的读取
n=31
m=[]
c=0
b=0
a=0
total=0
rate3=0
rate2=0
rate1=0
for i in range(n):
   m.append(list(map(float,input().split(" "))))#建立二维数组储存数据
for i in range(0,31):
   total=total+m[i][0]
for i in range(0,31):
   c=c+m[i][1]*0.01*m[i][0]
for i in range(0,31):
   b=b+m[i][2]*0.01*m[i][0]
for i in range(0,31):
   a=a+m[i][3]*0.01*m[i][0]
rate3=round(c/total,3)*100
rate2=round(b/total,3)*100
rate1=round(a/total,3)*100
print(f"全国本一率为{rate3}%,全国211率为{rate2}%,全国985率为{rate1}%。")

对于全国985,211,本一录取率,可以先计算每个省市985,211,本一的录取人数相加再除以总的考生人数,算出录取率。

特别注意,数据分析的程序只能在pycharm的界面上运行成功,idle无法得到结果。


数据分析启蒙的评论 (共 条)

分享到微博请遵守国家法律