GitHub 2019年度报告出炉

GitHub 2019年度报告出炉
一年一更的 GitHub 年度报告又在圣诞节前夕更新出炉啦!
网址 https://octoverse.github.com


词汇表

2019年:本报告中的一年是从最新Octoverse版本(2018年10月1日至2019年9月30日)的最后365天。
开发人员:开发人员是GitHub上的个人用户帐户,无论其活动如何。
位置:用户的国家/地区信息基于已知的最后位置。对于组织,我们从组织资料中获取最知名的位置信息,或者最活跃的国家组织成员都参与其中。 我们仅使用汇总形式的位置信息来查看特定国家或地区的增长趋势等信息。
我们不会看到比国家/地区级别更精细的位置信息粒度。开源项目:开源项目是具有开源许可证的公共存储库。
组织:组织帐户代表GitHub上的人员集合。这些可以是有偿的或免费的,无论大小,企业或非营利组织。
项目和存储库:尽管可以理解有时较大的项目可以跨越许多存储库,但我们可以互换使用项目和存储库。

不断扩张的章鱼猫空间
社区和平台发展概述
github的吉祥物:Octocat 章鱼猫 = Octopus 章鱼 + Cat 猫
总览
GitHub上有超过4000万开发人员,其中包括2019年的1000万新用户。
去年合并了超过 8700 万个请求请求,与2018年相比,在2019年打开第一个请求请求的开发人员增加了28%。
在学校
下一代开发人员正在世界各地的学校里学习,今年,有超过76万名学生在GitHub上学习。
共有 170万学生已经学会了代码在GitHub上,比去年多55%。
3.1 万教师已经使用的GitHub在他们的课程教给现实世界的开发商的工作流程,比去年多33%。
76 万活跃的学生学会与GitHub的学生开发包建。
在全球范围内活跃的 1.98万学校以及更多,使用的GitHub在其中,大学,训练营课程中。
工作中
我们的数据表明世界之间的联系日益紧密,工作中的开发人员也不例外。
今年,我们已经看到,公司不仅使用GitHub,而且还为开源做出贡献并加入开发人员社区。
去年,近70%的全球财富 50 强公司为开源做出了贡献。
290万多个组织将人们聚集在公共和私人存储库中。
今年,仅 GitHub Enterprise Cloud用户就在来自全球70多个不同国家的组织中工作。
去年,全球财富50强中有35家公司为开源做出了贡献,其中29家正在GitHub Enterprise上构建其业务背后的软件。

全球团队
GitHub使用情况和开源社区的区域细分
开源世界
开源由维护者,开发人员,研究人员,设计师,作家等组成的全球团队构建。
平均而言,今年GitHub上的每个开源项目都欢迎来自41个不同国家和地区的贡献者。
按美国以外的总贡献者

按开放源使用量(克隆和分支)在美国以外的前20个地区
在美国之后,开放源代码的使用今年在中国,印度和德国加快了速度。中国的开发商分叉并克隆的项目比去年增加了48%。
总体贡献

贡献正在增加,而不仅仅是开源。从公共和私人捐助来看,亚洲的开发者社区在2019年增长迅速。亚洲贡献者总数的31%为中国,但开发商在整个非洲大陆的贡献更多。
项目和依赖项

平均而言,3.6m +的存储库取决于前50个开源项目中的每一个。诸如 rails / rails, facebook / jest和 axios / axios之类的项目也被数百万其他存储库使用。
平均而言,203个程序包依赖项通过启用的依赖关系图支持每个公共和私有存储库。开源项目平均具有180个程序包依赖项。但是这个数字的范围可以从几个软件包到1000个以上。
今年有350千多人为1000万个顶级项目贡献了500万以上(按星级数排序)。
今年有1.3百万+的首次贡献者加入了开源社区,并首次为开源项目做出了贡献。
包语言的平均包贡献者和依赖关系

每个语言生态系统(JavaScript,Python,Ruby等)中排名前50位的开源程序包都有数量众多的依赖项目。
例如,尽管每个平均直接贡献者少于40个,但流行的npm软件包仍可能是数百万其他存储库的依赖项。
项目依赖程度最高的十大开源软件包

仔细研究发现,有超过四百万个存储库分别依赖于lodash / lodash,expressjs / express和visionmedia / debug。


相互联系的社区
深入研究依赖项数据和贡献者
项目焦点:TensorFlow

作为GitHub上最受欢迎的项目之一,TensorFlow可以向我们展示开源项目如何连接更大的软件社区。

依赖Python软件包的存储库的社区贡献者平均数量约为19K。

TensorFlow的社区也不例外。成千上万的人为其依赖项做出了贡献,例如Numpy,Pytest等。
社区推动的安全
代码重用可以帮助每个人以前所未有的速度构建软件,但同时也使开发人员面临从其依赖项分发安全漏洞的风险。
当发现潜在的漏洞时,我们会看到维护者,开发人员,研究人员和工具生态系统一起工作,以确保代码安全。
社区趋势
趋势项目及其动力工具
热门和热门项目
贡献者的顶级开源项目
今年,流行的开源项目贡献了1万多名。两人已在此列表中,因为2016年 microsoft/vscode 和 ansible / ansible。
2019年的新功能是 flutter/flutter ,firsttributions / first-tributions 和 home-assistant / home-assistant。
热门语言
随着时间的推移最受欢迎的语言

今年,C#和Shell排名上升。在存储库贡献者中,Python首次超过Java,成为GitHub上第二受欢迎的语言。
行业焦点:数据科学
尽管GitHub历来是软件开发人员的家,但全球代码在不断发展。Python增长的背后是一个快速扩展的数据科学专业人员和爱好者社区,以及他们每天使用的工具和框架。其中包括许多由Python驱动的核心数据科学软件包,这些软件包既降低了数据科学工作的障碍,又证明了学术界和公司等项目的基础。
除了Python以外,随着越来越多的社区专注于数据科学,近年来诸如“深度学习”,“自然语言处理”和“机器学习”等主题的存储库变得越来越流行。在最流行(基于星标)的,带有该主题的公共存储库中,超过一半的存储库基于numpy构建,其中许多依赖于scipy,scikit-learn和TensorFlow。我们还看到了数据科学领域的非代码贡献,包括学术论文。