欢迎光临散文网 会员登陆 & 注册

006-【CMU15-418】【并行计算架构和编程】【中英字幕】

2023-08-12 14:18 作者:alexphil  | 我要投稿

1. /proc是现代操作系统中的一个虚拟文件系统,以类似文件的格式导出系统状态信息。

2. /proc中的每个目录代表一个特定的进程,其中的文件包含有关进程的各种信息。

3. /proc中的CPU信息文件提供有关处理器的详细信息,例如厂商ID、型号名称、缓存大小和功耗。

4. /proc中的信息可以由人类或程序访问和处理,可以使用grep来搜索特定的信息。

5. 了解处理器的详细信息,例如缓存大小和功能单元,可以帮助优化代码以获得更好的性能。

6. 在计算机架构中,调度纪律可以在某些情况下非常有用,但需要有更多的专业知识。

7. 需要意识到聚合带宽很少会被完全利用,因为请求模式可能是读取为主或者是混合读写模式。

8. 在优化程序性能时,需要关注内部循环,减少乘法和除法的次数可以提高性能。

9. 在优化之前,首先要确保程序的正确性,并进行性能测量,以确定性能瓶颈所在。

10. 需要避免不必要的优化,专注于对性能影响最大的部分。

11. 人类直觉是系统性能的不准确指标,需要进行测量。

12. 通过重构代码,将不需要在循环中计算的部分移出内部循环,可以提高性能。

13. 循环的测试条件会增加额外开销,影响性能。

14. 循环展开可以减少测试条件的开销,提高并行性。

15. 浮点数运算的结果可能因为舍入误差而不准确,需要注意。

16. 通过查看汇编代码,我们可以了解编译器实际给我们的内容。

17. 将变量声明为uniform可以提高性能,因为它们不需要在每个实例中重新计算。

18. 通过常规优化,我们可以获得15倍的速度提升,而向量化可以获得5.4倍的速度提升。

19. 优化会影响代码质量,增加引入错误的风险。

20. 在内部工作循环中进行优化非常重要,因为它们决定了是否能够及时为客户提供结果。


006-【CMU15-418】【并行计算架构和编程】【中英字幕】的评论 (共 条)

分享到微博请遵守国家法律