欢迎光临散文网 会员登陆 & 注册

011-【CMU15-418】【并行计算架构和编程】【中英字幕】【Snoopin

2023-08-17 00:30 作者:alexphil  | 我要投稿

1. 介绍了一个关于稀疏数据结构和图的算法的作业。

2. 作业的目标是优化给定的代码,提高其顺序和并行性能。

3. 介绍了一个关于老鼠在迷宫中移动的模拟程序。

4. 介绍了如何使用热图来可视化老鼠在迷宫中的分布。

5. 介绍了计算随机选择的方法和程序的确定性特性。

6. 本视频介绍了一种模拟程序,用于模拟老鼠在一个图形网络中的移动行为。

7. 模拟程序采用了不同的更新模式,包括同步更新、逐个更新和批量更新。

8. 同步更新会导致震荡行为,而逐个更新和批量更新则更加平滑。

9. 为了提高性能,需要对同步更新和批量更新进行优化。

10. 视频还介绍了不同类型的图形网络,包括网格图、平铺图和分形图。

11. 在这个视频中,作者介绍了一些用作基准的状态,包括右下角的状态、对角线上均匀分布的状态以及在整个图中均匀分布的状态。

12. 作者提到,这些状态已经被随机排列,以确保在两个右侧分布的状态中,老鼠的位置是完全随机的。

13. 作者展示了一些演示,展示了老鼠在不同状态下的移动情况,以及随着时间的推移,聚集和分布的变化。

14. 作者介绍了实现的方式,包括使用数据结构来表示图和状态,并使用动态分配的内存来存储数据。

15. 作者指出了代码中的一些性能问题,包括重复计算和线性搜索的问题,并提出了一些优化的思路。

16. 在优化顺序性能时,需要注意与并行性能之间的平衡,有时会出现顺序性能提升但并行性能下降的情况。

17. 在并行计算中,需要保留一些约束条件,例如每个批次的计算必须完成,无法预测随机数生成器的结果等。

18. 在图中可以找到多个并行计算的地方,例如在每个批次中,所有节点的奖励值都是相同的,可以进行并行计算。

19. 性能衡量标准是每秒百万次鼠标移动次数,通过平均值来评估程序性能。

20. 建议在改进顺序性能时,考虑到最终需要并行化的因素,使用简单的数据结构,并根据时间测量结果进行优化。


011-【CMU15-418】【并行计算架构和编程】【中英字幕】【Snoopin的评论 (共 条)

分享到微博请遵守国家法律