【并行计算】CUDA在现代C++中如何运用?看这一个就够了!


小鹏老师请教下。
1)只有一次全局内存有什么影响吗?
2)这个temp_sum感觉是把arr[]的值全部加起来了,然后local_sum[j]的每个值都变成了arr[]的和,感觉这和上一页PPT表达的意思不同呢,上一页的local_sum[j]=arr[i * 1024 + j],只是每个block的local_sum[]把arr[]的值正常拷贝,并没有求和呢
3)也没理解为什么要此时在main中增加gridDim的数量?[捂脸]