【大数据基础Ep6】《Hadoop权威指南》读书笔记P10:网格计算

(合计171字,用时10min——)
第1章 初识Hadoop
1.5 相较于其他系统的优势
1.5.2 网格计算
概念:
高性能计算(High Performance Computing,HPC)和网格计算(Grid Computing):一直研究大规模数据处理,主要使用类似于消息传递接口(Message Passing Interface,MPI)的API——
从广义上讲,高性能计算采用的方法是将作业分散到集群各台机器上,这些机器访问存储区域网络(SAN)所组成的共享文件系统。- 数据本地化(data locality):Hadoop数据处理的核心,并因此而获得良好的性能——通过显式网络拓扑结构来保留网络带宽——这种排列方式并没有降低Hadoop对计算密集型数据进行分析的能力。
- 无共享(shared-nothing)框架:各个任务之间是彼此独立的,赋予程序员的控制权加大了,但编程的难度也增大了。