吴军《计算之魂》第八章:流水线和分布式计算-笔记
8.1 流水线:逻辑串行与物理并行
精简指令集计算机RISC的流水线Pipelining:

IF:Instruction Fetch 获取指令
ID:Instruction Decode 指令解析
EXE:Execute 指令执行
MEM:Memory access 内存接入
WB:Writeback 写回

8.2 摩尔定律的分水岭
摩尔定律:1965年提出开始,每18个月处理器性能翻一番
1)2000年之前,3种方式提升处理器性能,但2000年后主要靠集成:
a. 提高工作频率
b. 提高处理器位数
c. 提高处理器复杂程度(功能集成:一个处理器中多核 或 单核中多计算单元)
2)2016年后,开始从追求处理器绝对性能 -> 追求处理器单位能耗所能提供的计算量
GPU图形处理器 -> TPU张量处理器 -> ASIC矿机,即芯片开始专用化

8.3 云计算揭秘:GFS和MapReduce
GFS和MapReduce两个工具分别解决分布式信息存储问题 和 信息处理问题:


这种【大文件思想】虽然极大提高了磁盘读/写的效率,但是也存在三个不便:
1)想要随机检索某一块感兴趣的内容十分困难
2)无法用新内容覆盖旧内容
3)文件存储方式对于使用者来说不透明

GFS通过大量廉价服务器,高效地存储和利用海量数据,并且对使用者透明。两个设计技巧值得借鉴:
1)先将大量零散的数据合并成大数据文件,再分成大数据块存储以提高数据访问效率
2)通过并行存储方式,解决数据访问的带宽瓶颈和数据安全问题


