欢迎光临散文网 会员登陆 & 注册

吴军《计算之魂》第八章:流水线和分布式计算-笔记

2023-03-23 19:36 作者:raft0065  | 我要投稿

8.1 流水线:逻辑串行与物理并行

    精简指令集计算机RISC的流水线Pipelining:

处理器效率提高 x5

IF:Instruction Fetch 获取指令

ID:Instruction Decode 指令解析

EXE:Execute 指令执行

MEM:Memory access 内存接入

WB:Writeback 写回


8.2 摩尔定律的分水岭

    摩尔定律:1965年提出开始,每18个月处理器性能翻一番

    1)2000年之前,3种方式提升处理器性能,但2000年后主要靠集成:

        a. 提高工作频率

        b. 提高处理器位数

        c. 提高处理器复杂程度(功能集成:一个处理器中多核 或 单核中多计算单元)

    2)2016年后,开始从追求处理器绝对性能 -> 追求处理器单位能耗所能提供的计算量

        GPU图形处理器 -> TPU张量处理器 -> ASIC矿机,即芯片开始专用化


8.3 云计算揭秘:GFS和MapReduce

    GFS和MapReduce两个工具分别解决分布式信息存储问题 和 信息处理问题:

64MB 一个物理块

    这种【大文件思想】虽然极大提高了磁盘读/写的效率,但是也存在三个不便:

    1)想要随机检索某一块感兴趣的内容十分困难

    2)无法用新内容覆盖旧内容

    3)文件存储方式对于使用者来说不透明

通过逻辑-物理的映射关系管理文件块

    GFS通过大量廉价服务器,高效地存储和利用海量数据,并且对使用者透明。两个设计技巧值得借鉴:

    1)先将大量零散的数据合并成大数据文件,再分成大数据块存储以提高数据访问效率

    2)通过并行存储方式,解决数据访问的带宽瓶颈和数据安全问题


吴军《计算之魂》第八章:流水线和分布式计算-笔记的评论 (共 条)

分享到微博请遵守国家法律