82 博士之后的学习方法-从知识到模型
实践是检验真理的唯一标准,既然冷冰冰的机器都有了学习能力,那么经过机器验证的学习方法一定值得人类学习。人工智能领域的发展改变了我们的传统认知,我不是人工智能领域专业出身,但我想谈谈人工智能的模型对我们人类学习方法的启发,这种启发不限于学校中的学习方法改进,也可用于工作和人生中的自我学习。
首先机器学习的目的是构建可以预测的模型,明确输入输出是构建模型的第一步。学校的输入是书本和课堂知识,输出反馈是各种考试,基础教育的目的是普及文化,而应试教育的目的是应付考试,高考的输入输出对应关系是筛选人才的目的,所以我们之前学习了那么多年英语,仍然是哑巴英语。输入和输出就像两条边界线,只有明确了问题的边界,我们才能构建解决问题的系统。

其次,人类的学习方法类似于大模型的训练方法,通过书本或老师训练建立模型属于监督学习的方法,历史的知识和经验是训练集,学校学习建立的模型大多是针对考试或者某些专业知识领域,监督学习训练出的模型通常容易过拟合,陷入纸上谈兵或者教条主义的陷阱变成象牙塔里的学院派两脚大书柜。
现代科学的知识越来越繁杂,即使念完博士,也只能对研究方向的细分领域有深入的研究,而系统的思考方法,不仅要深度,也要广度。
如何形成系统的思考方法、建立知行合一的思维模型?
第一步是多读书,通过书本或互联网筛选有用的数据,建立训练集。类似于监督学习的方法,站在巨人的肩膀上,利用他人的知识和经验构建已知的数据库,数据的来源要具有多样性和稳定性,比如要研究投资,就需要先了解投资投机的各种流派,把能够找到的相关的书籍和理论都大概看一遍,相当于机器学习的从数据输入。

第二步是收集整理笔记,类似于机器学习中的基础特征提取,平时把有用的知识点摘抄下来,利用oneNote或者有道云笔记等软件收集看到的有用信息,这一步的主要目的是通过泛读把数据转化成信息。

第三步简化,将平常收集到的笔记分门别类,提取中心思想,将同一类思想的信息简化成几句话,最后总结成几个字,相当于机器学习中的复杂特征提取。67 决策树与监督学习,复杂特征提取的是靠近根节点的特征,是比较抽象和接近本质的特征,这些特征或者知识就像核心学科的核心理论和核心概念,比如生物学中的DNA遗传进化理论,工程学中的控制理论,经济学中的价值理论。简化的目的是变成类似神经网络中的隐藏层节点64 神经网络与特征识别,通过简化和个节点的关系组合,就能构建类似深度学习的神经网络。
第四步是转换,类似于ChatGPT的transformer模型,把之前收集和简化的知识转化成自己的体系,转换的目的是打通输入输出,转换最简单方法就是多写作。如果能够成功转换这一步,就代表利用书本知识构建监督学习的模型框架已经完成。转换的方法就是多写作,多输出,把自己学到的知识教授给别人,这也是著名物理学家费曼发明的“费曼学习法。”
监督学习更多的是拟合而非泛化,就是通过历史数据训练模型,训练出的模型能够很好的处理见过的历史情况,然后加上强化学习的反馈就可以处理实时变化的状态。
第五步是从监督学习进化成无监督学习模型,类似于从AlphaGo进化成Alpha zero,(68 AlphaGo和蒙特卡洛树搜索)摆脱训练集模型的依赖,获得了完全独立自由的智能。
从监督学习进入非监督学习要经过突然开窍的“顿悟”体验,(74 我的顿悟体验)顿悟体验是个人思想智慧的一次质变,在顿悟之前一定会有大量的学习和训练,在偶然的环境下,就像小时候学会骑自行车一样,有个从量变到质变的过程,就像突然学会掌握自行车的喜悦。

顿悟前是向外求的“有导师学习,顿悟后是以我为主的“无导师学习。你会认识到你是自由的,自由的思想意味着你的模型已经能够脱离训练集的依赖,能够处理实时的环境状态变化,你的输入信息来源于实际环境状态,你的输出动作也能直接作用于环境,最终实现“知行合一”理想境界。