数据前处理和结构性思维
一、数据前处理
在做机器学习时候,有的模型需要将数据处理后才能训练。见过两种数据处理类型,一个是归一化,另一个是正态化。有点疑问!
就拿归一化的来说。假设现在有一组身高和体重的数据,本来是1米5到2米的人身高,为什么可以通过极差标准化变成0到1的数值?不会有影响吗?
既然有“为什么可以”,就有“为什么不可以”。对呀,为什么不可以呢?我在想,一组数据是不是有其抽象的特征,只要保证特征一致,就可以对其运算。
在知乎看到博主也有相关问题,但是没有给出合理的答复。
应该要向up主“老奇好好奇”学习,既有对问题的敏感,也要有刨根问底的实践。比如为了解极化码,一直找到信息论鼻祖香农的论文。「链接」
放到这件事情,要找到是谁最早做了归一化。英文太差是主要的限制因子,但是也只有开始了才能变好。人在床上躺,水平没法涨。
二、结构化思维
听到已经习以为常的词“找规律”,突然迸发出不一样的感觉。要靠练,聚类然后套规律。对有些类型的问题,自然就有两种思路。
比如说,当同学吐槽大学几年下来也没有找到对象。脑中立即有了两种思路。是你去加入社团,参加活动努力找了?还是根本就没有行动,然后说没有找到?
还有当我们和Chatgpt对话时,问经营分析报告应该怎么写,它立刻就能给出一二三四。所以要善用工具,站在巨人的肩膀上,少拍脑袋凭空创造。
很多事情有了不同角度时,自然就是结构化的。
三、少看吐槽,多找解决办法
研究生入学考试中的英语试题,尤其是阅读理解,总有一两个模棱两可的,观察网络上相关吐槽支持众,接下来就是应试教育没有办法云云,再上升到阶级固化,生活压力之类。好像社会阴暗,幸灾乐祸,得到共鸣。但是有解决问题嘛?没有。
联系到社会上一些现象,比如被行政拘留的陈某龙,因为捏造怒怼加班文化的聊天记录。那些发泄的文字爽吗?当然。但是有解决问题嘛?没有。
吐槽的东西,抱怨的东西听听就够了。重要的是解决办法。

如同我们遇到对方只是一味给予负能量,说你这不行那不行,肯定办不到,还是少接触这样的人好,更不必说交朋友了。如果对方不仅指出问题,还提出了解决办法,那还是不错的。

原发布时间:2023-04-12 11:57