朴素贝叶斯分类器与针灸针法
朴素贝叶斯分类器是一种基于现有样本数据的概率分类器。其原理是基于样本数据的现有属性(因素)与标签(结果),计算出新的属性所对应标签的概率,然后将其归类为最大概率的标签。 利用该分类器我对房间名称(标签)与房间的面积与周长(属性)进行了关联处理,然后就可以对新属性的房间自动赋予房间名称。见如下视频:
Dynamo数据驱动--使用Naive Bayes预测房间名称
简述一下原理: (一)获取房间面积、周长、房间名称参数.
(二)将房间面积与周长看作属性,房间名称看作标签.为了能够实现绘制任意形状的面积与周长数据落在上述数据内,就需要将周长与面积数据进行分段表示(范围),因此,为了简化示意,就将面积与周长分别从小值到最大值之间划分为三个范围--A/B/C
(三)对于新的房间形状的面积与周长数据转化成对应的范围(如面积B,周长C)就可以求出每个房间名称的概率,将最大概率的房间名称赋予该形状.该步骤由节点包自动完成,只需将数据按照一定规则传递节点即可.
朴素贝叶斯分类器虽然简单,但却能够发挥经验总结的巨大作用,提升经验类工作的效率与创新性。并且随着样本的增加,其预测能力将得到增强,更具备参考性。 传统医学有言:"疾在腠理,汤熨之所及;在肌肤,针石之所及。"针石即针灸,在身体的活血化瘀、祛痛调理方面有一定的基础作用。由于本人完全不了解针灸领域,故而将其理想化以便分析以符合数据分析。 假定针灸的治疗方法是通过针扎四类穴位来实现的,即: 针灸治疗=主治穴位+局部穴位+远端穴位+特殊穴位,默认每个穴位可以扎或不扎(空位)。 单针模式:每类穴位预留一个位置,可以扎或不扎。假定每类穴位有9个,分别用数字1-9表示,0表示该穴位不扎。 针灸师通过经验汇总样本数据(数字与症状是虚拟的):
主穴 局部 远端 特殊 治疗病症
1 3 1 0 偏头痛
1 1 2 0 偏头痛
1 2 1 1 落枕
2 2 5 8 高血压
…
随着经验的增加,样本数量足够多时,就可以进入双针模式,也就是每类穴位预留两个位置,针位可以是空位。 那么,创新性运用双针模式时,就应该建立在单针模式的经验基础之上。比如想尝试出一个治疗头部疾病的新的针法(双针模式),可先由单针模式的样本数据而得出单针模式下的治疗病症可能性,明确与头部相关后,再把分别剩下的四个针位按照经验与感觉尝试,从而得出该双针模式下的针位治疗的病症(从患者身上得出)。如在单针模式的偏头痛针法基础上创造出双针模式的脑梗针法。
主穴 局部 远端 特殊 治疗病症
1 ? 3 ? 1 ? 0 ? 偏头痛?
1 5 3 2 1 2 0 1 颈椎病
同样,等到双针模式的样本足够多时,又可以进入四针模式、八针模式…
主穴 局部 远端 特殊 治疗病症
15?? 32?? 12?? 01?? 颈椎病?
1543 3201 1203 0150 肩周炎
这样,就实现了针灸针法的数字化,对于经验总结与创新性,会有大幅度提升。