欢迎光临散文网 会员登陆 & 注册

量化软件下载:赫兹股票期货量化软件聚类运用实践

2023-08-14 13:27 作者:大牛啊呢  | 我要投稿

. 聚类结果利用的理论层面

在我们继续讨论与实际运用聚类结果相关的案例之前,我们先谈谈这些方法的理论层面。

运用数据聚类结果的第一个选项是,在不需要任何额外资金的情况下,尽量充分利用数据聚类结果进行实际运用。 即,聚类结果可以独立运用,来制定交易决策。 我想提请大家的是,无监督学习方法不能用于解决回归任务。 而预测最近的价格走势恰恰是一项回归任务。 乍一看,我们看到了某种冲突。

但要从其它方面来看。 考虑到聚类的理论层面,我们已经将聚类与图形形态的定义进行了比较。 就像图表形态,我们可以在特定聚类的元素出现在图表上以后,去收集价格行为的统计数据。 好吧,这不会带给我们一个因果关系。 但这种关系在运用神经网络建立的任何数学模型中都不存在。 我们仅建立概率模型,没有深入研究因果关系。

为了收集统计数据,我们需要一个已经训练过的聚类模型和标记数据。 鉴于我们的聚类模型已经训练过了,标记数据集合可能比训练样本小得多。 然而,它应该是充分和具有代表性的。

乍一看,这种方式可能类似于监督学习。 但它有两个主要区别:


  1. 标记的样本规模可以更小,因为这样没有过度拟合的风险。

  2. 在监督学习中,我们使用迭代过程来选择最优权重系数。 这需要若干个训练世代,且资源和时间成本较高。 第一次通过就足以收集统计数据。 在这种情况下也无需执行模型调整。

希望这个思路足够简单。 稍后我们将研究这种模型的实现。此选项的缺点是忽略了至聚类中心的距离。 换言之,对于靠近聚类中心(“理想形态”)的元素,和聚类边界上的元素,我们会得到相同的结果。 您可尝试增加聚类的数量,从而降低图元与中心的最大距离。 但如果我们根据损失函数图正确选择了聚类数量,这种方式的有效性将是最小的。 您可以尝试采用聚类结果的第二种应用来解决这个问题:作为另一个模型的源数据。 但请注意,以数字或向量的形式将聚类数量输入到第二个模型,我们最多会收到与上述统计方法结果相当的数据。 花费额外的成本来获得同样的结果是没有意义的。我们可以在模型中输入至聚类中心的距离,来取代聚类数量。 我们不应该忘记,神经网络更喜欢归一化数据。 我们利用 Softmax 函数对距离向量的数据进行归一化。


量化软件下载:赫兹股票期货量化软件聚类运用实践的评论 (共 条)

分享到微博请遵守国家法律