【量化投资系列课程】——第一讲回顾
量化投资第一讲——量化体系
报告人: 张卫平教授
记录人: 王传臻 马赫 叶晨 张博伟
2023 年 4 月 29 日
第一章 书籍与论文推荐
1.1 书籍推荐
(1) 主动投资组合管理: 创造高收益并控制风险的量化投资方法, 理查德C. 格林诺德, 雷诺德 N. 卡恩,2014, 机械工业出版社. Richard C. Grinold, Ronald N. Kahn, 2000, Activ Portfolio Management: A Quantitative Approach for Providing Superior Returns and Controlling Risk. Second Edition.
(2) 高效的无效, 拉瑟・海耶・佩德森,2021, 中国人民大学出版社. Lasse Heje Pedersen,2015,Efficiently Inefficient: How Smart Money Invests and Market Prices Are Determine,Princeton University Press.

1.2 论文推荐
(1) Frazzini, Andrea and Kabiller, David and Pedersen, Lasse Heje, 2018,Buffett’s Alpha, Financial Analysts Journal, 74 (4): 35-55.
(2) Shihao Gu, Bryan Kelly, Dacheng Xiu, Empirical Asset Pricing via Machine Learning, 2020, The Review of Financial Studies, 33(5):2223–2273.
(3) Jiang, Jingwen and Kelly, Bryan T. and Xiu, Dacheng, (Re-)Imag(in)ing Price Trends, 2020, Chicago Booth Research Paper No. 21-01.
第二章 课程安排, 目标与建议
2.1 课程安排
(1) 量化体系: 从总体的角度介绍量化的体系(本节课)
(2) 量化数据: 如何处理量化数据, 这些数据有哪些形式
(3) 回测框架: 如何用回测的方式去评估一个策略
(4) 资产选择: 侧重于个人的选择, 愿意承担何种风险
(5) 因子模型: 资产定价模型或者利用投资标的的特征去构造策略
(6) 线性模型: 按照线性组合方式构建模型
(7) 深度学习: 利用深层网络构建模型
2.2 课程目标
1. 理解量化投资领域的基本概念;
2. 掌握量化投资策略的评估方法; 例如避免策略在过去不可复制, 避免策略 用到了未来数据, 科学考虑交易成本等;
3. 掌握根据评分构造策略的方法; 例如通过对同截面股票打分构造策略; 也 要避免利用未来数据等常见的错误. 主要研究股票投资策略, 根据标的评分 来构造投资组合.
2.3 课程建议
1. 持有开放的心态和包容的态度;
2. 避免概念含义不同导致的争论; 使用某些词时要求词语的含义与学科中 已经存在的含义尽量一致;
3. 避免价值判断不同导致的争论.
第三章 量化人物介绍
3.1 量化人物
1. James·Simons 詹姆斯西蒙斯 —— 相关书籍:
• The Man Who Solved the Market:How Jim Simons Launched the Quant Revolution.
• 洞悉市场的人: 量化交易之父吉姆西蒙斯与文艺复兴公司的故事.
2. Edward Thorp 爱德华索普 —— 相关书籍: 战胜一切市场的人 A Man for All Markets
3. Warren Buffett 沃伦巴菲特 —— 相关书籍: 巴菲特之道
3.2 投资业绩比较; 对运气与能力的思考; 对市场 是否有效的思考

3.3 投资大师靠的是运气还是实力?
• 一个例子: 抛硬币
有一个均匀硬币,n 个人每人连续扔 10 次, 至少一个人全是正面的概率 是多少?

如果考虑 1 个人, 这个概率是 , 但考虑 n 个人, 则概率为
. 这个数字在 n = 1000 时, 差不多可以达到 60% 以上, 这引发我们的思考. 上述投资大师取得的优异投资成绩, 究竟是类似于投掷硬币实验中的“连续投掷出正面的人”在大量投资者下的概率必然, 还是他们本身的能力优秀? 从投资结果上我们无法判断.
• 有效?无效?
我们再考虑另一个问题: 市场究竟是不是有效的?
有效市场理论认为, 股票的价格已经充分反应了很多层面的信息, 那就很难从价格中再获取收益.
如果市场是有效的, 就不会出现天上掉馅饼的事情. 有效市场假说之父尤金・法玛有一天和研究生一起漫步于芝加哥大学的校园里. 学生一低头,惊呼道:“看, 地上有张 100 美元纸币.”尤金・法玛不为所动, 回答道: “不会的. 如果地上真的有, 一定早有人把它捡走了.”
量化投资想要获得收益, 必须承认市场中在某种意义上是存在有效部分的, 这样才能从无效中 ‘前进’, 但是该市场的有效并非是自动实现的.
3.4 巴菲特的惊人业绩, 投资价值与投资原则
在很长的时间维度上来看, 没有哪个基金在 sharpe ratio 上可以比巴菲特做的更好.

• 巴菲特的价值投资
巴菲特是有投资原则的, 并且在不同场合多次提到. 一些经常被大家谈到的原则有:
“Whether we’re talking about socks or stocks, I like buying quality merchandise when it is marked down.”Buffett (2009). (无论我们谈论的是袜子还是 股票, 我都喜欢在降价时购买优质商品.)
“Its far better to buy a wonderful company at a fair price than a fair company at a wonderful price.”(以合理的价格买入一家优秀的公司, 远胜于低价买入一家平庸的公司.)
李录对巴菲特芒格价值投资的四个基石做了以下的总结:
1. 买股票就是买企业;
2. 市场先生 (市场是喜怒无常的, 不可被市场价格左右);
3. 安全边际 (选取的股票价格应该足够低), 本杰明・格雷厄姆在《聪明的投 资者》中特 别强调“安全边际”;
4. 能力圈 (投资需要在自己的能力范围内进行, 在自己熟知的领域投资).
•Buffett’s Alpha: 高质量、低价格、低风险
巴菲特的投资收益主要来自于哪方面, 是选股的收益/低成本/成为大股东参与公司管理?研究表明, 其收益主要来自于其选股获得的收益. 巴菲特的选股特点: 质量高(利用财务数据来度量)、价格低(便宜)、低风险.
利用常见的量化因子对巴菲特的策略进行复制, 确实得到了很好的投资结果, 这印证了巴菲特等著名的投资者是靠自己的能力发掘市场中的有效部分进行投资的. 由此, 我们想到利用量化的手段进行投资.
第四章 量化投资简介
4.1 什么是量化投资
什么是量化? 简而言之, 量化投资是一种基于金融理论和投资逻辑, 利 用数理统计模型, 通过有效挖掘数据中的有用信息, 形成可靠的投资策略. 在计算机硬件和软件的支持下, 科学地进行资产组合管理, 以实现组合净值 稳定增长目标的投资方法.
4.2 量化投资基本要素
(1) 投资逻辑: 金融学理论或经验
(2) 量化数据: 交易数据、财务数据、宏观数据、另类数据等
(3) 统计模型: 线性模型、决策树、深度学习、强化学习等
(4) 投资策略: 因子策略、趋势跟随策略、均值回复策略等
(5) 计算软件:Python, R 等
4.3 量化投资的基本流程

数据与模型形成策略, 用回测对策略进行评估, 避免利用未来数据, 以及注意策略能否延申到未来, 同时考虑交易对手的变化. 最后将优秀策略运 用到交易中.
第五章 量化投资的要素
5.1 投资逻辑
将以上基本要素组合到一起, 形成量化投资基本流程: 数据和模型结合一定逻辑最终形成交易策略, 对于一个交易策略, 用回测的手段来评估它,当回测表现良好时最终考虑将策略运用于实际交易. 但需要注意的是, 回测中不错的结果可能是假象, 即使避免了一些低级错误, 回测手段也有一些不可避免的缺陷, 比如只能反映过去, 而过去是否可以准确反映未来, 要考虑 到前后是否发生了巨大的变化.
5.2 超额收益的来源

• 来源于对风险的补偿: 市场上不同的投资者有不同的需求, 部分投资者可能更在乎其对流动性的需求, 出于变现的目的, 这类投资者不太关注收益的高低.
• 来源于对信息的补偿: 例如由于信息的滞后性以及流通慢的特点, 提前获知信息可以获得更高的收益. 量化投资的逻辑是当拥有比别人更好的数据,拥有了更好的分析数据的方法, 就更有可能战胜市场平均水平.
5.3 趋势的周期

该图描绘了趋势的不同阶段, 并主要考虑 CTA 策略, 基于信息的传播需要时间这一事实, 市场对价格趋势的反应是具有滞后性的, 这可提供一定的交易逻辑. 图中蓝色的线可以想象为某一公司基本面的重大变动, 在低水平阶段, 股票价格围绕公司价值做一些小的变动. 当公司基本面发生重大变动, 假设公司价值变得更高, 即右半部分高水平蓝线所呈现出的那样. 起初 由于意识到这一变动及其后果的人并不特别多, 市场无法立刻对变动做出反应, 股价只会有一个初步的反应, 反映小部分投资者的判断. 随着更多投资者意识到这一变动的意义, 逐步跟随进来, 股价开始提高. 由于羊群效应或从众心理, 市场的股价的反应可能会过度. 最终越来越多投资者趋于冷静后, 股价出现小幅回调. 这个过程可以总结为: 投资者对变动的反应, 一开始反应不足, 后续反应过度. 量化投资就是要通过对数据的分析, 去更好地意识到这种差异, 利用“时差”去获取收益.
5.4 数据的类型
数据至少可以按照来源分为以下几类:
1. 交易数据: 此类数据是公开的, 但是一般投资者无法完全获取并利用高频 信息进行投资. 这类数据的结果如下左图所示: 例如一般包含交易发生的时 间, 开高低收的价格, 交易量, 交易额等.
2. 财务数据: 财务数据一般来说频率较低, 中国财报的发布频率决定大部分 的财务数据都是季度的, 但是也有一些指标可以每日计算, 从而也存在高频 指标. 下中图展示的数据是月度的, 类似于公司的面板特征等.
3. 文本数据: 也称为另类数据, 如下右图主要从新闻中抓取, 例如来自于范 剑青教授 2021 年的论文中提到的数据. 在处理中我们会利用数学的方法把 文本编译成向量.

但是不论来源如何, 数据一般会被结构化地处理为以下的形式: 对每一个样本, 用 x 表示输入,y 表示输出. x 的可能形式有
• 纯的一维截面, 包含 K 个特征 (例如 K*1 维向量);
• 纯的一维时序, 包含 L 个 y 的滞后 (如 1*L 维向量);
• 二维面板, 例如含 L 个时间步, 在某个时间步上包含 K 个特征的张量 (处理时可以在某方向上拉直);
y 可以是收益率, 也可以是收益率顺序或收益率类别.
样本集由多个样本构成, 例如 N 个样本构成样本集. 于是我们的数据形成 了一个张量 N × L × K.
5.5 统计模型
统计模型简单分为线性模型或者非线性模型.
(1) 线性模型: : 多元线性回归、softmax 回归等
(2) 非线性模型: : 决策树、支持向量机、深层网络等
GKX2020 论文中采用了线性模型结合非线性模型建模.
范围:1957-2016 年间共 60 年的月频数据, 涵盖 30000 只股票, 训练集 18 年 (1957-1974), 验证集 12 年 (1975-1986), 测试集 30 年 (1987-2016).
变量:94 个公司特征, 74 个行业虚拟变量, 8 个宏观经济变量. 采用的线性模型为:
为收益率,
为风险暴露,
为风险溢价,
为公司特征,
为宏观变量变量
采用的非线性模型 (考虑了 FCN 和决策树等) 为:
在 JKX2020 论文 (Jiang, Jingwen and Kelly, Bryan T. and Xiu, Dacheng, (Re-)Imag(in)ing Price Trends, 2020, Chicago Booth Research Paper No. 21-01.) 中, 采用非线性模型, 构造了卷积神经网络将 k 线图编码后做为输入 对股票进行分析. 如下图所示.

5.6 量化交易策略的形成与评估
策略的形成:
(1) 统计模型 + 量化数据
(2) 标的排序或交易信号
(3) 量化交易策略
一个完整的交易策略相当于给出了一份交易清单或者持仓清单, 包括交易 的标的, 交易的时间, 交易的价格和交易的方向等.
策略的评估:
(1) 交易策略 + 历史收益率数据
(2) 策略组合的收益率时间序列
(3) 年化收益率、夏普比率、最大回撤等指标.
5.7 量化投资策略分类
量化投资策略分为主权类策略, 宏观策略和套利策略. 标的不同时采用 不同策略. 也可以按照频率分为基本面量化, 统计套利和高频交易.

来源:Lasse Heje Pedersen,2015,Efficiently Inefficient: How Smart Money Invests and Market Prices Are Determine,Princeton University Press. Figure I.2.
5.8 股票投资策略分类

来源:Lasse Heje Pedersen,2015,Efficiently Inefficient: How Smart Money Invests and Market Prices Are Determine,Princeton University Press. Figure I.2.
第六章 量化平台
国信 iQuant: https://www.guosen.com.cn/gs/iquant/index.html
聚宽 JoinQuant: https://www.joinquant.com
米筐 RiceQuant: https://www.ricequant.com
优矿 Datayes: https://uqer.datayes.com
掘金量化: https://www.myquant.cn
量化投资协会隶属于复旦大学,所有活动均面向上海地区,可通过公众号“量化投资QIA”了解详情。https://mp.weixin.qq.com/s/i85TawXe8ooJnkwLWkfKhQ