欢迎光临散文网 会员登陆 & 注册

Investor attention and stock returns--投资者关注度与股票收益

2023-01-27 01:32 作者:GUCCI-GUJI  | 我要投稿

分享一篇自己翻译的文章,不当之处烦请指点

Chen J, Tang G, Yao J, et al. Investor attention and stock returns[J]. Journal of Financial and Quantitative Analysis, 2022, 57(2): 455-484.


投资者关注度和股票回报

Jian Chen, Guohao Tang, Jiaquan Yao*, Guofu Zhou

摘要 我们在文献中提出了一个基于代理的投资者关注指数,并发现它无论是样本内还是样本外都能显著地预测了股票市场风险溢价,但每一个代理的预测能力都很小。使用偏最小二乘法提取指数,结果与通过缩放主成分分析得出的相似。此外,该指数可以为资产配置中的均值方差投资者带来可观的经济收益。投资者关注度指数的预测能力主要来源于短期价格压力反转,以及对高方差股票更强的预测能力。


I、引言

关注度是一种稀缺的认知资源(Kahneman(1973)),越来越多的研究调查了关注度对股价横截面的影响,包括Peng和Xiong(2006)、Barber和Odean(2008)、Dellavigna和Pollet(2009)、Hou、Peng和Liong(2009),Da、Engelberg和Gao(2011)、Lou(2014)以及Ben Rephael、Da和Israelsen(2017)。同时,Peng和Xiong(2006)的理论模型表明,有限的关注度导致投资者更多地关注市场和部门信息,而不是公司特定信息,这意味着投资者的关注度和市场回报之间存在联系。然而,关于投资者关注度预测股市回报的能力的实证文章有限。Li和Yu(2012)和Yuan(2015)的文章似乎是唯一的此类文章;两者都只在可预测性的样本证据中找到。尽管如此,自Goyal和Welch(2008年)以来,研究人员现在专注于使用样本外方法来测试市场可预测性,这在关注度文献中没有得到解决。事实上,我们发现现有的个人关注度代理变量在样本内外的市场预测方面能力有限。

本文使用12个单独的关注度代理指标,结果表明它们的共同成分对股市很重要,并且通过使用偏最小二乘(PLS)、比例主成分分析(sPCA)和主成分分析法(PCA)的信息聚合方法很好地提取了这一成分。本文有三大贡献:首先,我们表明投资者的关注度在市场层面上很重要:当通过PLS、sPCA和PCA方法集中使用单个代理时,它可以有力地预测样本内外的股市,并可以为均值方差投资者带来可观的经济收益。第二,本文表明投资者的关注比之前认为的要重要得多。如果投资者的关注度只在一个横截面上影响股价,那么它在金融领域的作用是有限的。然而,如果它对总市场产生影响,它的作用就会大大增加。正如Cochrane(2008)所强调的,市场风险溢价对资产定价、企业融资和整个经济都有着深远的影响,其可预测性是金融学的核心问题之一。然而,现有的文章没有提供足够的证据证明投资者关注度对市场的预测能力,而本文证明如此。第三,与Baker和Wurgler(2006)的投资者情绪指数相似,本文提供了一个投资者关注指数。它捕获所有代理变量中的相关信息,使其成为市场关注度的综合衡量标准。因此,它可以在许多情况下用于检测投资者关注度的影响,例如在使用投资者情绪指数的任何应用中。因此,总投资者关注指数的影响超出了其对市场风险溢价的可预测性。

在所有的关注度指标中,我们根据实时可得性选择了12个受欢迎的个人关注度代理指标。它们分别是异常交易量(Barber和Odean(2008));极端收益率(Barber和Odean(2008));历史收益(Aboody、Lehavy和Trueman(2010));最近52周新高,历史最高(Li和Y u(2012));分析师覆盖率(Hirschleifer和Teoh(2003),Peng(2005),Hirschliefer,Hsu和Li(2013));广告费用变化(Lou(2014));共同基金流入和流出;媒体报道(Barber和Odean(2008)以及Fang和Peress(2009));电子数据收集、分析和检索(EDGAR)系统上的搜索流量(Lee、Ma和Wang(2015)、Drake、Roulstone和Thornock(2015)以及Drake、Jennings、Roulsstone和Thornok(2017));和谷歌搜索量(Da等人(2011))。因为大多数现有的关注度指标都是在公司层面,所以首先将它们聚合为市场层面的指标,然后进一步将单个市场层面的衡量指标聚合为一个投资者关注度综合指数。

我们的主要聚集方法是PLS。正如Huang、Jiang、Tu和Zhou(2015)中汇总投资者情绪指标的情况一样,有理由假设真实的投资者关注度是不可观察的,每个单独的指标都只是其简单的代理变量。从统计学上讲,我们需要通过去除与股票收益无关的个体误差的所有噪声,从代理变量中提取与股票收益相关的真正关注度。如PLS方法的先驱Wold(1966)所示;Kelly和Pruitt(2013),(2015);和Light、Maslov和Rytchkov(2017)等,PLS是从所有个体代理获得聚合关注度的有效方法。结果(A^PLS)是我们的综合关注度指数之一,它利用了个人代理和市场回报中的所有信息。

我们还使用了主成分分析(PCA)和Huang, Jiang, Li, Tong, 和 Zhou(2021)最近开发的sPCA。PCA方法提取一个索引来解释代理的最大方差,而不一定是回报。根据设计,PCA在捕获与股票收益相关的最大信息方面能力有限(Kelly和Pruitt(2015))。为了更好地捕捉可预测性,Huang等人(2021)通过根据预测未来股票收益的预测能力调整每个预测值,对PCA方法进行了改进。直观地说,他们的sPCA将更多的权重放在预测未来回报的更重要的预测指标上。因此,我们有两个基于PCA和sPCA方法的备选聚合关注度指数,分别表示为A^PCA和A^sPCA。

在1980年1月至2017年12月期间股票市场月度超额收益的预测回归中,当使用PLS测量的关注度A^PLS作为单一预测因子,我们发现样本R方为2.15%,具有高度显著的-0.64%斜率。这种可预测性存在长达2年,但回归斜率显著性随着预测时间的增加而缩小,表明从长期来看,可预测性减弱。我们发现替代的两个关注度指数A^sPCA和A^PCA有相似的实证结果。A^sPCA市场月回报的样本内R方为1.26%,回归系数为-0.49%,统计显著。预测期越长,预测效果越弱。A^PCA还预测了除1个月期外的所有预测期内的市场回报率。与单个关注度代理相比,我们的总体关注度显示出更强的股市回报预测能力,这表明在回报可预测性方面,使用代理变量的整体表现优于单独使用的效果。

此外,我们将总投资者关注度的预测能力与常见回报预测因子、Goyal和Welch(2008)使用的经济变量以及Baker和Wurgler(2006)的投资者情绪指数进行了比较。我们发现,在控制了这些因素后,总体投资者关注度指标依然保持了很强的可预测性。结果表明,投资者整体关注度包含了独特的预测股市的信息,这部分不能用经济基本面和投资者情绪来解释。

在样本外评估中,我们采用了两种评估指标,即Campbell和Thompson(2008年)的R_OS^2统计数据和Clark和West(2007年)的均方预测误差(MSFE)调整统计量。结果表明,在1995年1月至2017年12月的样本外期间,所有三种整体关注度测量除了每月范围内的A^PCA,在预测范围内都提供了具有统计意义的R_OS^2值。此外,R_OS^2统计数据的显著度在经济上相当显著。A^PLS、A^PCA和A^sPCA的R_OS^2分别为每年6.60%、2.31%和2.39%。相比之下,我们发现个体关注度代理具有有限的样本外可预测性。

投资者关注度的显著可预测性能否带来可观的经济收益是一个重要问题。由于投资者整体关注度的显著预测性,我们表明,从资产配置角度来看,它确实可以为均值方差投资者带来可观的投资收益。当投资者在市场和无风险利率之间分配投资时,A^PLS、A^sPCA和A^PCA的年化确定性等价收益(CER)收益分别为4.55%、2.78%和5.00%。此外,基于投资者整体关注度的投资组合具有较大的年化夏普比率。例如,A^PLS月度范围内的夏普比率为0.74,大于市场投资组合的0.50。我们的资产配置结果对0.50%比例交易成本是稳健的。

我们的实证结果之所以重要有三个原因。首先,他们第一次表明,无论是统计上还是经济上,投资者对股市的关注都很重要,这突出其在资产定价中的重要作用。第二,当依赖于任何个人关注度度量时,投资者关注度的真实预测能力很可能被低估。相反,我们的投资者整体关注度通过PLS、sPCA和PCA的有效聚合方法集中使用了所有个人代理。聚合指数汇总了个体代理中最相关的信息,因此,它们优于现有的个体关注度度量。第三,A^PLS可以像Baker和Wurgler(2006)的投资者情绪指数一样用于其他应用。

为了进一步理解为什么投资者整体关注度会对市场未来回报产生负面影响,我们探讨了潜在的经济机制。我们发现,负的可预测性主要源于短期价格压力反转。Barber和Odean(2008)和Da等人(2011)认为,个人投资者是吸引眼球股票的净买家。成交量暂时推高了价格,这种关注度驱动的价格压力随后又回到了基本面。我们的实证结果与他们的解释一致。然而,正如Yuan(2015)所建议的那样,我们的结果不能排除投资者关注度高后净卖出的可能性。此外,如Gervais、Kaniel和Mingelgrin(2001年)的实证和Andrei和Hasler(2020年)的理论所示,在相对较短的时间内,关注度也与未来回报呈正相关。

从截面上看,我们发现投资者整体关注度负向预测按市场β值和特异性波动率分类的股票组合超额收益。因此,我们的结果表明,负面的收益预测性在截面上是普遍存在的,与我们在总体市场水平上的发现一致。此外,我们发现可预测性存在很大的横截面差异。对于高贝塔股票和具有高特异性波动率的股票,回归斜率负值更显著。Han, Hirshleifer, 和 Walden (2021)记录了投资者易于被高方差股票(高贝塔股票和具有高特异性波动的股票)吸引,推动其价格上升,从而压低其预期收益。我们的实证研究结果与他们的研究结果一致。

本文的其余部分组织如下:第二节描述了构建投资者关注度指标的数据和方法。第三节提供了实证结果。第四节探讨了回报可预测性的经济来源。第五节进行总结。


II、数据与投资者关注度的构建

A、个人关注度代理变量

我们使用了12个主要的个人关注度代理指标。异常交易量(Barber和Odean(2008)),极端收益率(Barber和Odean(2008)),历史收益率(Aboody等(2010)),近52周高点和历史高点(Li和Yu(2012)),分析师覆盖率(Hirshleifer和Teoh(2003),Peng(2005)和Hirshleifer等(2013)),广告费用变化(Lou(2014)),媒体报道(Barber和Odean(2008),Fang和Peress(2009)),共同基金的流入和流出,谷歌搜索量(Da等人(2011)),以及EDGAR的搜索流量(Lee等人(2015),Drake等人(2015),以及Drake等人(2017))。我们在构建这12个关注度代理指标时遵循了文献的规定。除了近52周高点和历史高点之外,我们首先构建公司层面的关注度指标,然后在市场层面进行汇总。

具体构建过程如下:

异常交易量(A^AVol)。我们首先计算每只股票(NYSE/AMEX/NASDAQ)每个月末的交易量与前1年的平均交易量的比率。然后,我们计算所有股票的平均加权异常交易量作为市场层面的关注度指标。我们从CRSP数据库中获得1980年1月至2017年12月的横截面股票交易量。

极端收益率(A^ERet)。我们首先计算每只股票(NYSE/AMEX/NASDAQ)每个月末的回报率与之前1年的平均值的比率。然后,我们计算所有股票的平均加权极端收益率作为市场层面的关注度衡量标准。我们从CRSP数据库中获得1980年1月至2017年12月的横截面股票收益。

历史收益率(A^PRet)。我们将历史收益率定义为每只股票(NYSE/AMEX/NASDAQ)在过去12个月的月度累计回报率。然后,我们计算出所有股票的历史等权回报率作为衡量股票市场整体的标准。我们从CRSP数据库中获得1980年1月至2017年12月的横截面股票收益率。

近52周高点(A^52wH)和历史高点(A^HisH)。让p_t表示道琼斯股指的月度水平。p_(52w,t)和p_(max,t)分别代表其52周(12个月)新高和历史新高。我们将每月道琼斯近52周高点程度定义为当前t月道琼斯指数与52周高点之比,x_(52w,t)=p_t/p_(52w,t),道指历史高点的月度接近度为当前t月份道指与其历史高点的比率,x_max=p_t/p_(max,t)。我们从雅虎财经获得1980年1月至2017年12月的道琼斯股票指数。

分析师覆盖率(A^(#AC))。我们首先统计对于每个股票(NYSE/AMEX/NASDAQ),在一个月内对每股收益进行1年期预测的分析师总数。然后,我们计算所有股票的分析师每股盈利预测的等权均值作为衡量股票市场总量的标准。我们从1980年1月至2017年12月的机构经纪人评估系统(IBES)数据库中获得分析师的盈利预测数量。

广告支出变化(A^CAD)。我们首先计算每只股票(NYSE/AMEX/NASDAQ)从第t-1年到第t年的广告支出对数值的变化。接下来计算所有股票广告费用的平均加权变化作为总股票市场的月度衡量指标。我们从Compustat获得1980年1月至2017年12月的广告支出值。

共同基金流入(A^Inflow)和流出(A^Outflow):我们将共同基金流入定义为每个基金每月售出股票的总资产净值,包括售出的新股和其他销售。我们将共同基金流出定义为每个基金的每月赎回。然后,我们分别计算所有基金的平均加权共同基金流入和流出,作为市场水平的衡量标准。共同基金数据从CRSP共同基金数据库获取1980年12月至2017年1月区间数据。

媒体报道(A^Media):我们将媒体报道定义为当月道琼斯通讯社(Dow Jones Newswires)上发表的每只股票的新闻文章总数。然后,我们计算所有股票的平均媒体覆盖率,作为总股市的衡量标准。我们从RavenPack数据库获得2004年1月至2017年12月的新闻数据。

谷歌搜索量(A^Google):我们遵循Da等人(2011)的说法,根据股票行情,根据谷歌趋势计算每月搜索频率。然后,我们计算所有股票的平均谷歌搜索量作为市场级搜索量。数据样本期为2004年1月至2017年12月。

EDGAR(A^EDGAR)上的搜索量:对于每个股票,我们首先统计该公司在给定月份内报表的EDGAR下载量。然后,我们计算所有股票的平均EDGAR下载量,作为市场层面的关注度指标。可以下载原始EDGAR文件数据(https://www.sec.gov/data/egar log file data-set.html)。我们遵循Lee等人(2015)的观点,排除所有每天下载超过50个独特公司文件的互联网协议(IP)地址的搜索记录。搜索记录的样本期为2004年1月至2017年6月。

我们使用了Rapach、Ringgenberg和Zhou(2016)以及Jondeau、Zhang和Zhu(2019)也使用的等权重方法,在市场层面汇总了公司层面的关注度指标。在汇总企业层面的关注度信息时,同等权重可能比价值权重更具信息性,因为它对各种企业的关注度信息一视同仁。相比之下,价值加权更强调资本规模大的公司。直观地说,当投资者将关注度分配到更多的股票(大型、中型和小型股)时,这更可能表明投资者对总体市场的关注度增加。因此,为了避免大盘股的支配,我们使用相等的权重来汇总市场层面的公司级指标。

表1报告了12个个体关注度代理变量的中值、四分位数(75%和25%)分布、偏度和一阶自相关系数(ρ)。所有关注度变量均标准化为平均值为0,方差为1。如表所示,A^EDGAR的中值为-0.24,A^HisH的中值为0.38。A^EDGAR在所有变量中具有最大的75%四分位数和最小的25%四分位数。表2提供了关注度代理之间的两两相关性。我们观察到,大多数个体关注度代理都是正相关的,只有几个例外的负值可以忽略不计。相关系数范围从-0.37到0.80,这表明这12个关注度代理捕捉了投资者关注度的共同和不同方面;因此,就投资者关注度对股市的总体影响而言,使用特定代理人不太可能是全面的。

B、投资者整体关注度

在本小节中,我们将集中使用单个关注度代理变量,而不像现有的文献,这些文献通常只检查其中一个。我们将真正的投资者关注度解释为一个不可观察的变量,而12个关注度度量中的任何一个都只是不可观察变量的代理。因此,希望通过去除噪声来提取真实关注度的共同成分。


1.因子构建模型

考虑基于投资者关注度的预测模型:

r_(t+1)=α+βA_t^*+ε_(t+1)    (1)

其中r_(t+1)是在时间t+1时实现的股票超额收益,A_t^*是时间t时真实但不可观察的投资者关注度,ε_(t+1)是一个不可预测且与A_t^*无关的噪声项。等式(1)中的模型表明真实的投资者关注度A_t^*与随后的股票回报率有关,这与关注理论的预测一致,如Peng 和 Xiong(2006)的预测。

接下来,我们假设关注度代理因子的线性构造。设在A_t=(A_(1,t),…,A_(N,t) )^'表示在时间t的个人投资者关注度代理的N*1向量;设N为代理变量的数量,在本文中为12。A_t对应于第二、A节中描述的关注变量。A_(i,t) (i=1,…,N)的结构模型如下

A_(i,t)=η_(i,0)+η_(i,1) A_t^*+η_(i,2) E_t+e_(i,t)    (2)

其中A_t^*是方程(1)中模型中真实但不可观察的投资者关注度,η_(i,1)是关注度代理A_(i,t)对真实关注度A_t^*敏感性的因子载荷,E_t是与股票收益无关的所有代理变量的共同近似误差分量,e_(i,t)是仅与测量i时相关的异质性噪声。

为了确定投资者关注度在股市中的独特作用,我们倾向于有效地估计A_t^*,即真实但不可观察的投资者关注度的共同属性。这里的关键思想是将方程(2)的因子构建方法应用于估计A_t^*,同时从估计过程中消除它们的共同近似误差E_t和异质性噪声e_(i,t)。为此我们使用了三种方法:PCA、PLS和sPCA。因此,我们有对应于3种方法估计的投资者整体关注度指数,A^PCA、A^PLS和A^sPCA。


2.主成分分析

PCA是最简单和最流行的方法。其提取A_(i,t)的第一主成分作为关注度整体,该变量最大程度上代表了12个个体关注度代理变量。根据其计量经济学原理,PCA方法可以将A_t^*从e_(i,t)中分离,并因此捕获个体关注度代理中的共同关注度信息。这种方法已广泛应用于股票收益可预测性的文献中,如Baker和Wurgler(2006)、Ludwigson和Ng(2007)以及Neely、Rapach、Tu和Zhou(2014)等的文章。

然而,PCA的主要缺点是无法消除与个人关注度代理中股票回报无关的常见测量或观察误差(E_t)。事实上,它只捕捉预测因子的最大共同变化,因此也将E_t纳入估计过程。正如Kelly和Pruitt(2013),(2015)所示,最能描述预测变量变化的成分不一定是在预测中最有用的因子。因此,PCA可能无法对未来的股票回报做出重要预测,即使股票回报确实可以通过真正的投资者关注度A_t^*来预测。为了克服这一计量经济学难题,我们采用了下文所述的PLS方法,该方法由Wold(1966)首创,Kelly和Pruitt(2013)、(2015)和Light等人(2017)进一步发展。


3.偏最小二乘法

PLS方法根据其与未来股票收益的协方差从单个关注度代理中提取A_t^*,并选择最适合预测的关注度代理的线性组合。在此过程中,PLS可以通过以下两个OLS回归步骤实现。

第一步是每个t月关注度代理对未来实现的超额股票回报r_(t+1)(作为预期超额回报的代理)的时间序列回归:

A_(i,t)=π_0+π_i r_(t+1)+u_(i,t)    (3)

其中A_(i,t)是第i个关注度代理。方程(3)的第一步时间序列回归中的π_i系数捕获了关注度代理A_(i,t)对投资者关注度A_t^*的敏感性,A_t^*由未来股票回报率r_(t+1)表示。如等式(1)所示,由于股票预期收益率r_(t+1)由A_t^*驱动,关注度代理与股票收益的可预测成分相关,与不可预测的误差无关。因此,系数π_i近似地描述了每个关注度代理如何取决于真实的投资者关注度A_t^*。

第二步回归是每个时间段t的截面回归:

A_(i,t)=c_t+A_t^PLS π ̂_i+v_(i,t)    (4)

其中,π ̂_i是在方程(3)的回归中估计的载荷,A_t^PLS是回归斜率,是时间t时的PLS关注度测量。在方程(4)的回归过程中,第一步回归载荷成为自变量,A_t^PLS为待估计的回归斜率。

PLS利用等式(1)和(2)联合系统的因子性质来推断相关的关注度因子A_t^PLS。如果真实的因子载荷π_i已知,我们可以通过简单地逐个周期运行A_(i,t)对π_i的横截面回归对A_t^PLS进行一致性估计。然而由于π_i未知,第一阶段回归斜率提供了A_(i,t)如何依赖于A_t^PLS的近似估计。换句话说,PLS使用时间t+1股票收益降维以提取与预测相关的A_t^*,并丢弃与预测无关的常见和异质性成分,例如E_t和e_(i,t)。

正如Kelly和Pruitt(2015)所记录的那样,由于代理指标的测量可能带有噪声,第一阶段的回归采用了变量误差的形式,第二阶段的回归产生了对潜在的独特但未知的因子(在我们的例子中是A_t^*)的估计。然而,由于相关的因子空间被代理的共同成分所覆盖,用已实现收益估计的PLS因子提出与潜在因子驱动的预期收益相一致的预测。

在实证分析中,我们使用1980年1月至2017年12月的全样本数据来估计PLS关注度指数,并调查其样本内回报的可预测性。具体来说,在方程(3)的时间序列回归中,我们对以下代理指标估计载荷(π_i):从1980年1月到2017年12月的A^ERet、A^PRet、A^52wH、A^HisH、A^CAD、A^AVol和A^(#AC),2004年1月至2017年12月的A^Inflow、A^Outflow、A^Media和A^Google,以及2004年1月至2017年6月的A^EDGAR。在第二步中,我们对1980年1月至2017年12月的每个时间t运行方程(4)中的横截面回归,并根据每个周期的可用载荷π_i估计A_t^PLS。因此,我们从1980年1月至2017年12月获得了基于PLS的月度投资者关注度A_t^PLS。

对于样本外预测,标准方法是通过截面t月的未知观测值来重复这两个步骤。具体而言,在第一步中,我们可以在回归方程(3)中右侧使用最近收益率r_t,因此,方程(3)中回归左侧的个体关注度测量值的最近观测值是A_(i,t-1)。在第二步中,我们对第1个月到第t个月进行了横截面回归。总之,对于样本外预测,我们使用不晚于第t个月中观察到的数据构建了预测的所有输入。此外,正如Light等人(2017)所表明的,在投资者关注度和预期股票回报之间的关系随时间稳定的弱假设下,通过使用所有先前周期的π_i平均值,而不是仅使用最近的π_i,可以更精确地估计斜率π_i。


4.比例主成分分析

除了PCA和PLS方法外,我们还使用了最近由Huang等人(2021)提出的sPCA。如第二.B.2节所述,尽管PCA因子最大程度地表示预测因子的整体变化,但它忽略了预测目标,因此是一种无监督的降维学习技术。相比之下,sPCA意在使用目标信息来指导降维。

sPCA分两步实现。首先,构建一组比例关注度预测因子(β_1 A_(1,t),…,β_N A_(N,t) ),其中比例系数β_i (i=1,…,N)是已实现的股票超额收益(r_(t+1))对第i个关注度代理(A_(i,t))的预测回归的斜率。

r_(t+1)=α_i+β_i A_(i,t)+ε_(t+1)    (5)

在第二步中,将传统PCA应用于比例预测因子(β_1 A_(1,t),…,β_N A_(N,t) )。因此,第一主成分是基于sPCA的投资者整体关注度A^sPCA。对于样本外预测,如PLS方法的实施,我们使用不晚于t月的观测数据递归估计方程(5)。

直观地说,比例序列β_i A_(i,t)反映了第i个关注度代理对未来回报的预测能力。预测能力强的代理权重较大(即β_i的绝对值更高),而预测能力弱的预测因子权重较小。总之,sPCA对比例关注度代理而不是原始代理执行PCA。

图1显示了1980年1月至2017年12月3个关注度指数A^PCA、A^PLS和A^sPCA的时间序列。我们观察到,从1980年1月份到2017年12月份,通过PLS、PCA和sPCA测量的投资者整体关注度指数随时间变化。总体而言,它们在经济衰退中有所下降,与Sicherman、Loewenstein、Seppi、,和Utkus(2016)研究结果相一致,他们研究表明市场下跌后投资者的关注度下降了9.5%。Karlsson、Loewenstein和Seppi(2009)介绍了这种现象,称为选择性关注度或鸵鸟效应。


III、实证结果

A、预测股市收益

在本节中,我们探讨了投资者整体关注度对股票市场超额收益的预测能力,超额收益被定义为CRSP数据库中价值加权总股票收益和国库券利率之差。单变量预测回归是

R_(t+h)=α+βA_t+ε_(t+h)    (6)

其中R_(t+h)是预测期h的平均市场超额收益,其中h为1、3、6、12和24个月,A_t是由PLS、sPCA和PCA方法分别构建的投资者整体关注度指数A^PLS、A^sPCA和A^PCA。我们通过使用2017年1月至12月的数据对方程(6)回归估计来测试A_t样本内的预测能力。具体而言,我们观察方程(6)中β(β ̂)的估计。原假设是A_t没有预测能力,即β=0,方程(6)中的回归为常数预期收益模型(R_(t+1)=α+ε_(t+1))。在备择假设中,β异于0,A_t包含对预测R_(t+1)有用的信息。我们分别使用Hodrick(1992)标准误差和Newey和West(1987)标准误差来计算β ̂对应的t统计量。

表3的面板A报告了A^PLS的预测结果。我们观察到,A^PLS显著预测了市场超额收益,这种可预测性持续了长达1年。更具体地说,根据Hodrick(Newey–West)标准误差,在月度范围内,β估计值为-0.64%,t统计量为-2.66(-2.85)。对于更长的预测范围,尽管β估计值仍然为负值,但在2年的水平上缩至-0.21%。因此,从长期来看,回报的可预测性会变弱。

 

理论上,方程(1)中β系数的符号不是决定性的。一方面,Barber和Odean(2008)认为,个人投资者是吸引关注度股票的净买家,因此,高关注度会导致同期的正向价格压力,从而降低未来回报,这与Peng和Xiong(2006)一致。另一方面,Gervais等人(2001)发现,交易量所捕获的关注度与股票关注度呈正相关,这可以增加股票价值,他们的实证证据与Andrei和Hasler(2020)一致,他们的模型表明正斜率或负斜率(一般取决于相对于其平均值的新闻)。然而,他们的研究只关注每日和每周数据以及高关注度股票,而我们关注的是月度市场回报。价格似乎可以在短期内朝一个方向移动,而在长期内朝相反的方向移动,因此其结果与我们的不同。为了进一步加强经济解释,在第四节中,我们提供了与Da等人(2011)一致的额外分析,以支持Barber和Odean(2008)关于我们结果的经济驱动力的论点。

从经济角度来看,β估计值的大小是相当大的。由于我们将所有预测指标标准化为零平均值和单位方差,因此我们的月度预测结果表明,A^PLS的单位标准差增加将导致下个月的预期股市回报率下降0.64%。如果我们按年计算这一规模,它等于7.68%,这与传统的宏观经济预测指标相当。例如,股息-价格比率、消费-财富比率和净支出比率的单位标准差增加往往会使风险溢价每年分别增加3.60%、7.39%和10.2%(例如,参见Lettau和Ludwigson(2001)、Boudoukh、Michaly、Richardson和Roberts(2007))。

此外,回归R^2提供了另一个指标来评估A^PLS预测能力的经济意义。在月度范围内,样本内R^2等于2.15%,这在经济意义上是很大的。我们的结果意味着A^PLS可以解释月度市场超额收益时变的2.15%。随着预测范围的增加,R^2在年度范围内达到峰值,数值为7.65%,在随后2年范围内下降到5.62%。

表3的面板B报告了A^sPCA的预测结果。我们发现,与A^PLS一样,A^sPCA对市场超额收益具有负向预测能力。具体来说,月度水平回归斜率为-0。49%,具有统计学意义,基于Hodrick(Newey–West)标准误差的t统计量为-2.43(-2.29)。系数估计值在长达1年的时间内仍然有效,但其绝对值在季度范围内最大,之后随着预测范围而降低。因此,与面板A的调查结果一致,A^sPCA的结果也表明,长期来看,回报的可预测性会减弱。此外,月度水平的样本R^2(1.26%)在经济上相当可观,并且在季度水平内最大化,值为4.86%。

我们在表3的面板C中发现了A^PCA的类似证据。A^PCA的系数在整个预测范围内都是负的,而且除了月度范围的估计值外,在统计上是显著的。与面板A和B的结果一致,回报可预测性在季度范围内很强,在半年和年度范围内稍弱,在2年范围内大大减弱。在聚合来自个体关注度代理的信息方面,PCA是一种比PLS和sPCA更有效的方法。PCA只能找到代表个人关注度代理变量的最佳预测因子,但它不能有效地去除代理变量的共同噪声,正如第二B中所说的那样。

作为比较,我们研究了12个个人关注度代理对未来市场超额收益的预测能力。补充材料中的表IA.1列出了结果。我们观察到,只有两个代理指标(A^HisH和A^Inflow)可以在月度范围内对未来市场超额收益进行负向和显著的预测。在年度范围内,具有显著预测能力的预测因子数量增加到4个。我们的研究结果表明,个人关注度代理的收益预测能力有限。正如第二节所表明的,衡量整个市场关注度的噪音很可能会削弱单个指标预测未来市场回报的能力。因此,依靠单一代理指标无法探索投资者关注度对股票市场的总体影响。显而易见,我们希望通过在很大程度上消除噪音,从单个关注度代理中提取共同的成分。我们通过使用PLS、sPCA和PCA方法来实现这一目标,我们在表3中发现了强有力的预测性证据。

综上所述,本文表明,基于PLS、sPCA和PCA(A^PLS、A^sPCA和A^PCA)构建的投资者整体关注度指数对样本内未来市场超额收益表现出统计学和经济学上显著的预测能力。这种预测能力持续了1-2年之久。我们的研究结果表明,投资者的关注度确实在市场中发挥着重要作用,这与关注度理论的预测是一致的,并补充了现有的实证文章,这些文章发现投资者的关注度只对截面股票收益有影响。我们的整体关注度指标在预测股市方面优于个别关注度指标,因为它通过消除可能削弱投资者关注度对市场的总体影响的噪音,从个别指标中捕捉到与真实投资者关注度中最相关的信息。


B、与经济变量的比较

我们的证据显示了投资者整体关注度指数显著的预测性。我们进一步研究预测信息是否来自商业周期相关的基本面。为了解决这个问题,我们控制了一组预测文献中常用的经济变量。预测性回归如下:

R_(t+h)=α+βA_t+ϕX_t+ε_(t+h)    (7)

其中R_(t+h)是预测期h的平均股票超额收益;A_t是时间t的关注度指数A^PLS、A^sPCA和A^PCA之一;X_t代表Goyal和Welch(2008)的经济变量向量,他们提出了14个经济变量,数据可从Amit Goyal的网站获得(http://www.hec.unil.ch/agoyal/)。附录显示了这14个变量的描述性统计。在一次回归中同时使用所有变量可能会导致多重共线性问题,因此,在我们的模型规范中,我们使用了8种:DP、DY、EP、BM、SVAR、LTR、TMS和DFY。

 

表4的A组报告了A^PLS的估计结果。我们发现,在控制了经济变量之后,A^PLS的回归斜率仍然具有统计学意义,这表明投资者关注度对总体股市的影响不能由经济基本面来解释。此外,系数估计值的幅度也很大。例如,在月度范围内,A^PLS的β估计值为-0.90%,表明其经济意义。随着预测范围的增加,其幅度也会缩小。回归R^2统计量也很大。调整后的R^2从月度水平的5.43%增加到年度水平的13.99%。因此,将投资者的关注度与经济预测因素结合起来,可以产生对总体股票市场强大的预测能力。

在表4的B组和C组中,我们观察到A^sPCA和A^PCA的类似结果。在控制了经济变量后,A^sPCA和A^PCA仍能显著预测未来的股市收益,但A^PCA在月度范围内除外。回归斜率在经济上是可观的,而且其绝对值随着时间的推移而减少。此外,将投资者关注度指数A^sPCA(或A^PCA)纳入基于经济变量的回归中,会产生较大的样本内R^2统计数据,每年达到13.63%(13.80%)。


C、与投资者情绪的比较

接下来,我们将投资者整体关注度与情绪相关预测因子在市场回报预测能力方面进行比较。一方面,Da等人(2011)认为,由于关注度是产生情绪的必要条件,投资者关注度的增加,尤其是来自容易产生行为偏见的“噪音”交易者的关注度,可能会导致情绪的增强。另一方面,增加对真实新闻的关注可能会加快信息被纳入价格的速度,从而可能削弱情绪。我们在本小节中的分析对于理解投资者关注度在预测市场中的独特作用非常重要。

我们采用Baker和Wurgler(2006)的投资者情绪指数(S^BW),该指数已被文献广泛使用,如Baker和Wurgler(2007),Yu和Yuan(2011),Baker,Wurgler和Yuan(2012),Stambaugh,Yu和Yuan(2012)以及其他。这些数据可从Jeffrey Wurgler的网站(http://people.stern.nyu.edu/jwurgler/)获得。为了比较投资者的关注度和情绪,我们首先计算它们的相关系数。A^PLS和S^BW之间的相关系数为0.37,A^sPCA和S^BW之间的相关系数为0.04,A^PCA和S^BW之间的相关系数为0.01。这些低的相关系数意味着投资者的关注度包含了不同于投资者情绪的信息。

接下来,我们根据以下预测性回归,分析控制情绪后投资者关注度的增量预测能力。

R_(t+h)=α+βA_t+ϕS_t^BW+ε_(t+h)    (8)

其中R_(t+h)是预测期h的平均市场超额收益;A_t是时间t的投资者关注度指数A^PLS、A^sPCA和A^PCA之一;S_t^BW代表时间t的Baker和Wurgler(2006)投资者情绪指数。我们观察到,在控制了投资者情绪SBW之后,除了A^PCA在月度水平,投资者关注度指数A^PLS、A^sPCA和A^PCA的回归斜率在不同的预测水平上仍然具有统计学意义。这一发现意味着投资者关注度在预测股市时包含了独特的信息,是对情绪预测因子的补充。此外,我们的结果表明,在一个回归中联合使用投资者关注度和投资者情绪可以产生强大的回报预测能力。A^PLS的样本内R^2每年高达9.30%,A^sPCA和A^PCA的样本内R^2也是相当大的。因此,理解投资者关注度对市场的影响是有意义的,因为它包含了不同于投资者情绪的信息。

 


D、样本外表现

虽然样本内分析提供的参数估计值更有效,其利用所有可用的数据进行更精确的回报预测,但Goyal和Welch(2008)等人认为,样本外测试似乎更适合于评估实时的真实回报预测能力。在本小节中,我们评估了投资者整体关注度对市场超额收益的样本外预测能力。

基本上,我们从一个初始化时期开始,根据每个关注度的衡量标准估计方程(6)中的预测性回归,以产生第一个样本外预测。预测的回报率是

R ̂_(t+h)=α ̂_t+β ̂_t A_t     (9)

其中α ̂_t和β ̂_t是方程(6)中回归的OLS估计值。我们递归估计方程(6)中的回归,并根据方程(9)重复构建接下来的月度样本外预测,直到我们到达样本期的终点。此外,根据Campbell和Thompson(2008)以及Pettenuzzo, Timmermann和V alkanov(2014),我们对预测收益施加了一个经济限制,即预期风险溢价必须为正,以符合理论。

在实证实施中,我们使用1980年1月至1994年12月为初始期,因此,样本外预测评估期从1995年1月至2017年12月。我们选择初始样本内估计期的长度是为了使观测值足以精确地估计初始参数,而样本外预测期相对较长足以评估预测结果。重要的是,如第二节所述,我们使用不晚于该月观测到的可用数据来构建第t个月的投资者关注度(A_t^PLS,A_t^PCA或A_t^sPCA)以预测样本外第t+1个月的回报。此外,在构建样本外PLS投资者关注度时,我们采用了Light等人(2017)建议的使用方程(3)第一步回归中斜率π_i的平均数,即所有以前的时期。我们的结果对使用最近的π_i估计值和其他平均方案,如过去5年或10年的平均,都是稳健的。

为了评估样本外的表现,我们采用了Campbell和Thompson(2008)的R_OS^2以及Clark和West(2007)的MSFE调整统计量。R_OS^2衡量预测性回归相对于基准预测的MSFE减少比例。当R_OS^2>0时,预测性回归预测在MSFE方面优于基准预测。主要基准是从样本开始到t月的平均超额收益。这一预测对应于恒定的预期超额收益模型,即方程式(6)中β=0,表明收益是不可预测的,就像股票价格对数的典型随机游走模型一样。为了确定预测回归预测是否对MSFE有明显的改善,我们使用Clark和West(2007)的MSFE调整统计,检验历史平均MSFE小于或等于预测回归预测的零假设和历史平均MSFE大于预测回归预测的另一假设,即H_0: R_OS^2≤0 对H_A: R_OS^2> 0。

表6列出了样本外的结果。我们发现所有3个整体关注度指数(即A_t^PLS,A_t^PCA、A_t^sPCA)都产生了正的R_OS^2值,根据MSFE调整后的统计数据,除了A^PCA在月度水平外,具有统计意义。因此,我们的结果表明,由投资者整体关注度产生的样本外预测的MSFE明显低于历史平均值。此外,R_OS^2统计量的大小在经济上是显著的。例如,A^PLS的R_OS^2在月度范围内等于2.04%,在年度范围内增加到6.60%。由于股票收益中固有的很大的不可预测成分,股票收益预测的R^2统计量通常很小。Campbell和Thompson(2008)认为,每月0.5%的样本外R^2可以产生巨大的经济价值。显然,总体关注指数的R_OS^2统计数字远远大于0.5%,表明具有实质性的经济意义(Kandel和Stambaugh(1996))。我们在下一小节中分析这个问题。

 

作为比较,我们考察了个人关注度代理指标的样本外表现。由于数据限制,我们只在补充材料的表IA.3中显示了1995年1月至2017年12月的7个代理变量(A^AVol、A^ERet、A^PRet、A^52wH、A^HisH、A^(#AC)、A^CAD)的结果。我们观察到,7个指数中只有3个,即A^52wH、A^HisH和A^CAD,在年度范围内提供了正向显著的R_OS^2统计数据,分别为1.12%、2.49%和2.40%。尽管如此,这些数值仍然小于A^PLS的数值(6.60%)。因此,与我们对样本内结果的结论一致,依靠单一的代理变量往往会低估投资者对市场整体关注度的预测能力。

综上所述,表6显示,由PLS、sPCA或PCA方法构建的投资者整体关注度对股票市场收益表现出强大的样本外预测能力。相比之下,很少有个人关注度的代理指标能够显著地预测样本外的市场收益。我们的实证研究结果对关注度文献具有重要意义。首先,它们首次证明了投资者关注度可以预测样本外的股票市场总量,这与它对截面收益的影响相似,这强调了投资者关注度在资产定价中未被认识的作用。其次,如果没有有效的信息聚合,投资者关注度对市场的预测能力将被低估。


E、资产配置分析

鉴于投资者整体关注度的强大预测能力,其经济价值仍不清楚。如果投资者利用投资者整体关注度的预测信息,而不是完全忽视它,那么找出投资者整体关注度是否为投资者产生实质性的经济价值将是很有意义的。因此,在本小节中,我们从资产配置的角度来评估其经济价值。

参考Kandel和Stambaugh(1996),Campbell和Thompson(2008),以及Ferreira和Santa-Clara(2011),我们考虑一个根据回报预测在风险股票和无风险票据之间做出资产配置决策的均值方差投资者。该投资者在下个月末对投资组合进行再平衡。投资组合中股票的权重由以下因素决定:

w_t=1/γ  R ̂_(t+1)/(σ ̂_(t+1)^2 )    (10)

其中γ是风险厌恶程度,R ̂_(t+1)是样本外股票超额收益预测,σ ̂_(t+1)^2是其方差的预测。与Campbell和Thompson(2008)相似,我们假设投资者使用过去回报的5年移动窗口来估计股票预期收益的方差。此外,我们将w_t限制在0到1.5之间,排除卖空且最多有50%的杠杆率。

投资者将投资组合的〖1-w〗_t分配给无风险票据,在时间t+1实现的投资组合回报(R_(t+1)^p)

R_(t+1)^p=w_t R_(t+1)+R_(t+1)^f     (11)

其中R_(t+1)^p是无风险收益率。投资组合的确定性等价回报(CER)为

CER_p=μ ̂_p-0.5γσ ̂_p^2     (12)

其中,μ ̂_p和σ ̂_p^2分别是预测评估期内投资者投资组合的样本均值和方差。我们可以将CER解释为投资者愿意接受的无风险收益,而不持有风险投资组合。CER增益是使用公式(9)生成的月度收益预测回归预测的投资者CER与使用历史平均预测的投资者之间的差值。我们把这个差额乘以12,这样我们就可以把它解释为投资者为获得预测性回归预测而愿意支付的年度投资组合管理费。除了CER增益,我们还计算了投资组合R_t^p的年化夏普比率来评估投资业绩。考虑到实际投资中交易成本的存在,我们在扣除了50个基点(bps)的比例交易成本后,检查了我们资产配置结果的稳健性。通过这种方式,我们衡量了收益预测性的直接经济价值。

为了分析较长时期下收益预测性的经济价值,我们遵循Rapach等人(2016)的观点,假设投资者以与预测时期相同的频率进行再平衡。对于季度范围,在季度末,投资者使用对未来3个月超额收益的预测回归或历史平均预测(h=3)和方程(10)给出的分配规则来确定未来3个月的股票权重;在下一季度末,投资者更新季度预测回归或历史平均预测并确定新的权重(这样投资者使用不重叠的收益预测)。投资者对半年度和年度的回报预测和再平衡遵循类似的程序。

 

表7报告了1995年1月至2017年12月的样本外时期的资产配置结果。我们假设风险厌恶系数为5,发现我们的结果对其他合理的系数值是稳健的。我们观察到,除了A^PCA在月度水平上的收益预测外,投资者整体关注度的收益预测在整个预测水平上产生了极其可观的投资收益。更具体地说,A^PLS的CER收益在月度水平上是3.99%,意味着投资者愿意支付高达399个基点的年费来获取A^PLS的预测回归预测。这种巨大的经济价值在季度、半年和年度范围内也存在。与A^PLS类似,A^sPCA和A^PCA也产生了大量的经济价值。A^sPCA的CER收益在月度水平上是3.11%,在较长的水平上仍然是可观的,尽管在年度水平上它略微下降到2.78%。A^PCA在年度范围内产生的最大CER收益为5.00%,表明投资利润很大。在考虑了0.5%的交易成本后,经济价值仍然相当可观。A^PLS(A^sPCA)的净交易成本的CER收益在不同的水平线上从3.04%到4.41%(1.93%-2.70%)。在经济上,A^PCA在年度范围内的价值也很大,为4.96%。

此外,基于投资者整体关注度的投资组合产生了显著的高夏普比率。如表7所示,A^PLS在月度范围内的年化夏普比率为0.74,而市场的夏普比率为0.50。在扣除50个基点的交易成本后为0.67,这在经济上仍然是很大的。因此,我们的结果表明,基于投资者关注度的A^PLS的市场时机策略优于单纯的买入和持有策略。从长期来看,零交易成本(有50个基点的交易成本)的夏普比率在年度范围内下降到0.43(0.42)。我们发现A^sPCA和A^PCA的结果相似。基于这两个替代性关注度度量的投资组合也提供了可观的夏普比率,A^sPCA(A^PCA)的夏普比率从0.38到0.67(0.36到0.48)。这些结果对50个基点的交易成本是稳健的。

总之,基于投资者整体关注度的资产配置具有巨大投资收益,表明对均值方差投资者具有巨大的经济价值。因此,从资产配置的角度来看,这一分析强调了投资者关注度在市场整体中的重要作用。


IV、经济解释

我们的实证结果表明,高投资者关注度预示着随后的低股票回报。在本节中,我们探讨了负收益可预测性的可能经济来源。


A、投资者关注度与总成交量失衡

Barber和Odean(2008)认为,当投资者寻找要购买的股票时,他们必须从成千上万的候选股票中进行选择。然而,当他们选择那些要出售的股票时,他们只能出售他们已经拥有的股票。因此,投资者更倾向于购买那些吸引眼球的股票,这就造成了暂时的价格正压力。Da等人(2011年)发现支持性证据,以谷歌搜索量异常表示的投资者关注度为正时,预示着未来2周内股票价格会上涨,此后这种影响会减弱。最重要的是,价格压力在第4周趋于恢复,并几乎在1年内完全反转。

根据Barber和Odean(2008)和Da等人(2011)的说法,我们的投资者关注度指数的负向预测性可能来自暂时价格压力的反转。高度关注可能导致个人投资者的净买入流量,从而推高价格。暂时的价格压力在随后的时期恢复到基本面。因此,投资者的高度关注导致了未来的低股票收益。

为了利用这一解释,我们检验了总成交量与投资者关注度指数之间的关系。我们遵循Lee和Ready(1991年)以及Barber和Odean(2008年)的规定,将公司层面的月度成交量定义为

OF_(i,t)=(TNB_(i,t)-TNS_(i,t))/(TNB_(i,t)+TNS_(i,t) )     (13)

其中OF_(i,t)是公司i在t月的买卖失衡,TNB_(i,t)是t月内购买股票i的总数,TNS_(i,t)是t月内出售股票i的总数量。我们使用1993年至2017年期间交易和报价数据库(TAQ)中的逐点交易数据计算OF_(i,t),市场层面的订单流AOF_t是价值加权的OF_(i,t)。我们使用以下回归来研究投资者关注度对总的买卖不平衡的影响:

ΔAOF_(t+h)=α+β_1 A_t+β_2 Ret_t+β_3 Ret_(t-1)+β_4 Ret_(t-2)+ε_(t+h)     (14)

其中ΔAOF_(t+h)是AOF_t在h期间的变化,其中h=0、1、6和12个月;A_t代表一种关注度指数,A^PLS、A^sPCA和A^PCA;还有Ret_t,Ret_(t-1)和Ret_(t-2)分别是时间t、t-1和t-2的市场收益。h=0表示ΔAOF_t和A_t之间的同期关系。

表8的面板A、B和C分别报告了A^PLS、A^sPCA和A^PCA的估计结果。在图A中,我们发现证据表明,当h=0时,A^PLS强烈影响总成交量的变化。A^PLS的回归斜率为0.12%,t统计量为2.71,这意味着投资者的高度关注显著增加了净买入。这与Barber和Odean(2008)和Da等人(2011)的研究结果一致。我们在面板B和C中发现了A^sPCA和A^PCA的类似证据。同期回归得出的A^sPCA(A^PCA)系数为0.05%(0.02%),t统计量为3.75(1.73),支持个人投资者净买入流量是关注度指数负向预测来源的解释。

 

由于整体关注度指数的收益率负向可预测性可能源于未来的价格反转,因此我们预计A_t对成交量失衡变化的影响将在下一个月反转,这表明在投资者高度关注后,净买入量的增加将放缓。表8中的结果支持这一推测。在图A中,月度预测回归的A^PLS系数估计值为-0.14%,t统计值为-2.99,表明净购买量在随后的t+1期间停止增加,因此短期价格压力趋于恢复。从长远来看,A^PLS对买卖失衡的影响完全减弱。我们的发现与Da等人(2011)的解释一致,即如果关注度驱动的净买入导致暂时的价格压力,那么从长期来看,价格会出现反转。此外,我们的结果也不能排除后续时期出现抛售压力的可能性。Yuan(2015)发现,由于处置效应和再平衡需求,投资者可能会在吸引眼球的事件后卖出更多股票。面板B和C的A^sPCA和A^PCA的结果与面板A的结果类似。当h=1时,A^sPCA(A^PCA)的回归斜率为负,为-0.13%(-0.07%),t统计量为-3.02(-1.64),表明在随后的t+1月净买入量减少。

总之,表8的结果表明,投资者整体关注度与个人投资者的交易行为密切相关。高度关注表明个人投资者的净购买量总体上显著增加,导致暂时的价格压力。随后,净买入流量减缓,价格趋于恢复。这一证据提供了一种可能的经济机制,通过这种机制,投资者的关注度可以负面预测未来市场的收益。

另一种解释是,高度关注可能表明投资者希望获得有关公司基本面的信息,特别是在新闻发布期间,如盈利公告。但是,实证上很难区分关注度和信息获取的影响。然而,更多的信息获取可能会减少信息不对称,降低风险,从而降低风险溢价。在这种情况下,更多的关注可能也会导致未来低回报。


B、基于特征的投资组合的可预测性

我们之前的证据表明,投资者关注度对收益的负向可预测性主要源于短期价格压力的长期反转。在本小节中,我们探讨了投资者关注度对股票收益影响的横截面变化。

Han等人(2021)认为,高方差股票(高贝塔系数股票和高异质性波动率股票)更有可能吸引投资者的注意。因此,我们考虑按这两个特征分类投资组合。我们从Kenneth French的网站上获得了10个市场贝塔排序投资组合的价值加权回报。此外,我们还计算了按特殊波动率排序的10个投资组合的价值加权收益,该波动率定义为前一年股票每日超额市场收益回归后的残差波动率。为了测试横截面的可预测性,我们估计了以下预测回归:

R_(t+h)^i=α^i+β^i A_t+ε_(t+h)^i     (15)

其中,R_(t+h)^i表示每个投资组合在t+h期上的平均超额收益,A_t是投资者整体关注度指数A^PLS、A^sPCA和A^PCA之一。

图2显示了1980年1月至2017年12月的样本期间,该回归的系数估计值(β^i),即特征各十分位投资组合。结果显示,大多数系数估计值在整个投资组合中都是负的,这表明投资者总体关注度(A_t)的负回报预测性在横截面上是普遍存在的,与我们在总体市场水平上的发现一致。对于高贝塔股票和那些具有高特异性波动的股票来说,斜率负值更明显。我们的发现有力地支持了Han等人(2021)的论点,即投资者倾向于被高波动性的股票所吸引,推动其价格上升,从而降低其预期收益。

 

总体而言,我们对基于特征的投资组合的分析表明,总体投资者关注度在投资组合中普遍具有强大和负向预测能力。这种可预测性在各方面有所不同。对于高方差股票来说,这一点尤为重要,这有助于我们更好地理解投资者关注股市的负面预测能力。


V、结论

在本文中,我们首次研究了投资者关注度测度对市场整体的预测能力;这与现有的文章形成了对比,这些文章主要关注横截面的可预测性和单个预测因子的使用。我们通过使用三种方法来汇总个人投资者关注度指标:PLS、PCA和改进的PCA方法sPCA。我们发现,综合投资者关注指数对随后的月度股市回报率有显著的负向预测。然而,这种可预测性随着预测范围的增加而变弱。相比之下,个人关注度代理的回报可预测性有限。我们的关注度指数的预测能力大于使用普通回报预测因子的预测能力,并且在控制投资者情绪后仍然存在。此外,强可预测性存在于样本之外,因此为资产配置中均值方差投资者提供了可观的经济价值。

本文强调投资者关注在股市和金融领域的重要作用。我们确定了负向可预测性的两个经济来源。投资者对股市总体关注的预测能力很可能来自于净买入造成的暂时价格压力的反转,以及高方差股票的强劲动力。未来的研究可能会将我们的信息聚合方法扩展到其他资产市场或其他国家,也可能会在应用投资者情绪指数的任何地方应用投资者关注度。当前研究的目的是表明投资者的关注度对市场风险溢价至关重要,研究如何结合机器学习工具进一步提高其预测能力会是一个有趣的方向(例如,参见Gu、Kelly和Xiu(2020)以及Rapach和Zhou(2020))。

Investor attention and stock returns--投资者关注度与股票收益的评论 (共 条)

分享到微博请遵守国家法律