【Python量化】股票涨停板探索性分析与数

01
引言
从系统论的角度来看,股票市场是一个复杂系统,市场的涨跌是由资金流(市场资金存量、流入量、流出量)和回路(市场信息与交易者行为形成的各种反馈、调节、增强回路)非线性作用下的结果。换句话说,牛市是资金流入和正向反馈(赚钱效应吸引更多资金流入)占主下的系统演化过程,熊市则相反。而影响市场资金流向和反馈回路形成的驱动因素主要有政策、经济、交易情绪、流动性、技术面和外围环境等。市场上对这些驱动因素的研究和把握最强的是“聪明资金”(Smart money),在A股上则是那些游资主力,而不是基金。龙虎榜是这些游资的战场,而涨停板则是游资主力释放的最重要的操盘信号。涨停板制度是我国借鉴国外早期证券市场,为防止交易价格暴涨暴跌,抑制过度投机的制度,却也成了游资主力吸引跟风盘的重要手段。利用概念题材炒作,快速封涨停板,通过类似饥饿营销地方式吸引各路跟风资金,再拉高出货赚取价差。当然涨停板不代表一出现就会上涨,也可能是昙花一现,也可能是主力挖的坑,但是游资主力发动进攻一般以涨停板出现。因此涨停板是实盘操作中值得深入分析和挖掘的重要信号。本文使用Python对A股市场2016-2021年涨停板个股数据进行探索性分析,为读者挖掘涨停股、深入认识市场提供一个量化视角。
02
数据获取
本文数据来源于tushare,数据期间为2016年2月15日-2021年4月23日,包含74300个样本。tushare pro中的limit_list函数可直接获取A股中每日涨跌停个股信息。

其中,fl_ratio 为封单手数/流通股本;amp是振幅;fc_ratio是封单金额/日成交金额;fl_ratio为封单手数/流通股本;fd_amount为封单金额;first_time代表首次涨停时间;last_time代表最后封板时间;open_times是打开次数;strth是涨跌停强度。
03
市场涨停整体情况
描述性统计
df.iloc[:,1:].describe().round(2)

从描述性统计来看,涨停股价格大都在25元及以下(75%分位数),其他几个变量波动标准差均较大,反映个股涨停的特征差别较大。下面使用可视化的方式展现不同价格期间个股涨停情况。
涨停股价格区间
先构建一个价格区间标记函数,将个股收盘价划分为10元以下、10-30元、30-50元、50-100元以及100元以上,价格区间的划分主要是根据经验和A股市场情况而定。
使用柱状图展示不同价格区间下涨停个股数量分布。

涨停板排名
面对2016-2021年期间个股出现涨停次数进行排序,前二十名中有十二个是ST(含*)股,ST股一直是市场短
线资金炒作的对象,容易暴涨暴跌,特别是有摘帽预期的个股,在资金的推动下短期可能出现连续几十个涨停,当然炒作过后往往也一地鸡毛,如*ST天马。


剔除*ST/ST/N股后排名下面是剔除*ST/ST/N股后的情况,其中诚迈科技在2019年和2020年2月短短一年期间以大量涨停的方式实现了二三十倍的涨幅。
每日涨停统计
每日涨停个数在一定程度上反映了市场的交投热情,当涨停个股超过100个时,预示着市场赚钱效应较高。

04
行业涨停分布
细分行业
tushare pro的stock_basic可以获取个股所在的细分行业,将该数据与涨停数据合并,然后按照行业进行聚合,可以得到各细分行业的涨停个股分布情况。


大类行业
上述行业分类过细,对部分相关细分行业进行合并,最后得到28个大类行业。
合并成大类板块后,数据显示,4月23日医药生物板块涨停个股最多,此外,机械设备、电子、纺织服装、汽车和休闲服务(含旅游)等板块最近一周涨停股较多,与近期热点密切相关,如印度疫情复发、新能源、五一旅游等。

使用滚动5日累计板块涨停个数,可以一定程度反映近期板块题材的资金的关注情况,排在前面的是汽车、医药生物、机械设备和电子。

05
个股连板情况
下面构建函数统计和分析个股连续涨停的概率以及获取某日连板股票池。
连板概率

数据显示,个股第一次涨停后,第二天连续涨停的概率接近30%,连续7-10板的概率接近0。剔除st股后连板的概率更低。

获取某日连板个股
下面使用get_con_up_stocks获取指定日期连板的个股名单,如2021年4月23日,锦泓集团、ST岩石、*ST节能实现四连板。
603518.SH 4;600696.SH 4;000820.SZ 4;002175.SZ 3;002575.SZ 3;600462.SH 3;002997.SZ 2;002592.SZ 2;600518.SH 2;002885.SZ 2;603538.SH 2;002630.SZ 2;002071.SZ 2;002587.SZ 2;002021.SZ 2;600581.SH 2;601127.SH 2

06
结语
美国著名投机家杰西·利弗莫尔(《股票作手回忆录》)说,如果你不能在领头羊上赚钱,就不可能在股市上赚钱。在A股市场,领头羊个股往往是以涨停的形式开启一波大行情,涨停板是反映主力进攻(或撤退)的重要操盘信号。市场上一度流行着“有三必有五,有五必成妖”的涨停股说法。当然从数据统计的概率来看,一直连五板及更多的概率是较低的,大部分妖股是连续涨停后经过猛烈调整和洗盘再继续拉升的。本文从量化的角度对A股涨停个股数据进行了探索性分析,为读者通过量化的手段挖掘涨停个股提供参考框架。对于驱动个股涨停的具体反馈回路还有待深入探讨,如存在哪些闭合因果关系链驱动资金流向某个板块题材和个股,或者说影响个股涨停和持续性的关键因素是什么?能否通过量化的手段构建涨停板交易策略,历史回测效果如何?这些问题留给读者进一步思考。
关注我即刻了解更多数据分析知识
更多数据分析内容
扫描码即可了解
