量化投资策略科普:理念、策略架构与交易 导读:本篇报告回顾了量化选股海内外发展历史,介绍了产品主流做法,并给出产品筛选标准。目前主流量化私募基本采用不做市场择... 

您所在的位置:网站首页 数据特征量化分析报告怎么写 量化投资策略科普:理念、策略架构与交易 导读:本篇报告回顾了量化选股海内外发展历史,介绍了产品主流做法,并给出产品筛选标准。目前主流量化私募基本采用不做市场择... 

量化投资策略科普:理念、策略架构与交易 导读:本篇报告回顾了量化选股海内外发展历史,介绍了产品主流做法,并给出产品筛选标准。目前主流量化私募基本采用不做市场择... 

2024-07-16 06:43:02| 来源: 网络整理| 查看: 265

来源:雪球App,作者: 可疑情况,(https://xueqiu.com/8693031311/221755614)

导读:本篇报告回顾了量化选股海内外发展历史,介绍了产品主流做法,并给出产品筛选标准。

目前主流量化私募基本采用不做市场择时、不主动风格择时、超分散持股、机器+人工构建特征、线性+非线性算法特征组合、量化模型不断迭代以及完全程序化交易的基本框架因此,量化私募筛选需了解更多投资细节,包括量化投资流派、团队合作模式、策略研究能力和投资执行力等。

量化选股投资理念种类繁多,大致可分为学院派模式、金融科技模式与主动量化模式三大类型。学院派更注重“科”,金融科技派更注重 “技”,主动量化派更注重“人”。

量化私募团队合作模式主要包括silo PM 制和 centralized book 制。Silo PM制下,特征挖掘存在竞争优势,除核心PM 以外的团队离职率对产品影响较小;centralized book 制下,特征组合和算法交易上具备比较优势,策略迭代能力更强。

量化私募通常在特征挖掘、特征组合、组合优化以及算法交易中的某一模块具备竞争优势。在不同市场环境以及不同的投资模式下,各个模块的重要性也不尽相同。例如,当市场有效性极弱时,特征挖掘最为关键,一个好因子通常能带来非常不错的收益风险比;在基金规模不断扩大时,算法交易能够大幅降低不断增长的冲击成本;当策略逐渐低频化时,组合优化的价值凸显;当策略较为拥挤时,风险敞口管。

量化私募交易频繁,我们需要了解量化私募是否实现了实验环境和生产环境的分离,具备完善的交易指令管理体系;除此之外,量化模型无法考虑到未来所有情况,因此我们需要了解量化私募历史的突发事件应对经验;最后,IT 基础建设支持重要性不言而喻。

一,1. 量化选股投资简史

量化选股投资理念种类繁多,大致可分为学院派、金融科技与主动量化三大类型。

学院派模式:20世纪70年代,量化投资鼻祖BGI(Barclays Global Investors)发行了全球首只量化选股产品。凭借其学术背景,BGI的主动和被动产品例如IShares等大获成功,成为全球最大的资产管理公司之一,2009 年 BGI 被贝莱德收购,2008 年出版的《ActivePortfolio Management》了 BGI 控制风险获取超额收益的数量方法,基于此的多因子选股产品被称之为BGI 模式,是量化选股领域的学院派。1998 年,学院派对冲基金AQR 成立,将行为金融学引入多因子选股,2005 年,Smart Beta 概念兴起,AQR基于因子投资理念构建了收费低廉的指数增强产品,其中价值风格是 AQR 主要投资风格。2008 年金融危机后,BGI 海外人才归国发展,BGI 模式在国内开始流行。在BGI模式快速崛起的同时,自20世纪80年代起,美国也涌现了一批其他模式的量化对冲基金如 Renaissance 等,如今同样成长为量化巨头。

金融科技模式:代表包括 Renaissance、Two Sigma、Worldquant 等, 采用系统化投资框架,数据驱动的纯定量投资模式。Renaissance以数学和统计为特色,采取了高频统计套利模式,基金只招数学、物理及统计等背景的博士生交易创造超额收益通过频繁拥有 71+ PB 的数据体量和过万的数据源;WorldQuant则专注于因子开发,寻找高质量的交易信号。目前国内大部分量化私募采用了此类投资模式。

主动量化模式:代表包括Blackrock、D. E. Shaw 等,其交易频率较低,策略容量高。Blackrock以严谨的系统化方式分析投资基本面,使主动投资更具科学性;D. E. Shaw 同样将系统化投资与主动投资结合形成混合策略,例如量化预测可能没有考虑到疫情等黑天鹅事件的影响,混合策略有助于减少预测误差,更具灵活性。

海外量化基金虽各有特色,但拥有共同的量化基因:通过金融与科技的结合实现投资流程系统化、投资组合分散化,交易执行纪律化。凭借系统化、分散化、纪律化的竞争优势,头部量化基金管理规模不断扩大、投资策略愈发丰富,上述不同类型策略均有涉猎、投资范围也从权益、债券扩大到另类资产。根据海外学者研究(《Factor Features: Not Your “90s Quant”》),截止2019年Q2,美国量化基金的规模占美股总市值的比例达到接近 9%,量化基金整体的规模大约为3.3万亿美元。

量化基金发展绝非一帆风顺,历史上每一次极端风格的演绎对于量化管理人都是极大的考验。AQR 创始人阿斯内斯曾写信给投资者说:任何一个策略都不会很容易,市场上没有容易钱。如果一个策略可以躺着赚钱,那它一定会很快被套利走。任何持续、长期能挣钱的因子,都是时不时会让你非常疼一下。

2000年互联网泡沫时期,以价值为导向的AQR市场中性策略遭遇巨大亏损,业绩下降近 40%,但AQR依旧坚守价值,不久互联网泡沫破灭,价值风格收益大涨,AQR一战封神。2008 年,Renaissance也一度严重亏损,在巨大压力下,创始人西蒙斯选择干预量化模型,主动减仓,遗憾错失了市场反弹后的收益。

国内量化私募的发展晚于海外,大致可分为四个阶段。(图 1 国内量化私募发展回顾)

2005 年至 2009 年萌芽期:2004 年量化公募基金光大保德信成立,2006 年深圳天马资产管理的深国投·天马发行,但受制于量化工具缺乏、股票数量有限,以分散化投资为特点的量化投资难以施展其优势。

 2010 年至 2014 年探索期:2010 年 4 月沪深 300 股指期货挂牌上市,量化策略开始拥有对冲工具,由于小市值风格的异常强势以及股指期货长期升水,绝对收益量化策略开发难度不大,基于学院派 BGI 模式的量化策略表现优异,量化私募发展进入小高潮。

 2015 年至 2018 年蛰伏期:2014 年末,沪深 300 指数高歌猛进,大市值风格崛起,而大量暴露于小市值风格的量化基金损失惨重,许多成立不久的量化产品面临清盘,2017 年量化私募再度面临新的挑战:A 股市场出现了极端的一九分化,期间分散化投资优势荡然无存,量化私募产品表现不尽人意,大量产品面临缩水。在当时的不利环境下,以高频策略和机器学习为特色的金融科技模式成为破局之法,基金规模迅速扩张。

 2019 年至今的过热期:  政策方面量化私募迎来春天,2019 年 6 月,证监会发布公募基金转融通业务指引,不久交易所公告两融标的扩充到 1600只,再次丰富融券券源的种类和规模。标的证券的扩容有助于改善股票的流动性和波动率,为 T0 交易策略提供了更广阔的空间,扩大了配对交易的股票池,进一步丰富了量化交易策略;市场方面,股票分化成和成交量的连续攀升成就了丰厚的 ALPHA 收益空间。量化私募规模借此契机得以快速扩张,截止 2021 年年末,百亿量化私募超过 100 家,量化私募进入万亿时代。

二. 如何理解量化选股策略收益和风险?

表面看,量化选股策略收益主要来自基本面ALPHA,高频量价ALPHA,以及T0交易 但从交易行为来看 上述三种收益均来源 非有效市场中投资者的行为偏差(BIAS)中长线投资者的行为偏差如保守性偏差等带来了基本面 ALPHA;短线交易者的行为偏差如后悔厌恶等造就了高频 ALPHA;交易员的行为偏差以及 T+1 制度产生了 T0 收益。

根据行为金融学理论,投资者的行为偏差可分为认知上的偏差和情绪上的偏差。认知上的偏差可以通过学习和训练规避,但情绪偏差无法消除。从2008年金融危机中的经验来看,一旦出现回撤,量化传奇西蒙斯也未能克服情绪偏差选择不干预策略运行。因此,在主动投资主导的市场中, 量化选股策略超额收益可能衰减,但不会消失。

如同价值投资收益存在周期性一样,量化策略 ALPHA 收益本身也存在周期性。随着投资者结构变化、策略拥挤度提升、市场成熟度提高,量化模型存在失效风险;当市场成交量萎靡、个股走势趋同、风格快速切换时,量化策略面临较高的投资风险。

当前 A 股市场新增开户活跃,成交量破万亿成为常态,散户交易维持高位,市场属于弱有效市场,因此在投资者结构发生变化前,量化选股依然处于不容错过的时代红利期,较高的投资胜率和预期收益率是当前国内量化选股产品的核心竞争优势,从海外经验来看,量化策略 ALPHA 断崖式消失可能性不大,长期来看,量化选股策略收益大概率缓慢衰减至合理区间。

三,量化选股策略主流做法

当前主流量化私募选股流程可分为四大模块:特征挖掘、特征组合、组合优化以及交易算法。通过四大模块量化私募实现了从原始数据至真实下单的程序化交易,四大模块共同构成了量化选股私募的竞争壁垒。

3.1 特征挖掘

特征挖掘的质量与数量直接决定了策略收益的上限,而模型和算法只是逼近这个上限而已如图所示,特征挖掘模块包括特征设计、特征处理以及特征监控等流程。特征挖掘的难点在于其不仅以计算机技术为基础, 更考验量化团队的投资能力。高质量的特征反映的是团队对 A 股市场宏观或者微观层层面面上深入独到的理解。

如下图所示,特征挖掘模块大致可分以下为四个阶段。

初代特征常常与市场风格具有较高的相关性,其特征可分为估值、盈利、成长、动量、流动性和波动率等几大类。此类特征对股票预期收益率解释力度大,但投资逻辑较为朴素,特征同质性较高,常常是量化产品回撤的原因,例如 2014 年小市值风格回撤、2019 年低估值风格回撤、2021 年年末流动性风格回撤,因此量化投资者更乐于将此类特征当作风险管理的手段。

二代特征挖掘借助遗传规划、神经网络等机器学习技术实现特征的自动挖掘,在高频量价领域机器挖掘特征具有天然的优势,标准化的数据使得挖掘算法能够突破人类思维局限性,挖掘出人脑难以构建的特征,然而特征自动挖掘技术也存在四个难点:生成因子的过拟合(样本外存活率过低)问题、生成因子的高线性、相因关子问非题线性问题以及因子生命周期不确定问题。如何解决上述四个问题是区分特征自动挖掘技术优劣的关键。

前两代特征挖掘以寻找对股票收益具有线性解释力的特征为主,而当市场.主流特征组合建模从线性模型转为非线性模型时,特征挖掘不再局限于线性因,企业性质、上市时长等非线性特征也成为了有用的增量信息。,此类特征单一预测能力远弱于前两代特征,但是数量巨大,通过特征组合建模,此类特征得以聚沙成塔,也能够形成有效的收益预测。

近年来,在量化策略趋同的背景下,某些量化私募主动转型开始第四代以另类数据为核心的特征挖掘,从非标数据中寻找企业基本面变化的代理变量。

总结来说,特征挖掘整体呈现在频率上由低到高、广度上由宽到窄、深度上由浅入深的发展趋势。

3.2特征组合

特征组合技术是量化选股私募的核心技术壁垒,特征组合技术的发展与使用的特征种类息息相关,为了更好契合特征的数据特点,特征组合同样可以分为以下四个阶段。

传统量化模型以低频线性因子为主,因而初代特征组合采用线性回归或者等权的方式,作为白箱模型,线性回归操作简单,易于理解,预测效果稳健,因而线性回归目前仍是以基本面因子为主或擅长低频交易的量化私募喜爱采用的特征组合方式。

伴随高频量价数据的广泛应用,第二代特征组合方式为以表的机器学习算法。XGBoost 最早由 2014 年 3 月陈天奇博士提出,是目前最为成功的树形算法之一, 号称“数据科学比赛夺冠的必备大杀器”,横扫机器学习竞赛罕逢敌手。因为量价因子常常存在“余弦形”预测能力,所以量价模型更适合非线性组合方式,在众多机器学习算法中, XGBoost 算法同样在金融数据上大放异彩,其收益预测表现不仅超越线性回归,且显著优于传统机器学习算法。

集成学习本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。三代使用集成学习进行特征组合主要有两方面的原,CatBoost、,在数据类型多元化的背景下,集成学习可以避免单一算法的不足,将线性模型与非线性模型融为一体。集成学习技术包括统一融合、线性融合以及堆融合三种模型融合方式。统一融合使用平均法。这种方式的优点是一般泛化能力会得到加强,但是只能保证比那些模型中最差的模型要好,无法保证最终模型比原有最佳模型要好的模型;线性融合和堆融合都是二次学习技术,线性融合使用线性模型将第一步中学习到的学习器组合起来,而堆融合使用其它非线性模型进行二次学习。通过二次学习,算法得到的收益率预测结果成为新的特征重新进入特征挖掘模块,在合理使用下可有效提升模型性能。

在第三代人工智能算法的基础上,具备金融科技优势的量化私募正在逐步形成新一代自定义的特征组合方式。自定义算法优势包括:提升算法运行效率、降低模型风险、更加契合金融数据、降低策略拥挤度等。由于开发难度大、开发周期长、知识储备要求高,其他机构,难可以复制成为量化私募的核心竞争力。

3.3 组合优化

组合优化的意义在于平衡组合的收益和风险,给出风险调整后收益最大化的资产配置方案。组合优化可细分为完成股票协方差的估计、组合优化建模以及风险敞口管理三大部分。

在股票协方差估计上,BARRA 结构化风险模型为目前最为流行的做法, 其他模型包括优化风险被低估问题的 Alpha Alignment Factor Approach、简单易用的 Shrinkage Estimator 等。

在风险敞口管理上,在风格切换加速的背景下,整体私募敞口控制趋严, 增大了控制风格的数量和程度,与此同时,随着量化私募管理规模的扩大,基于因子拥挤度、因子估值等的因子敞口控制策略开始流行。

组合优化建模方面,常规组合优化建模采用马科维茨的均值-方差模型, 由特征组合给出预期收益,BARRA 等风险模型确定风险矩阵,但均值- 方差模型给出的最优权重对收益和风险的估计过于敏感,传统算法只能 简单粗暴地通过加入个股权重上限来缓解参数敏感问题。二代组合优化 为稳健组合优化,进一步增强了优化结果的稳健性。稳健组合优化通常 有两种做法,一是使用各类技术降低预测估计的标准误,包括 Shrinkage、Robust Statistics、Black-Litterman Inverse Optimisation 以及Bayesian Optimisation 等;二是在最优化目标中加入预测误差的惩罚项,实践中,二代组合优化会同时应用上述几类技术,尽可能多得将投 资中所面临的各类信息融入组合优化,例如交易成本、冲击成本、主观 观点以及流动性等因素。 二代稳健优化最大的弊端在于模型过于理想化,无论如何改进组合优化模型,最优化问题仍是现实投资问题的简化, 现实中的许多信息无法纳入量化体系,因而新一代组合优化更加务实, 将股票权重分配问题的决策转换为战略和战术两层。战略层由次优组合 优化算法生成能够提供最大化风险调整后收益的备选组合配置方案组 和参考最优组合,战术层基于非定量信息在备选方案中挑选最优配置方 案。

3.4. 算法交易

第一代算法基于历史交易模式,使用历史交易记录对现在的交易进行指导。基本目标是冲击成本最小化及贴近市场成交均价,几乎没有考虑机会成本和成交风险。代表性的算法有 VWAP 策略、TWAP 策略、VP 策略等等。第一代算法为算法交易的发展打下了深厚的基础,当下许多算法模型的基础为了更好地适应市场环境,静态方法逐步向动态方法改进, 向机会导向算法倾斜,力图寻求相比 VWAP、TWAP 更好的价格。

第二代算法以最大限度地贴近某一特定价格为目标,将机会成本和成交风险纳入到分析框架中,权衡各个不同的目标,通常更复杂、也更依赖于大型计算机的数据处理能力。这一类算法通常不怎么关心历史价格、交易量的分布,而是关注冲击成本以及用各种更精细的模型来刻画股票价格的随机运 动方式。代表性的算法有包括执行差额(IS)策略、到达价格(AP-Arrival Price)策略、隐藏(Hidden)策略。

第三代算法在第二代算法的基础上,朝着深度和广度两个方向同时发展, 开始着眼于算法对多资产之间的相互影响和平台的建立。第三代算法的特点是从单只股票到多股票组合,同时搜寻隐藏流动性(Hidden Liquidity) 获得 Alpha。此外,一些投资机构开发了具有特殊目标的算法策略,开发出了最优隐藏流动性算法和相应的搜寻隐藏流动性算法。第三代算法的代表算法有搜寻隐藏流动性(Hidden Liquidity)   算法、游击战(Guerrilla)、

侦察员(Scout)等算法。主要是帮助寻找市场中的潜在流动性并加以执行。如果说前两代算法还是在已知的市场信息中寻求机会提高执行效率的话,第三代算法则是探索未知的市场信息并寻找潜在机会。

第四代算法融合了新兴科技以及博弈论、心理学、行为经济学等领域的研究成果。这一代算法相比数学上的最优结果,更关注所有交易者间的博弈平衡。 前三代算法主要都着眼于大规模的下单交易,量较小的单由于冲击成本 很低,被认为不需要使用算法交易模型,而第四代算法的理念则是总即使 规模再小的资产,同样可以使用算法进行交易。第四代算法技术更趋向于智能交易,例如复杂事件处理(CEP)、新闻交易(News Trading)等, 根据不同的市场特点和交易需求设计交易策略。

四. 如何判断量化私募的赚钱能力?

目前主流量化私募基本采用了不做市场择时、不主动风格择时、超分散持股、机器+人工构建特征、线性+非线性算法特征组合、量化模型不断迭代以及完全程序化交易的基本框架。因此,量化私募筛选需了解更多投资细节,包括量化投资流派、团队合作模式、策略研究能力和投资执行力。

辨别量化投资理念与核心方法论:量化私募主要包括学院派、金融科技派与主动量化派。学院派私募创始人通常有学术背景,公司成立时间通常在 2015 年之前,学院派私募擅长基于公司金融、行为金融等构建基本面因子,特征组合上其模型更具科学性、稳健性,换仓频率相对较低、策略容量较高;金融科技派通常有海外量化巨头工作经验,在 IT 基础建设上投入大、擅长人工智能算法、高频数据处理与分析、舆情分析,技术优势突出等;主动量化派通常有主动投资、大势研判经验,量化模型更加工具化,主动量化派在行业内选股具有比较优势,策略更加灵活, 能够更快地贴近市场。总结来说,学院派更注重“科”,金融科技派更注重“技”,主动量化派更注重“人”。

了解团队合作模式:量化私募团队合作模式主要包括 silo PM 制和centralized book 制。silo PM 制下基金提供完善的回测平台,研究员负责特征挖掘,投资经理负责特征组合和组合优化,不断的 ALPHA 积累使得成立时间较长的私募在特征挖掘上具有极强的竞争优势。除此之外,PM制下私募基金合伙人通常具备独立开发策略的能力,除核心PM以外的团队离职率对产品影响较小;centralized book制下,策略研究采用流水线的方式完成,投研人员分为多个小团队,每一个小团共同负责策略中的一环,该模式更加注重团队内部的合作,策略更加精细化,更加重视机器学习算法和交易算法的创新与迭代,因此在特征组合和算法交易上具备比较优势。

策略研究能力评价:特征挖掘方面,我们可以从数据来源、数据体量和数据增速、、特特征征数相量关性、特征质量等多维度对量化私募进行评价,海外优秀量化基金的数据体量在 100TB 以上,并保持 10%以上的数据体量增速,TwoSigma 达到了 70PB 的体量;特征组合方面,一般私募通常采用“调包”的形式,而优秀的量化私募具备独立开发特征组合算法的能力;组合优化方面,优秀量化私募具有丰富的风险控制工具, 例如因子拥挤度模型等;算法交易方面,规模适中的优秀量化私募的冲击成本可控制在 10PB 以内。量化私募通常在特征挖掘、特征组合、组合优化以及算法交易中的某一模块具备竞争优势。在不同市场环境以及不同的投资模式下,各个模块的重要性也不尽相同。例如,当市场有效性极弱时,特征挖掘最为关键, 一个好因子通常能带来非常不错的收益风险比;在基金规模不断扩大时, 算法交易能够大幅降低不断增长的冲击成本;当策略逐渐低频化时,组合优化的价值凸显;当策略较为拥挤时,风险敞口管理更加重要。

投资执行力评价:量化私募交易频繁,我们需要了解量化私募是否实现了实验环境和生产环境的分离,具备完善的交易指令管理体系;除此之外,量化模型无法考虑到未来所有情况,因此我们需要了解量化私募历史的突发事件应对经验;最后,IT 基础建设支持重要性不言而喻。整体来看,我们应当优先选择策略一致性、与同类产品相关性低、收益来源多元化、风格约束控制严格、IT 基础建设好、策略迭代能力强的量化私募。建议尽量规避规模过大、短期收益率特别高的产品。

#量化投资# #私募基金# #量化私募# $上证指数(SH000001)$ $中证500(SH000905)$ $中证1000(SH000852)$ 



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭