一纸读懂另类数据

时间:2019-07-10 来源:www.bokeponline2015.com

一本道高无码字幕在线

阅读替代数据的论文

本文由维扬研究团队根据https://alternativedata.org网站编制和解释。

1.定义

替代数据不同于传统的交易所披露和公司公告。它是帮助投资者做出投资决策的有价值的信息。如个人消费信息,区域天气状况,公司销售记录等。

替代数据是典型的大数据,而大意味着它有三个特征:

卷:数据的大小和数量巨大。

速度:数据采集和传输是实时的或接近实时的。

品种:有许多不同形式的替代数据。数据已经拥有自己的数据结构或没有数据结构。

2.分类

虽然替代数据的来源和形式多种多样,但现有的替代数据可分为三类:

个人生成的数据:

社交网络信息,产品评论,搜索记录,购物偏好等。

业务流程生成的数据:

商业运输,信用卡使用记录,订购,预订数据,购买数据等。

传感器生成的数据:

卫星数据,GPS定位数据,车辆轨迹,个人运动轨迹等。

15a7510d03d34f51b0853db56ba07ca0.jpeg

图1:替代数据类型

行业市场分析

1.良好的发展环境

为了找到稳定和高收益的投资策略,近年来,基金经理对量化策略的认知程度逐年提高。随着大数据计算的不断发展,通过获取,处理和分析替代数据获得了信息。它已成为量化战略的新方向。

由于当今时代的良好环境,替代数据的兴起得出结论,有三点:

可用数据量显着增加

近年来,开放数据不断增加,人员收据数据的能力得到了显着提高。据估计,人类社会中90%的数据来自过去的2 - 3年,未来各种数据的数量将继续增长。

计算机计算能力,存储容量显着增加

随着云计算的成熟和发展,再加上计算机性能的提高,人们已经能够存储和传输大量数据。预计到2020年,将近三分之一的数据将通过云存储或传递。传递。

机器学习算法的快速发展,能够处理替代数据

机器学习是计算机科学与统计科学之间的跨学科学科。通过函数逼近,机器学习可以分析和处理大量看似无意义甚至无关的数据,这就是我们通常所说的“替代数据”。通过分析数据来得出有用的信息或结论。

fe91e5e96507499a9b4f247450e715db.jpeg

图2:市场环境

2.需求方

核心优势

由于良好的开发环境,替代数据引发了数据革命。传统数据的响应时间很慢,批处理也很困难。但是,替代数据中包含的信息不依赖于专业数据网络和管理,可以实时处理。这是传统数据的最大优势。及时性和准确性可以导致Sharpe的高投资策略,用于量化投资者或资金体验,同时也使市场更具响应性和效率。

过去,投资者需要了解数据,需要找到各种公司,找行业,专业人士进行沟通,然后得出结论。这里反映了传统投资研究的弊端。数据的实时性质无法得到保证,因为通信和通信不是每天都在发生,而且通信对象也是片面的。从抽象的角度来看,传统投资公司获得的数据信息只有一个。关于这一点的片面信息。

但是,如果使用“爬虫”方法,则数据由数据清理构成。通过太阳和月亮积累的数据信息,您可以准确地了解公司的实际运作和绩效。以这种方式获得的信息是全面,实时和客观的。这也是股票投资基础研究中最苛刻的信息。

巨大的需求

随着数据技术的不断发展,越来越多的资金开始投资于替代数据,这使得不使用替代数据的投资者更倾向于进入这一新的投资领域。从数据的角度来看,买方对替代数据的支出逐年增加,反映了替代数据市场的强劲需求。

55f562b143874e90bef3701b42a6570f.jpeg

图3:替代数据成本

本文的数据和内容源自:https://alternativedata.org

3.供应结束

供应增长

如上所述,随着大数据技术的不断发展,越来越多的人才和机构正在投入数据科学的研究。目前,与世界市场替代数据相关的技术和分析机构的价值约为1300亿美元。到2020年,这个数字将增长到2000亿美元。

在过去的十年中,由于技术支持的改善,良好的市场环境以及未来将继续以更快的速度增长,替代数据提供商(提供商)的数量已从几乎没有增长到目前的突增。不仅如此,组织用于替代数据分析的在职员工数量也在增加。

117f0fd4bac9436aaacf3ea326ddd231.jpeg

图4:备用数据提供者的数量

https://alternativedata.org

3f00156636164798b9dc5facb70d81b4.jpeg

图5:替代数据领域的员工和资金数量

https://alternativedata.org

供应商的主要类型

市场上有大量的替代数据提供商,他们提供不同类型的替代数据,我们不能根据类型对其进行分类,但根据销售的处理程度可以大致分为三类。数据:

原始数据提供者:

这种类型的供应商仅收集最原始的替代数据,并且具有最少量的数据处理。

半处理数据提供程序:

这些供应商通过对地理区域和行业部门进行分类将数据映射到特定部门。它们通常生成数据文档并提供与金融资产相关的可视数据。

信号和报告提供者:

这些供应商通常关注特定行业,收集行业特定数据,为行业研究人员提供基本信息,或向投资该行业的量化投资者提供包装量化投资信号。

这三类数据提供商面对各种客户,通过各种数据处理方法,不断向市场提供大量实时数据。

1.替代数据利用的一般模式

虽然替代数据的类型多种多样,但大多数投资者处理和利用数据的模式是相同的,过程可归纳如下:

dfdd6015e3844b05b62f6b21d8eb59e5.jpeg

图6:替代数据使用过程

第一步是确定需求数据的形式并获取数据,然后处理和整合数据结构,使数据符合分析标准,然后使用机器学习和算法进行分析,最后进入可用信号或信息。对任何类型的替代数据的分析都要经过这四个过程才能实现其价值。

2.数据媒体

随着替代数据市场的不断发展,市场也开发出了比较完整的中介系统。媒体市场中介可分为三类:

咨询:这些类型的中介向买方组织提供有关替代数据的购买,处理和法律方面的建议,并向买方组织提供有关数据提供商的信息以及有关其可提供的数据的信息。一个典型的例子是诚信研究

数据聚合器:这些类型的中介专门用于从大量数据提供者收集数据。买方用户可以在数据代理中选择他们想要的数据类型,只需要与数据收集经纪人协商,而不是与庞大的数据市场进行协商。选择您想要的数据,典型的例子是Eagle Alpha。

技术解决方案:这些类型的中介为大数据消费者提供技术建议,包括数据库的构建,定量因素的设计等。典型的公司包括小发猫,SAP等。

作为数据购买者和数据销售者之间的桥梁,数据调解允许在市场中处理不同级别的数据以服务于不同的机构和个人。

3.数据值

目前,全球约78%的基金组织使用替代数据,最常用的数据被认为是最准确的网络数据。

矿山,耕地的卫星图像可以反映一个国家在公开报告之前的生产规模变化。数千种商品的在线交易量可以即时反映通货膨胀程度,游客数量可以带来实时销售预测,所有这些数据都可用于生成全新的投资策略,从而产生更稳定的Alpha。

但是,可以获得的数据并非无穷无尽。不同的数据有不同的有效时间。个人生成的数据通常通过网络爬虫获得。常见的来源是博客,视频材料等。此类数据的有效时间通常少于5年;业务流程产生的替代数据,最可靠的是信用数据,如信用卡消费记录,公司消费记录等,此类数据可以追溯到近10 - 15年,一些政府官方数据可以追溯到回到20年;最后一类,传感器产生的数据,最常用的是手机,卫星,定位数据,其有效期约为3 - 4年。

f7a02b41d3d44ba1a155ca0d5922a503.jpeg

图7:替代数据的使用

https://alternativedata.org

替代数据对投资市场的影响将是深远的。因为越来越多的投资者采用替代数据集,市场反应会更快,这将导致消除不使用替代数据的投资者,以及逐步消除替代数据和人工智能。这种组合可以逐渐取代传统或“旧”数据来源(如季度公司收益,低频宏观经济数据等),这为基金投资和量化投资带来了优势。

对于管理人员,他们愿意雇用采用和学习替代数据集和方法的人员。最后,“旧”数据集将失去其最具预测价值,使用“大数据”的新数据集将成为标准。摩根大通在其报告中指出,机器学习技术将成为量化投资者和一些基本投资者的标准工具。系统性策略,如风险溢价,趋势跟进,卖空短缺等,将越来越多地使用机器学习工具和方法。 “大数据生态系统”包括收集,汇总和销售新数据集的公司,以及两者的研究团队,并且该系统的持续改进和开发将不可避免地激活替代数据的市场。

未央研究|未央网

要阅读原始文本,请单击:https://www.weiyangx.com/326801.html

∞未央网由清华大学五道口金融学院网络金融实验室创办

,查看更多