互联网怪盗团特邀成员 战车(元芳)
怪盗团团长按:本文的作者元芳是我的一位前同事和好友。他目前担任某券商传媒互联网首席分析师,在培训新人方面投入了很多精力。这是他分享的第三堂课。
根据我过去多年的经历,国内投资行业对年轻人总是要求太多,恨不得入职之后立即发挥巨大作用;训练又太少,几乎谈不上成熟的培养体系。其实,中国的职场哪里不是这样呢?工作了几年,只能依靠自己领悟,没有形成工作框架的大有人在。
我相信,在投资研究中形成的方法论、分析能力,广泛地适用于各式各样的行业研究和战略研究。
证券分析师的第四堂课:如何收集、处理和分析行业数据?
数据是研究报告的血肉,是支撑报告结论的重要组成部分(支撑报告结论的重要组成依次为:逻辑推导、数据支持和事实案例)。数据收集、处理和分析的好坏直接决定着研究报告的质量。尽管数据相关内容是最基础的工作,但是你会发现不同入行年限的分析师,对于数据的收集、处理和分析差距非常大,并且随着对行业和公司的理解,在报告中对于数据的使用会越来越精简、恰当和有效。
此外,我们也分享一下我们对于“数据方法论”上的一些看法。
其一,独立思考与“抄”并不矛盾。我们其实非常建议初学者要多看、多学、多“抄”,因为对于基础薄弱的初学者,可能在数据了解程度、文字表述以及行文布局方面都缺乏实践,合理借鉴是非常有必要的。但在“抄”的基础上,如何用出“心意”和“新意”,你需要思考:
-
作者为什么此处用这个数据?
-
是否存在更合适的数据?
-
在原数据的基础上是否可以再处理,从而优化解释力?
其二,先有结论还是先有数据?先有数据,再无偏见的得出结论,这种方式广泛被认可。如果预设结论,初学者往往会去找可以佐证的数据,忽略证伪的数据,从而导致结论的偏差。但在实际上,“先有结论后找数据”是最高效的方式。举个简单的例子,我们认为B站游戏和TapTap是直接竞争对手(这一结论其实可以从与从业人员交流、双方的布局中感受到)。如此反向推到,则B站游戏和TapTap应该具备如下共同特征:
-
最受欢迎的游戏应该是二次元游戏;
-
二者平台上广告投放最多的应该是二次元游戏。
我们通过这样的两组数据就可以很好的量化证明二者竞争关系。
其三,多思考是最好的训练。报告是由每组数据得出的结论所串联,在日常训练中可以将每组数据对应的结论列在底稿中。如下图“日本外卖行业市场规模及渗透率”,我们可以得出哪些结论?
日本外卖行业市场规模及渗透率(1975-2020年,千亿日元)
我们可以得到初步结论(需要进一步验证):
-
日本常态外卖市场渗透率22%左右,由于中日在经济、人口密度等方面相似,中国外卖市场可以参考此比例;
-
经济危机下,外卖业务具有非常强的韧性,1997年亚洲金融危机时期,日本外卖渗透率增长显著陡峭;
-
外卖在疫情期间的防御属性强,2020年日本新冠疫情导致外食率下降25%,而外卖市场规模保持稳定。
通过给每组数据找到多个初步结论是非常有助于思考能力的提升和报告攥写。
接下来,我们将正式开始“数据的收集、处理和分析”工作:
数据的收集环节包括:
第一是公司定期数据:包括招股书、定期财报中的经营数据和财务数据(海外公司的定期Investor Presentation里面可能有更详细的经营数据),也包括对其进一步处理的数据,比如“单日活用户日广告贡献”、“单日活用户营销支出”等,同一行业不同公司的对比非常有意义。并且定期数据及处理后的数据的可靠性非常高。
第二是行业数据:包括国家统计局、行业权威机构、海外统计数据等(海外公司的定期Investor Presentation里面可能会披露一些行业数据),比如Questmobile的移动用户数据、AppAnnie的移动游戏流水数据、七麦数据的移动游戏排名、爆量助手的买量以及伽马数据的游戏行业流水数据等。
这里我们要特别强调一下海外统计数据,不能否认美日韩等发达国家在很多行业数据统计方面更加严谨和全面,比如日本餐饮企业外卖市场结构、韩国K12教育渗透及支出情况、美国第三方投顾管理规模及收入、转基因种子增收情况(ussecinchina.com)。
第三是行业常识:比如移动游戏渠道分成(安卓5:5,苹果3:7)、养殖行业常识(生猪出栏均重120KG、玉米猪肉转化比1:2.7左右)等等,这些常识都是了解行业的基础。
第四是草根调研信息:很多信息没有高频、权威的第三方统计,但其又是非常重要的,比如一些非上市公司的经营和财务情况(抖音各项商业化数据)、白酒的批价信息等。
数据的处理环节包括:
第一,加减乘除:
-
加即合并,比如很多视频平台将内容采购纳入投资活动现金流中,事实上其与经营活动相关,我们考虑现金缺口时候可以将其加回;
-
减即剔除,比如腾讯社交网络收入中包含移动游戏的引流分成,这部分与游戏业务更加紧密;
-
除即比率和人均,比如渗透率、付费率、电商货币化率以及单日活用户广告贡献、单用户营销支出邓。
“除”是最常用的数据处理方式,但要注意除数的选取和意义,单日活用户广告贡献比单月活用户广告贡献更具有现实意义。
第二,相关和回归:这是数据处理的进阶。相关系数高说明两组数据关系就越强。比如我们通过数据验证“头部养殖企业的单猪市值和猪肉价格强相关关系”,都在0.8甚至0.9以上,从而证明了单猪市值法的有效性,并且可以依据这种估值方式得出不同养殖企业的估值水平。我们只需要跟踪其中一个变量,就可以拟合出另一个变量的变化趋势。回归则是将相关关系量化,这种量化关系可以用来预测。
比如我们可以通过“SaaS公司PS和营收增速”的散点图发现,二者存在正相关,并且通过最小二乘法得到回归公司,如“PS = A*营收增速 + B”,而我们可以通过已知/预测某公司的营收增速,从而得到合理的PS值。
下面是数据的分析环节:
没有逻辑的数据只是空壳,没有数据的逻辑则是空中楼阁。处理过的数据要为结论服务,我们需要解释数据的差异性和合理性。数据的分析是为了支撑报告的结论,其中包括:
第一是纵向比较:以历史数据为基础,找出异常数据并分析原因,比如“2020年第一季度B站MAUs单季度增长大幅提升,系公司战略发生变化,转向以用户增长为导向,加大投入”;或找出历史数据的规律,比如“游戏行业市场规模与本国GDP高度相关,年度角度,游戏行业不存在口红效应”等。
第二是横向比较:以不同行业、公司数据对比为基础,找出数据之间差异的原因,比如“不同视频平台的单日活用户日广告贡献不同,抖音最强、快手次之、B站最弱,背后是用户时长、广告加载率、CPM不同所致”;或通过其他行业、公司经验为本行业、公司提供借鉴(包括不限于天花板、发展要素等),比如“测算TapTap的市场空间,可以通过Steam在端游领域的占比来对比”,当然也不要忽略其中的不同,比如“日本外卖花了30年达到渗透率15%以上,而中国只花了不到10年的时间”。