有一种流传很广的看法:互联网公司做的是“流量生意”,没有什么技术含量;互联网公司的研发,其实就是产品迭代而已,算不上真正的基础研发;如果互联网公司有技术含量,那也只可能存在于云计算这样的To B业务当中,而不可能存在于消费业务当中。
在这些人心目中,“消费互联网公司”与“硬科技公司”是天然对立的——如果你运营一个庞大的互联网平台,拥有数以亿计的个人用户,那你就不可能通过基础研发取得任何“硬科技”成果。
我必须严肃指出,上述观点是片面的。面向消费者的互联网平台业务,当然是需要技术含量的,而且技术含量不能低,否则会迅速在激烈竞争中被用户抛弃。(参考阅读:一个严肃的问题:究竟什么是“硬科技”公司?)毕竟一个几亿人使用的应用,可能出现的问题之多,非从业者难以想象,需要依靠“硬科技”去提升用户体验、保证用户安全及合规等。可以说,复杂、多变的To C业务,是培育“硬科技”的试炼场。
另一方面,在粗放式增长阶段结束之后,互联网公司都意识到了技术的重要性和可拓展性,投入大量资源做自研技术,已经是领先互联网企业的新常态。
举一个例子:根据谷歌2021年财报,谷歌搜索引擎每天要处理数万亿个搜索请求,其中15%是全新的、前所未见的。谷歌需要在几十到几百毫秒之内,从浩如烟海的互联网公开信息(包括文本、图片、视频等多种不同格式)当中,找到用户想要的信息。因此,谷歌一直在大力发展人工智能和机器学习技术,从而不断提升其核心搜索功能的效率。其中一个最重要的成果,就是2021年5月发布的“多任务统一模型”(Multitask Unified Model)——能够让用户以自然语言提出开放式问题,以对话的方式获得类似人工专家的解答。可以想象,这个模型很快成为了国际人工智能研究领域的热门话题,很可能也会成为人工智能历史上最重要的应用之一。
事实上,在消费互联网领域,搜索引擎已经算是一个比较“简单”的业务了。更复杂、更敏感、对研发要求更高的业务还有很多,例如第三方支付。当你走进一家便利店,打开支付宝扫码,整个支付过程大概还花不了一秒钟。可是就在这一瞬间,支付宝的APP端和云端进行了涉及海量数据的计算和判定:
- 用户有没有被盗号?移动设备有没有失窃?换句话说,这个支付请求真的是出自用户本人吗?
- 收款的商户是合法的吗?它是否具备基本的资质,有没有钓鱼诈骗的嫌疑?
- 这会不会是刷单,或者其他类型的虚假交易?
这一切都发生在你扫码和听到“支付完成!”之间,在这短短的间隙,支付宝使用了全图风控、交互式主动风控、多方安全计算、端边云协同……等一批人工智能、隐私计算等“硬科技”,从而在你甚至感知不到的消费体验下,确保你的财产安全。要知道,国内互联网黑产的从业人员很可能超过了200万人(数据来源:《2019年中国数字反欺诈全景报告》),而支付宝的风控资损率仅为亿分之0.98。
公允地说,国内主流第三方支付平台的风控普遍做的都还不错。除了支付宝,微信支付、京东支付、美团支付的风控资损率都很低。它们能做到这一点,当然不是靠堆砌人力,更不是出于黑产集团手下留情;而是靠在消费场景对前沿技术的应用,以及多年来持续更新技术。
另一些因素也在倒逼互联网公司加快技术创新。近几年数据安全和隐私日益受到重视,无论是合规还是社会层面都对互联网公司的服务提出了更高要求——既保护用户隐私,又要保证安全和流畅。这基本相当于“既要马儿跑,又要马儿不吃草”,可是互联网公司居然真的能做到,这应当归功于对机器学习技术的深度应用。
还是拿谷歌做例子。今年早些时候,谷歌推出了“隐私沙盒”(Privacy Sandbox)技术框架,意在实现不跟踪用户设备ID、不使用第三方Cookies的情况下,仍能精准地推送广告。“隐私沙盒”的基础是一种名为“群组联邦学习”(Federal Learning of Cohorts)的算法,也就是聚焦于具备相似行为的一组用户,而不需要去获取每个用户的私人信息。
蚂蚁集团也推出了国内首个“可信隐私沙盒”(AntDTX),目前已经在vivo、荣耀等厂商的手机等设备中得到应用。“可信隐私沙盒”基于端边云协同风控技术,可以在减少手机端内数据向云端流动的情况下,升级手机的风险感知能力,提升支付安全性。
这些技术都是基于消费端的真实需求而开发出来的,其适用范围又远远超过了广告、支付等消费业务本身。当代科学技术的发展,早已超越了少数天才坐在实验室里所能达到的水平,进入了“产学研”高度一体化的时代。很多人的认知还没有更新,以为只有航空航天领域里的高精尖技术可以“降维”用在消费领域,没想过反过来的情况也存在。美国的“机器学习四强”——亚马逊、谷歌、微软、Meta,都是从海量用户的平台场景当中锻炼出了强大的机器学习技术,然后将其用于医疗、现代制造、航空航天等尖端场景,乃至以“机器学习即服务”(Machine Learning as a Servicce)的方式输出给海量的企业用户,潜移默化地实现对传统行业的赋能。
在国内何尝不是如此?阿里、腾讯、蚂蚁、字节跳动、百度、美团……均在人工智能、机器学习、计算机图形技术、VR/AR等领域进行着持续的研发。阿里早在2019年就将首款自研人工智能芯片运用于阿里云的数据中心。腾讯于2018年成立了量子实验室,迄今已经发表了十余篇关于量子预算的学术论文。百度是全球最先进的智能驾驶解决方案供应商之一,而且具备平台、整车、服务三位一体的开发能力。相信凡是熟悉中国互联网行业的人,都对此有所耳闻。
或许有人会认为,上述技术还是太偏“应用层”了,不够“基础”。那我们看看蚂蚁集团投入大量资源在研发的“图计算”(Graph Processing)技术。图计算基于数学中的“图论”(Graph Theory),将各种类型的复杂数据融合到一个“图”里进行分析,从而更好地描述和理解事物之间的联系。例如用图计算对海量的金融交易行为进行分析,可以大幅增进对可疑交易、可疑团伙的辨识度,从根本上提升风控效率——也就是蚂蚁的“全图风控”。这就是蚂蚁多年一直不懈提升图计算技术水平的直接原因。
但是,图计算的技术能力一旦培养出来,应用范围将大大超过金融支付风控的范围。Gartner预测,到了2025年,图计算将应用于80%的数据和分析创新工作。从电网等复杂基础设施的故障诊断,到重大公共卫生事件的防范,都可以深入应用图计算技术。按照中国工程院院士郑纬民的说法:“现在布局高性能图计算恰逢其时,就相当于抓住了未来大数据、人工智能和高性能计算产业发展的牛鼻子。”
腾讯的微信事业部也研发了Plato开源图计算平台,并且成为了GitHub的高星开源项目。一些让我们日常买个菜更便利的技术,最终能够应用于广阔的星辰大海,这大概是绝大部分用户难以想象的。
即便与发达国家的互联网巨头相比,国内互联网公司的技术实力往往也不落下风。就拿前面提到过第三方支付而言,支付宝、微信等国内主流支付平台,在用户数量巨大、黑产层出不穷的情况下,仍能实现全球领先的风控资损率,而作为全球最大跨境支付巨头的PayPal,直到2021年才在激增的钓鱼诈骗压力之下,推出了“增强欺诈防护系统”,达到了支付宝和微信早已提供的防护水平。这个案例充分说明,所谓“国内互联网公司研发水平远逊于国内同行”,仅仅是以偏概全罢了。
根据官方数据,“2021年中国的全社会科研投入约为2.79万亿元,比上年增长17.9%”,而领先的消费互联网公司的增幅更大,比如美团2021年科研投入上涨53.1%,达到167亿元;蚂蚁连续三年平均增长39%,去年投入了188亿。比起商汤、蔚来等更接近大众认知中的“硬科技公司”,这些消费互联网公司在科研上的投入完全不落下风,体量上反而领先不少。这么多钱在做什么?拿蚂蚁来说,除了前面提到的“图计算”,还有隐私计算、云原生技术、分布式数据库等等等等。其中有许多研发项目,并不单纯是为了眼前的业务发展;还有很多技术,经历了消费端的历练之后,必将成为下一代尖端技术的基础或催化剂。
其他领先的互联网公司也是如此,从人工智能到区块链,从芯片设计到无人机,在外界能想象的一切“硬科技”门类,我们都能看到不同规模、不同类型的互联网公司,在进行着规模巨大、旷日持久的投入。
谁说互联网公司没有硬科技?我恰恰看到,中国硬科技研发之光,很可能在于那些消费互联网公司。