2023年9月6日,由VR陀螺联合CIOE中国光博会主办、恒悦创客魔方协办的“光遇·第四届中国AR技术应用高峰论坛”在深圳会展中心顺利举办。
该活动以“光遇”为主题,聚焦AR在光学技术、工艺制作方面的突破以及应用场景和发展机遇。来自JBD、耐德佳、莫界科技、瑞声科技、谷东科技、MKS、VR陀螺的行业嘉宾为到场观众带来了精彩的分享,演讲内容干货满满。
其中,莫界科技 创始合伙人兼算法总监 杨鹏为与会来宾奉上了“联通虚拟与现实:消费级AR领域的前沿技术探索与未来展望”的主题演讲。
以下为演讲实录:
各位行业伙伴下午好,我是莫界科技的创始合伙人杨鹏,非常感谢主办方陀螺的邀请,我分享的主题是“联通虚拟与现实:消费级AR领域的前沿技术探索与未来展望”,我将从两个部分展开今天的演讲,上半部分主要聚焦于莫界的光显示相关技术。
莫界科技成立于2021年11月,相对而言是比较年轻的公司,目前主要从事两大方向的研究,一是近眼显示技术,二是感知交互技术。我们致力于生产消费者可出门佩戴的轻量化眼镜,同时支持AR的基本交互并实现联通虚拟现实的能力。
尽管公司成立仅有2年时间,但我们在AR领域的探索最早可以追溯到2018年,当时莫界就已开始布局在AR显示和AI领域的探索。从成立之初,莫界就高度重视科技创新投入和人才队伍建设,目前研发团队的硕博占比超过50%。莫界在深圳、珠海两地均有运营,在珠海拥有超过10000平米的高端研发基地。2022年,莫界取得突破性进展,在树脂波导方案上实现单片树脂波导镜片重量轻至5g,同期与OPPO联合发布的 OPPO Air Glass 2双目整机重量仅38克,这应该是目前业内最轻的AR眼镜。
为什么莫界始终非常笃定地去研发树脂波导?因为在我们的思考中, AR眼镜首先是一副眼镜。从眼镜发展路线来看,眼镜最早出现于1289年的意大利佛罗伦萨,镜片材料历经7个世纪的发展,从水晶到玻璃,再到树脂,目前市面上90%以上的眼镜均采用树脂镜片。而相对于玻璃密度,树脂仅有玻璃的1/ 3-1/ 4,这就意味着同等体积下树脂重量比玻璃要轻60%-70%。同时,树脂能够通过2米自由跌落测试和64g钢球2米高度的冲击测试。
AR眼镜是佩戴在我们眼前的物体,用户会更关心它的重量,对于重量非常敏感,当重量较大时,就会让用户的鼻梁处产生不适感。第二,用户会关心它的安全性。树脂波导能够体现出这两个方面的优势,一是重量,二是安全性,这也是莫界坚定不移选择树脂路线的原因。
尽管有诸多优势,但树脂波导在AR方面的应用也面临着众多挑战。
一是树脂材料的选型。树脂材料品类众多,涵盖ABS、PC、COC、 COP、PMMA以及PEI,如何选择合适的树脂材料并避免不同材料之间不合适的物化过程,是我们考虑的重点方向。
二是柔性材料的面型控制。树脂不同于玻璃,它属于柔性材料,成型工艺比玻璃更复杂,因此我们需要考虑如何选择合适的TTV、 BOW以及WARP,从而制定出适合树脂晶圆的标准。
三是基于柔性材料制程和工艺可靠性,确保产品有合格出厂标准。
针对上述挑战,莫界完成了四方面的技术攻关。从设计到出厂,如果将流程类比为金字塔,首先最基础的是如何在树脂这样低折射率的材料上制作出合格的波导镜片。对此,莫界自主研发了全套的光学优化设计软件。
完成波导设计之后,我们应考虑如何选用合适的晶圆材料,晶圆材料的重点是需要满足大尺寸晶圆的制备。我们目前已经掌握了8寸树脂晶圆的制备工艺。
后续主要考虑整体的制程工艺。在整个制程工艺中,例如在纳米压印、树脂切割、封装贴合等方面我们都已实现改良。
最后是可靠性,需考虑耐候特性、跌落特性以及冲击特性。目前莫界在树脂光波导上已经能够达到336小时的耐候特性测试。
总体而言,在树脂光波导设计方面,莫界具备全栈方案能力,可完成低功耗、高亮度的波导设计,并能够对衍射波导当中的彩虹效应进行仿真和分析。值得强调的是,我们的波导技术也满足隐私保护需求,具备防窥特性。针对全栈方案,我们具备一维和二维设计、以及HPG混合光栅设计能力。
在量产工艺方面,我们针对以下三个方面展开研究:一是在纳米压印的工艺上,相对于玻璃,树脂对颗粒的管控更加严格,因此莫界对纳米压印工艺进行了改良;二是在树脂切割工艺上,目前业内没有非常成熟的无尘树脂切割工艺,但莫界在经过几年探索后,实现了树脂切割工艺外观良率以及产能的提升;三是封装贴合工艺,对于不同的贴合面,如果贴合不好会直接影响到光学性能。所以我们针对贴合部做了特殊结构处理以及磨层设计,成功在弯曲模量较小的前提下实现较好的封装贴合效果。
此外,莫界在珠海研发基地建设的所有生产制造车间都是百级以及千级洁净度车间,包含母版制造线、纳米压印线、波导片封测线、光引擎生产线等。我们有整套自主的质量检测设备,目前莫界已通过ISO 9001质量管理体系认证、ISO 14001环境管理体系认证及ISO 45001职业健康安全管理体系认证,具备大规模量产出货能力。
下面向大家介绍莫界在整机方面的工作开展情况。我们一直认为AR眼镜是作为AI智能助手的存在,其主要涵盖三个方面的技术:一是传感器相关技术,二是空间计算,三是交互。
传感器是计算数据的来源,因此也会涉及到传感器相关标定技术的开发。
在空间计算方面,我们着重聚焦于实现3DoF以及6DoF,换而言之,可通过我们的传感器估算出AR眼镜整机的旋转以及旋转加位移的操作,这也是实现虚拟和现实交互的基础所在。
在交互方面,我们主要考虑与真实场景以及物体两方面的交互情况,最近也在探索与大语言模型之间、面向生活服务相关的交互。
在空间计算3DoF方面,我们做了一件非常有意思的事情。通常而言,大家出门习惯使用导航,在导航APP中输入起始点和终点,它就会显示文字导航以及二维地图的导航路径。但假设目的地离使用者很近,我们就可以通过3DoF信息结合地理位置信息,将目标地点方向准确地显示在使用者佩戴的AR眼镜上,并同步显示出距离。因此在很短的距离下即可实现自我导航,为实现该功能,我们展开了如下研究。
一是完成9 axis IMU的融合,包括加速度计、陀螺仪以及磁力计。二是实现了GIS信息对齐。3DoF信息是基于AR眼镜本体,因此在地理空间导航时,需要校准对齐地理位置的东西南北,将眼镜的坐标和地理空间的坐标进行转换。
三是波导显示的校准。它实际指的是经过AR眼镜渲染所形成的点和真实空间的方位实现对齐,这涉及到标定相关的技术。技术实现后,我们就可以在AR眼镜里显示出准确的目的地,并获取它的位置信息。
除了业内常用的3DoF技术,其中还包含空间显示技术,在头动时完成空间锚定以及空间交互,例如通过头动进行AR眼镜的操控以及健康监测。当用户头戴眼镜时,通过3DoF信息能够准确知道其低头的角度,以及头部其他的姿态。如果低头时间过长,该功能可以做健康提醒。
另外一点是更为基础且核心工作,即6DoF能力。目前我们已经完成了单目、双目以及IMU融合的在线姿态估计。考虑到轻薄型眼镜长久佩戴时会出现微小的形变,我们设计了在线校准能力,通过在线估计生成地图信息以及传感器姿态信息。6DoF在整个AR眼镜当中是非常底层基础的能力,但是在强调轻薄的眼镜上,它仍存在很大的挑战,尤其是在算力及功耗方面,需要对整个计算管道进行优化。
另一方面,我们也在探索通过自研AI引擎实现虚拟和现实之间的交互。
一是场景交互。以一个常见的场景举例,在异国面对不熟悉的语言,不知道商铺招牌所代表的业务时,可通过AR眼镜结合相机捕获到文字信息,翻译后再转换成我们熟悉的语言展示到眼前,从而了解到商铺的主要业务。该功能为旅行场景提供了便利。
二是和物体进行交互。我们通过肉眼观察的物体,多数仅能观察到外观、颜色等表面信息,但无从得知其隐藏的属性。通过物体识别以及物体6DoF追踪,我们可以将其隐藏信息显示在眼前。例如在手机锚定场景中,即使我们正在用手机操作其他信息,当有后台信息切入时,也可以在手机边缘处再进行显示,实现无界面切换就能获取来自后台的已有信息。
三是AR眼镜本体的操控交互,我们会依据常见的配饰,例如指环实现交互,裸手交互也有涵盖,但主要面向微手势交互,即不需要做太大的动作就能实现对AR眼镜的操控。
最后,我想分享莫界与大语言模型结合的相关工作。在参加光博会之前,我问了大语言模型三个问题。第一个问题是深圳光博会的主要目标是什么?它提供了非常详细的回答,包括促进市场机会以及提高行业知名度。但是当我问深圳光博会的举办地点在哪里时,面对超过能力范围的问题,它的回答是不知道。最后我又问参加深圳光博会的路线,由于AI不知道我的地点,也不知道光博会的地点,所以它给出了非常笼统的回答。如果此时结合AR眼镜,我们就可获取具体位置信息,并通过其中的网络得到行程对应的时间。
以上述第三个问题为例,去深圳光博会的路线可以通过大语言的模型进行拆解。首先是需要知道我的当前位置,通过眼镜的工具获取到实时位置,同时通过搜索工具获取光博会在宝安区的具体地址。当两个地址获知后,AI可以使用第三方地图信息服务检索从当前起始地点去深圳光博会的路线,最后把信息总结叠加返回给AR眼镜的使用者。整个流程就是我简短地问话,AI就可以通过眼镜实现我想要到达目的地的整个规划,甚至还可以提供打车或其他的衍生服务。
以上就是莫界做的所有工作。在公司成立的2年里,莫界也和行业伙伴实现了深度合作,例如上述提及的与OPPO合作发布的Air Glass 2,目前是全球最轻的眼镜,也获得了MWC的奖项。此外,莫界在今年也发布了首款消费级GPT无线AR眼镜。
未来,我们希望在光学技术以及AI技术方面展开更深度的研究,给消费者带来更多具备个性化的产品,作为优秀的AI智能助手服务于用户。此外,我们也会探索更多样化的材料,提供更轻薄的眼镜让消费者在日常生活中佩戴,也期待和行业的伙伴共同促进AR产业领域的蓬勃发展。
谢谢大家!