今天,美国专利商标局正式授予苹果公司一项专利,该专利涉及提供精炼的合成数据的方法、系统和/或技术,例如用于训练机器学习模型。苹果公司的专利描述了机器学习如何与设备上的3D运动相机结合使用,以更好地准确解释手势、姿势等。
苹果公司的专利图1是一个逻辑框图,说明了一个被配置为实现一个或多个系统、方法和/或技术的系统;图2说明了合成图像和相应的真实图像之间的数据分布差距;图9A和9B说明了一个示例的深度帧和相应的合成图像,用于一个例子的手部姿势数据集。
图源:patentlyapple
苹果公司指出,生成器(图1,#120)可以与合成器#110耦合,从而允许合成数据(例如,合成图像)被细化,例如使其更加真实。根据各种实施方案,所得到的精炼合成数据可用作其他机器学习应用的训练数据(而不是真实数据),如文本检测、文本分类、字体识别、物体检测、物体分类、手部姿势检测、手部姿势估计、手部姿势分类、场景识别、人体姿势检测、人体姿势估计和/或人体姿势分类。
更具体地说,根据一个实施方案,苹果公司的上述图9A说明了一个示例深度帧,图9B说明了手部姿势数据集的相应合成图像。例如,在一个示例性实施例中,合成器#110可以被配置为基于包括由多个三维运动捕捉相机(例如,一个正面和2个侧面视图)捕获的训练帧的手部姿势数据集生成合成手部姿势图像。例如,在一个例子中,可以使用来自正面相机的深度帧。
苹果公司的专利图10说明,根据一个实施方案,来自手势数据集的真实图像样本。
苹果公司描述了手势被解释为 "通用计算机系统",如iMac和 "其他设备",这也可能适用于他们未来的混合现实头显,众所周知,混合现实头显提供上述的多个三维运动捕捉相机系统。
至少从2016年开始,苹果就一直在研究手势识别。想了解更多关于这项技术性很强的专利细节,请查阅苹果的授权专利US 11475276 B1。
来源:patentlyapple