近日,美国专利商标局公布了苹果公司的一项专利申请,专利涉及他们的歌曲识别应用程序 "Shazam "的下一代新功能。该专利表明,该应用程序的下一代将在更多的设备上发挥作用,这包括耳机、iPhone、MR头显、iPad、智能隐形眼镜、汽车挡风玻璃上的平视显示器等。
更重要的是,该专利描述了一个全新的功能,可以通过确定用户对音频内容感兴趣的动作,如头部晃动等头部动作来触发应用程序,识别用户正在欣赏的曲子。
该方法根据第一传感器数据和第二传感器数据,确定音频的一个或多个元素与身体运动的一个或多个方面之间基于时间的关系。
例如,这可能涉及确定设备的用户正在根据物理环境中大声播放的音乐的节拍晃动他们的头。这种摇头可被识别为对音乐感兴趣的被动表示。
在另一个例子中,根据其类型(例如,对应于兴奋行为)和/或在重大事件发生后不久的运动,用户运动被识别为感兴趣的指示。例如,这可能涉及到确定正在播放一首特定的歌曲,并且根据用户的运动与歌曲的节拍相匹配,确定用户对该歌曲感兴趣。
可以根据识别对内容的兴趣主动地执行各种行动。作为例子,设备可以呈现内容的识别(例如,显示歌曲的名称、艺术家等),呈现与内容中的单词相对应的文本(例如,歌词),和/或呈现可选择的选项,用于重放内容、在离开物理环境后继续体验内容、购买内容、下载内容和/或将内容添加到播放列表。
在另一个例子中,内容的特征(例如,音乐类型、节奏范围、乐器类型、情感情绪、类别等)被识别并用于识别用户的额外内容。
在确定用户对音频内容感兴趣时,设备资源可以得到有效利用。这可能涉及到根据设备的不同触发器,在不同的电源状态中移动。音频分析可以有选择地进行,例如,根据检测到的身体运动,例如,摇头、拍脚、欢乐的跳跃、第一次抽动、面部反应或其他表明用户兴趣的运动进行选择。
图源:patentlyapple
苹果公司的专利图3说明了图1的示例性电子设备根据所公开的实施方案获得运动数据;图4是一个流程图,说明一种通过确定运动与检测到的音频内容具有基于时间的关系来识别对音频内容的兴趣的方法。
图源:patentlyapple
苹果公司的专利图2表示从混合现实头显上看,其中用户能够看到增强的内容(#265),该内容包括一个信息泡,其信息和功能是根据检测身体运动和物理环境中的音频选择的。
根据一些实施方案,上述图2中的电子设备#105生成并向一个或多个用户呈现扩展现实(XR)环境。扩展现实环境是指完全或部分模拟的环境,人们通过电子设备感知和/或与之互动。
想要了解更多专利详情,请查阅苹果公司的专利申请20220291743。
来源:patentlyapple