15分钟,iPhone就能学会你说话
放毒
共 1654字,需浏览 4分钟
·
2023-05-23 07:17
每年五月的第三个星期四是全球无障碍宣传日 (Global Accessibility Awareness Day)
据世卫组织调查,全球每七人就有一人需要无障碍设施的帮助
苹果宣布将在今年推出更多针对无障碍者设计的软件功能,包含:语音、认知、视觉等相关辅助功能
Assistive Access 方便认知有困难人士
今年稍后时间,认知障碍用户将可通过 Assistive Access 功能更轻松、独立地使用 iPhone 和 iPad
「Assistive Access」将 iPhone 上的「相机」、「相册」、「音乐」、「通话」和「信息」应用的体验进行精简,只提供最重要的基本功能,以减轻用户的认知负担
▼开启「Assistive Access」后的相册界面
▼开启「Assistive Access」后的信息界面
▼开启「Assistive Access」后的音乐界面
▼开启「Assistive Access」后的通话界面
▼开启「Assistive Access」后的相机介面
「Assistive Access」功能提供独特界面,带有对比度较高的按钮及较大的文字,还有为相关受信任的照顾者提供自定义功能工具,让他们可以协助有需要用户自订所需功能
用户及其受信任的照顾者也可以为主屏幕及 APP 选择更简洁易用、格线整齐的排版,或者为偏好文字的用户选择以行列呈现内容的排版
▼用户可以使用「Assistive Access」自定义屏幕排版
Live Speech 机械生成语音
无法说话的用户可以在通话和对话时,使用「Live Speech」将打字转换为语音
不论是播打电话、FaceTime 使用,或是与身边的人互动时,可以把文字输入转为语音,常用短语也可以保存,一键即可播放沟通
▼「Live Speech」让用户通过打字让他们在电话和 FaceTime 通话中完成对话
Personal Voice 制作你的声音
未来有可能失去说话能力的用户,比如被诊断出患有肌萎缩侧索硬化症(ASL)简称渐冻症或其他会逐渐影响说话能力的病患
可以事先利用「Personal Voice」功能制作与其声音类似的合成语音,以便与家人和朋友联络、交流
▼「Personal Voice」让未来可能会失去声音的用户预先录下自己的原声,Apple 会利用 Machine Learning 生成与用户接近的声音供未来使用
具体操作是用户读出随机显示的文本,并用 iPhone 或 iPad 录下15分钟声音,背后使用的是苹果神经网络引擎文字转语音以及语音合成技术
不过官方表示该功能暂时只支持英语
Point and Speak 识别指向大声朗读
对于失明或视力较差的用户,「放大器」中提供「Point and Speak」功能,可识别用户指向的文字并大声朗读,协助他们与家居电器等物件互动
▼「Point and Speak」功能须配合放大镜使用,使用时只需要将相机镜头对准文字,Point and Speak 可以辨析用户指向的文字并大声朗读
要使用 Point and Speak 功能需要搭配装有激光雷达扫描仪的 iPhone 和 iPad,这项功能支持英语、法语、意大利语、德语、西班牙语、葡萄牙语、中文、粤语、韩文、日文和乌克兰语
▼看段视频大家感受一下,镜头对准了烤箱功能区
生成式人工智能在近期备受讨论,不少人担心隐私安全以及伪造问题,不过苹果强调这些功能的隐私与安全性,首先训练的文本都是操作当下随机生成,几乎难以用他人声音伪造
而且机器学习的过程都是只在设备里进行,任何第三方应用程序都无法存取资料,另外因为有距离限制,设备本身也有脸部辨识、密码锁等保护
这些新增的辅助功能都将在今年推出
据世卫组织调查,全球每七人就有一人需要无障碍设施的帮助
苹果宣布将在今年推出更多针对无障碍者设计的软件功能,包含:语音、认知、视觉等相关辅助功能
Assistive Access 方便认知有困难人士
今年稍后时间,认知障碍用户将可通过 Assistive Access 功能更轻松、独立地使用 iPhone 和 iPad
「Assistive Access」将 iPhone 上的「相机」、「相册」、「音乐」、「通话」和「信息」应用的体验进行精简,只提供最重要的基本功能,以减轻用户的认知负担
▼开启「Assistive Access」后的相册界面
▼开启「Assistive Access」后的信息界面
▼开启「Assistive Access」后的音乐界面
▼开启「Assistive Access」后的通话界面
▼开启「Assistive Access」后的相机介面
「Assistive Access」功能提供独特界面,带有对比度较高的按钮及较大的文字,还有为相关受信任的照顾者提供自定义功能工具,让他们可以协助有需要用户自订所需功能
用户及其受信任的照顾者也可以为主屏幕及 APP 选择更简洁易用、格线整齐的排版,或者为偏好文字的用户选择以行列呈现内容的排版
▼用户可以使用「Assistive Access」自定义屏幕排版
Live Speech 机械生成语音
无法说话的用户可以在通话和对话时,使用「Live Speech」将打字转换为语音
不论是播打电话、FaceTime 使用,或是与身边的人互动时,可以把文字输入转为语音,常用短语也可以保存,一键即可播放沟通
▼「Live Speech」让用户通过打字让他们在电话和 FaceTime 通话中完成对话
Personal Voice 制作你的声音
未来有可能失去说话能力的用户,比如被诊断出患有肌萎缩侧索硬化症(ASL)简称渐冻症或其他会逐渐影响说话能力的病患
可以事先利用「Personal Voice」功能制作与其声音类似的合成语音,以便与家人和朋友联络、交流
▼「Personal Voice」让未来可能会失去声音的用户预先录下自己的原声,Apple 会利用 Machine Learning 生成与用户接近的声音供未来使用
具体操作是用户读出随机显示的文本,并用 iPhone 或 iPad 录下15分钟声音,背后使用的是苹果神经网络引擎文字转语音以及语音合成技术
不过官方表示该功能暂时只支持英语
Point and Speak 识别指向大声朗读
对于失明或视力较差的用户,「放大器」中提供「Point and Speak」功能,可识别用户指向的文字并大声朗读,协助他们与家居电器等物件互动
▼「Point and Speak」功能须配合放大镜使用,使用时只需要将相机镜头对准文字,Point and Speak 可以辨析用户指向的文字并大声朗读
要使用 Point and Speak 功能需要搭配装有激光雷达扫描仪的 iPhone 和 iPad,这项功能支持英语、法语、意大利语、德语、西班牙语、葡萄牙语、中文、粤语、韩文、日文和乌克兰语
▼看段视频大家感受一下,镜头对准了烤箱功能区
生成式人工智能在近期备受讨论,不少人担心隐私安全以及伪造问题,不过苹果强调这些功能的隐私与安全性,首先训练的文本都是操作当下随机生成,几乎难以用他人声音伪造
而且机器学习的过程都是只在设备里进行,任何第三方应用程序都无法存取资料,另外因为有距离限制,设备本身也有脸部辨识、密码锁等保护
这些新增的辅助功能都将在今年推出
评论