小言_互联网的博客

AI是如何弥补技术鸿沟的?

405人阅读  评论(0)

全文共2771字,预计学习时长5分钟

根据美国劳工统计局的一项家庭调查,美国经济的快速增长使不同的人群受益。

残疾人也会受益,2019年4月,残疾人失业率降至6.3%,创2008年以来的新低。但残疾人的失业率仍然几乎是其他人群的两倍。

值得庆幸的是,时代已经变了,对残疾的看法也是发生了改变。全球企业正在慢慢改变其工作方式,以适应当前关于残疾和发展的全球趋势。因此,残疾人融入社会已经成为焦点,而互联网就是中心。

AI在图像中的应用

随着对可访问性的期望越来越高,对在线空间的支配率越来越高。然而,严峻的残疾数字鸿沟自2015年以来引发了有关网络访问的众多ADA诉讼。

人工智能技术或许在以下方面有用:

• 克服一般的沟通、运输和可访问性问题

• 使残疾人能够独立生活

• 减少阻碍残疾人参与网上购物等数字活动的技术障碍

随着越来越多的AI技术被运用到产品中,企业意识到增加更多具有不同能力的个人的自主权很重要,不仅仅是从市场的角度来考虑,还要符合法律要求。

难怪微软在人工智能无人机项目上投入了2,500万美元,旨在帮助残疾人的日常生活、工作和交流。

图像识别

谷歌于2019年推出了Lookout应用,通过将图像处理和机器学习相结合,帮助盲人了解他们的环境。这是朝着正确方向迈出的一步,也是引导其他企业从道德和商业角度做正确的事情。

毕竟,每天在互联网上共享32亿张图像。没有AI的帮助,残疾人将无法知道这些图片的内容。

Facebook是第一个通过推出革命性的自动替代文字功能来解决这个问题的社交媒体巨头,能够向视障人士和盲人描述图像。使用神经网络和机器学习,Facebook可以识别图像中的不同组成部分,并以惊人的准确度描述每个组成部分。

再过五到七年,图像识别软件将让alt文本过时。目前,已经在各个领域运用了图像识别,并取得了显著成功。大型数据库和可视化站点将图像识别用于自动化图像组织,而营销人员依靠该技术创建交互式品牌活动。

用于网站可访问性的AI技术

在残疾人的强烈要求下,AI构建模块现在正在不断完善,以创建复杂、创造性的服务,这些服务可以改善残疾人的生活并为他们完成任务。了解这些构建模块如何克服残疾挑战,有助于提高在线体验的可访问性:

accessiBe是一款基于AI的开创性的网络辅助功能工具,它使得网站所有者和公司可以让残障用户更轻易地访问其内容。

它可以为网站的所有图像自动和批量创建准确的alt文本描述,使其可供视障人士使用。

最重要的是,accessiBe的后台应用程序确保该站点的基础架构符合整个WCAG 2.1,这是Web可访问性法规的标准:

• 启用单击选项可为癫痫患者禁用动画、闪烁等功能

• 针对有运动障碍的人优化网站,进行键盘导航

• 提供内置字典,为有认知障碍的人解释表情、俚语和短语

• 对颜色、字体和排版进行细粒度调整,以使视障人士可以访问内容

基于面部识别的CAPTCHA录入

面部识别对于残疾人来说是一种福音。但它会涉及隐私或安全问题。通过分析数据——通常是从不同角度拍摄的大量人脸照片——人工智能可以辨认出摄像机前的是谁。

这在克服各种环境下与在线认证相关的挑战方面是有用的。

苹果公司在2017年使用面部识别技术解锁iPhone,而微软拥有其专有的Hello软件。这两种技术都允许用户仅通过面部登录,无需密码。

尽管存在安全漏洞和限制,尤其是随着残疾人更多地使用互联网,面部识别仍然会替代传统的CAPTCHA测试。一旦系统通过摄像机镜头识别出与之交互的人,它就可以创造人人具有均等机会的局面,同时有效地清除机器人。

唇读

研究人员在2018年提出了深度视频肖像的想法,它使用AI编辑演员的面部表情,以便精确匹配配音,从而节省时间并降低电影业的成本。软件可以用于纠正视频会议中的头部姿势和凝视,并提供新的视觉和后期制作效果。

像这样的AI技术很快就会使“困难的”字幕成为过去,让听障人士可以在线欣赏视频内容。将该计划整合到手机中,将使听力受损的个人能够听得懂其他人的言论。

Google DeepMind研究了BBC视频中超过100,000个不同的自然语句,涵盖了各种口音、头部位置,灯光、语速和语言。他们针对Google DeepMind的神经网络运行这些视频,结果令人惊讶。

虽然最好的唇读专业人士仅解释了12.4%的内容,但人工智能的准确率达到了46.8%,多么令人震惊的结果。

考虑一下这种技术对听障人士生活的影响。他们不仅可以使用在线视频,而且自动字幕的质量和相关性也会提高。

自动文本摘要

想想看——每天有250万字节的数据被生成,这可能会增加。这使得自动总结内容成为一项严峻的挑战。对于识字能力不强的人来说,情况要困难得多。

长篇新闻文章、对话和文档的摘要可以更快,更有效地进行。现在,在AI的帮助下,这是可能的。自动文本摘要可以包含各种各样的实际应用程序,包括媒体监控、营销、研究和分析。

例如,Salesforce在2017年开发了一种摘要算法。使用机器学习生成较短的文本摘要,此功能可以帮助患有记忆问题、注意力缺陷障碍和学习障碍的人,如阅读障碍。

该公司现在已经把提取模型变为抽象模型,引入了新的相关同义词和单词,并总结了文本。

实时翻译

全世界的文化和语言数量很多,都会在网上出现各种各样的交流问题。这就是为什么广泛的研究进入了建立系统,使人们能够无任何语言障碍地进行交流。

想想谷歌翻译。当然,早期的翻译会有不一致和错误的情况。但是,Google推出神经机器翻译系统时,所有这些都在2016年11月发生了变化,将错误率降低了85%。

GNMT还推广了全球运营的翻译理念,即以每句话、每个理念为基础进行翻译。

随着人工智能获得更多的特定语言,它可以学到更多并生成准确的翻译。

所有这些都在2017年发布Google Pixel Buds时达到了顶峰。耳塞与公司的像素手机配合使用,可以自动翻译用户听到的内容。该技术实时工作,支持近40种不同的语言。这对于减少残疾人的沟通障碍大有帮助。

AI技术的使用为残疾人提供了新的机会。它不仅使互联网成为一个更容易接触到的空间,而且还可以提供更多的工作场所支持。如果他们希望避免诉讼,那么企业必须了解AI的发展,使残疾员工可以使用工作场所。

AI的进步将帮助企业履行法律义务,并支持多元化的用户群。但是,随着时间的推移,必须培养易用性,也要对AI充分信任。到那时,互联网需要尽一切努力为所有用户建立一个包容的、可访问的环境,无论是残疾人还是健康人士。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)


转载:https://blog.csdn.net/duxinshuxiaobian/article/details/101155090
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场