在过去的4年里,读者们毫无疑问都注意到了各类日常技术在质量上的巨大突破。最明显的就是,我们的智能手机上的语音识别功能比以往要出色得多。
事实上,我们正越来越多地通过语音来与我们的计算机进行交互,不管是亚马逊的Alexa、苹果的Siri、微软的Cortana还是谷歌的诸多语音响应功能。百度称,在过去的18个月里,用户在百度语音界面上的使用量增长了两倍之多。
机器翻译和其它形式的语言处理也变得有吸引力多了,谷歌、微软、Facebook和百度每个月都会发布这方面的新功能特性。谷歌翻译如今支持32对语言的句子语音翻译,以及103种语言的文本翻译,其中包括宿雾语、伊博语和祖鲁语。谷歌的Inbox邮件应用也提供三种针对诸多收到的电子邮件的现成回复。
图像识别也有不小的进展。谷歌、微软、Facebook和百度均拥有能够让你搜索或者制动整理没有识别标签的照片的技术。例如,你可以要求呈现所有有狗、雪甚至像拥有这样的抽象事物的照片。这些公司都在研发能够在很短的时间内为照片生成一句长的描述的原型产品。
试想一下,要收集狗的照片,应用必须要辨别诸如吉娃娃和德国牧羊犬的品种,在小狗颠倒过来或者有些模糊的情况下要鉴别出来,要辨别它处在照片的左侧还是右侧,还要识别各种天气状况下的小狗,如雾、大雪、晴天和阴天。与此同时,它需要排除掉与狗有点相似的狼和猫。
图像识别技术的进步远不局限于很酷的社交类应用。医疗创业公司们声称,它们不久之后将能够利用计算机阅览X光照片、MRI(核磁共振成像)和CT(电脑断层扫描)照片,阅览的速度和准确度都将超过放射科医师;它们还将能够更早和更无创性地诊断出癌症,且能够加速救生药物的研发。更好的图像识别技术对于机器人、无人机以及无人驾驶汽车的改进至关重要。福特、特斯拉、Uber、百度和谷歌均已在上路测试无人驾驶汽车的原型。
(责任编辑:tysd001)