第 622 期文章

字级:
小字级
中字级
大字级

AI+AR智能神队友 加速元宇宙世界的来临

AI(Artificial Intelligent)人工智能不是新名词,在ChatGPT诞生之前,许多人都是通过电影或新闻事件听闻AI,因此不论是2001年的电影“AI人工智能”、2004年的“机械公敌”,或者是现实世界中AlphaGo打败世界棋王成为世界冠军,AI对大部分的人来说就是一个智能型技术的统称 ,一个很厉害的神秘巨星。

 

2022年底ChatGPT被各界形容为“横空出世”,所有的网民几乎都使用了ChatGPT查询各种数据或问题,相关的AI软件也以惊人的快速演化与增长,发展速度令人瞠目结舌。AI此刻正如同唐诗中所描述的“旧时王谢堂前燕,飞入寻常百姓家”,由神秘巨星快速下凡成为工作伙伴,由Nice to have到Must to use,如今没用过、不了解AI的人仿佛就要被时代淘汰。

 

AI这个落入凡间的精灵,令人一则以喜、一则以忧。喜的是ChatGPT、Midjourney、Stable Diffusion等AI软件变成显学,要写稿的、要写报告的、要产图的,一夕之间都有快速产制的工具,再也不怕内容制作上缺法想象力或有障碍;忧的是担心AI有可能取代大家的工作。大致上来说,AI是通过机器学习(Machine Learning)、深度学习(Deep Learning)、影像辨识(Image recognition)、自然语言处理(Natural Language Processing)等技术,将大量的数据进行模拟演算与训练,最终可以推演出应用模型来进行决策与分析。

 

但单独存在的AI运用对人类的帮助有限,就算产出文字和图像可以解决一些秘书或顾问的工作,但实际上还是仅限于片断的帮助,无法完整解决问题。而上述提到的AI电影“机械公敌”,就是在描述一个AI发达的世界,机器人搭配AI,可以变成工作助手、居家照顾员,人类只要下指令就能完成指定工作,这是我们想象中更理想的AI世界。

AI+AR=神队友

 

此种混合式或进阶的AI世界,可以视AI为大脑,而眼睛就由AR(Augmented Reality)扩增实境技术来扮演。AI和AR是将现实世界与数字化、网络化整合的一组神队友,因为AI可以通过深度学习的类神经网络取代传统AR电脑视觉做法,让AR判读物理世界的信息更加准确;AR也可以通过AI收集更多数据强化辨识演算法,AI再通过镜头不断侦测信息强化演算训练;AI也让视觉场景加入添加物件检测、文本分析、场景标注等新功能,进一步强化AR体验。

 

AR结合AI可谓真正达成一种数字化且无所不在的媒体,AR软件通过镜头和传感器辨识与判读真实世界环境的相关信息,使用者从而可以用互动模式,将虚拟物件或虚拟信息与真实物理世界相结合,达成人机交互,辅助行为模式。目前已知AI结合AR神队友的产业应用情境将辅助各产业达到导览导购、强化训练、节省人力、提升业绩等目标。

 

AR结合AI的产业应用场景与商机

 

1. 未来卖场与随看随买

 

“虚实融合的零售卖场”一直都是被大众所期待的零售最后一里路,虽然电商被视为是零售商场的一大威胁,但在疫情后零售卖场因为消费者体验、社交话题、物流成本高等多重因素,反而需求提高,甚至有线上数字店走向实体的趋势,另一层面在元宇宙科技的导入下,线上与线下的整合更是大势所趋。零售场域在AI的趋势应用下,未来卖场主要为两大应用方向。

 

其一为运用AI对象标注,其方法是利用机器学习为分类模型,然后再将标签覆盖在AR环境中的物理对象,如卖场空间或者货架,消费者即可在卖场中快速寻找到自己想要的商品,并随时查找类似品类与了解即时库存。另一应用类型为利用类神经网络(CNN)演算法来估计场景中对象的位置与范围,检测到目标对象后,AR可以将物件叠加在指定目标空间中并理解两者之间的关联与展开互动。

 

例如家具产业就可以应用此技术开启AR镜头扫描周围环境,量测出垂直与水平面,并且计算深度,然后建议适合放置于特定空间的家具,当然在工厂也可以通过即时标注技术查找零件或显示操作方式,甚至于进行障碍排除等。

 

2. 未来工厂与高效训练

 

多年来制造业一直受惠于AI人工智能,大约在80年代起许多工业场域就开始借助AI机器手臂来取代一些人力组装的工作,但机器人通常和人类一起协作,执行有限任务范围,到90年代起,AI更进一步取代人力来辨识产品的良率并进行产能预测分析。随着XR延展实境技术成熟,工业领域中的培训已经成为XR运用中最受欢迎的应用场域。XR提供无风险、沉浸式、可不断重复训练的环境,以提高各种训练效能。尽管XR本身在训练时也可以生成不同类型的数据,但如何解释与判读数据来评估使用者对操作技能的掌握程度依然是一大挑战。目前将XR和AI结合则可以从XR的设备或体验者端生成数据库,再从数据库中提取和选择特征值,并由AI演算法来确定相关的技能评估结果。

 

另外,在工业类型的XR操作中,使用者需要解放双手,因此就会应用到自动语音识别(ASR, Automatic Speed Recognition),自动语音辨识是一种依靠图像处理来提取文本的演算法,特定单字触发数据库中标记为适合该字词所描述的图像,并将图像投影到AR空间。

 

在未来的培训中,XR也将会广泛被应用在各式训练上,包含医疗、消防等工作,XR和AI的组合也被用于开发“虚拟使用者”的自然反馈,如在医疗领域,虚拟病患可在虚拟环境中与受训医生或人员进行互动,虚拟使用者可以通过互动产生各种情境反应,从而提高受训者的专业度与特定技能。

3. 未来城市与贴身秘书

 

在2012年推出的Google Glasses示范了未来城市的情境,人们可通过智能眼镜的穿戴,将城市中的各种导览与体验通过视觉体现出来。后续Google进一步通过Google Lens的文字辨识功能,将AI与深度学习等文本数据进行多语言翻译,最终通过视觉追踪器将翻译的结果显示在AR用户的目标对象上。

 

随着智能眼镜的逐渐成熟,未来的智能城市运用上,有了AI将不仅仅能提供翻译服务,戴上AR眼镜,就好像携带了随身显示屏幕,最了解你的AI即时导览员随时提供语音、翻译、导览、导航等各式专属服务和互动游戏,并且用最直觉的方式将信息显示出来,就像最贴心的贴身秘书提供各种便利。

 

无论大家担不担心AI取代人类,都无法阻止这项科技的进步,因此唯有拥抱科技,才能驾驭科技。由以上的情境看来,有了AI与AR这组智能神队友,XR元宇宙将会加速来临,脑和眼等细节工作将由AI和AR来辅助,人类可以在工作中当专家,下班有贴心秘书陪你漫游,人类会有更多时间用“心”来享受世界。

 

我要留言

欢迎您留下联络资讯,我们将由专人与您联系

输入验证码
TOP
在线客服
客服时间
周一~周五 08:30~18:00
400-920-6568
800-820-0168
關閉