仓储成为 AI 机器人的孵化器!
货物种类多样复杂,仓库无法导入传统机器手臂处理
透过程式设计,工厂内常见的机器手臂能以超越人类的高精度、高速度重复执行特定任务,甚至举起人类无法负荷的重物。
但是,就算是现在最先进的机械手臂,也无法像人类一样灵活变化。一旦生产商品或流程变更,工程师就需要重新编写程式;甚至只要环境中有些微变化,例如某个零件稍微往左移动几公分,机器手臂往往就无法应变,更不用说要处理时常变换的客制化零件。
为此,系统整合业者特别设计了振动台、送料器、输送带等,以确保机器人能以同样的角度和位置获取同样的零件;然而这些周边硬体和整合费用,往往比机械手臂本身还要贵四五倍以上,不但所费不赀、也不够有弹性。
这也是为什么车厂无法完全自动化的原因之一:平均来说,一辆汽车会有一到两万多个独立零件。如果这样听起来已经够多、够复杂,想像一下一般仓库中,通常有上百万种商品、以及各式各样的包装,这样的多样化程度,为机器手臂的自动化应用增加了许多难度。对传统的机器视觉及自动化来说,这意味着必须事先登录上百万种商品、并且编写程式教导机器人对各个商品做不同的处理,不但旷日费时,而且几乎是不可能的任务。
深度强化学习让机器手臂更聪明
然而这个以往看来不可能的任务,现在却因为深度强化学习(Deep Reinforcement Learning,DRL)的出现而出现契机;因为 DRL 可以协助机器识别、应对周围环境,并自主学习处理多样的产品及工作内容。
有了足够的资料与练习,DRL 机器人就能自学新能力、逐渐进步;就像我们的学习方式一样,经过尝试、或是他人示范,机器也可以学着识别影像、打赢电玩游戏,或是像 Deep Mind 研发的 Alpha Go Zero 一样,利用 DRL 自我学习,最终战胜世界棋王。
每次的抓取和试验,都使机器人变得更聪明、更善于掌握任务内容;此外,云端连线的机器人还能相互学习交流。这样的巨大转变,使得机器人解决方案更加灵巧、弹性、而且有效率。那么究竟什么是深度强化学习?
深度强化学习简单来说,就是深度学习(DL)以及强化学习(RL)的结合:
深度学习(DL)
深度学习以人工神经网路架构为基础,是机器学习的一种,主要用于影像分类。举例说明:如果要你找出一套规则,教机器如何辨识猫,你可能会说「一只猫有四只脚、两只耳朵、毛茸茸的」。但这样和形容狗有什么差异?
深度学习不需要我们自己找出规则,只要直接给机器一堆猫的照片,就能让机器自己学会一套辨别猫的规则。
强化学习(RL)
强化学习的灵感来自于行为心理学;透过奖惩机制、边做边试、从错误中学习,从而学习到如何强化控制方式。举例来说,我们学习走路的时候,并不需要先看「走路时关节如何运动」的照片;而是直接尝试,逐渐从跌跌撞撞进步到可以顺利自行行走。
同样的,机器也可以透过这种方式来学习动作。
深度强化学习(DRL)
深度强化学习(DRL)同时结合了以上两种方法。因此机器手臂现在能透过深度学习,来自主辨识不同的物体;并藉由强化学习,对于不同物体採取不同的因应动作。
这样的技术还在发展当中,目前适用的范围包括了:
1. 简单或模拟的任务
2. 容错(fault-tolerant)任务
3. 需要处理的状况很多样,因此很难以人工编写规则的工作
4. 容易定义奖赏机制及目标的工作
5. 环境中不确定因素较低的工作
符合 5 大条件,仓库成为 AI 机器人的孵化器
一般公认,仓库货物分拣作业是最适合 AI 机器手臂早期广泛应用的使用情境。以上述适合 DRL 应用的五个条件来说:
首先,货物分拣是相对简单、而且可以容错的任务;就算机器人不小心失误,也只要将货品重新捡起来,不破坏物品就可以。相反的,如果手术机器人出现失误,就不是可以轻易解决的问题。
其次,任务内容虽然相对简单,但需要处理的商品多达上百万种、包装千奇百怪,因此无法光靠人工编写程式来完成任务。可以成功地拿取货物就是成功、反之就是失败,所以相对容易定义奖赏机制及目标。
最后,一般的自动化仓库是相对受限的环境;虽然还是有不确定性,但相对于一般家庭或大街上,不确定因素还是少了很多。
另外,仓库中需要完成的任务往往十分相似,而且订单拣货佔了大多数仓库营运成本的 40% 以上,人工成本佔仓库总预算高达 70%;因此在亚马逊(Amazon)等电子商务公司降低成本、追求快速到货的推波助澜下,零售商无一不设法追求仓库自动化,而这也让仓储自动化成为 AI 机器人的应用案例首选。
许多新创公司都选择仓库货物分拣作为第一个应用案例,希望利用仓库做为试验场,让 AI 机器人技术更进一步、也让更多传统公司瞭解这项新技术。
货物分拣是机器人研究领域的「终极目标」
仓库自动化已经存在数十年,也发展出了自动仓储系统、自动导引车(AGV,如 Amazon Robotics 现行的「Kiva」)等各种设备。
但多数人不知道的是,自动化仓库内的货物拣选与包装作业仍然是由人工执行;而这些作业的人工成本,更高达仓储经营总预算的 50% 到 70%。
除此之外,机器人的成本自 1990 年代以来持续大幅下降;同时,仓库工人短缺却导致每年平均工资上涨 6% 至 8%。综合以上原因,货物分拣一直是仓库业者想自动化、却苦无方法着力的终极目标。
所以,「拣货能力」长期以来一直是机器人研究中被誉为圣杯(holy grail)、也就是难以突破的「终极目标」。
年复一年,Amazon 和 KUKA 等公司都为新创公司和学术团队举办机器人挑战赛,希望藉此打造出有能力识别、拣货、贮放货品的机器。近年来,因为深度学习技术的出现,终于促使机器人有能力识别、挑选、并且妥善放置数百、甚至多达数千件的物品。
但这项技术仍未臻完善。对机器来说,识别数千万个物件、并处理可变形物件或透明包装物品,仍然充满挑战;然而,根据访谈 Locus Robotics 与 OSARO 等美国仓库机器人新创的结果,许多产业专家预计这项技术很快就会成熟,在接下来五年内大量获得仓库採用。
另一方面,包括亚马逊、Standard Cognition 等公司,都正在开发无人商店、发展利用 AI 的商品识别技术;或许在不久的将来,就会出现能识别仓库里大部分商品的智慧相机。
如果这种情况真的发生,不仅足以影响仓储作业,还将冲击零售、出货,以及许多其他我们从未想像过的应用场景。