网站首页 > 科技论文> 文章内容

深度技术帖-对谷歌Atlas机器人的外行看门道

※发布时间:2016-3-21 16:27:27   ※发布作者:habao   ※出自何处: 

  这两天微信朋友圈被谷歌的Atlas机器人视频刷屏了。大家纷纷惊叹身高1.75m的Atlas搭配灵活小短腿,健步如飞,搬砖不含糊,被“”的研究员捅倒还能坚强地爬起来,无论是略带踉跄的踏雪步态,还是左手右手一个慢动作的开门方式,都已经十分接近人类,甚至足以引起“恐怖谷效应”。

  所谓外行看热闹,内行看门道。视频看个热闹也很容易,但到底这个Atlas牛逼在哪里,技术上是在什么地方有突破,相比其他的主流机器人有什么区别。于是我们学习研究了IEEE采访Boston Dynamics创始人的原文,全球主流机器人的历史与对比分析,还查阅了一些学术论文。我们作为外行(虽然曾经读书时学过一点,已经都还给老师了),也希望能帮大家看出点门道来。

  感觉谷歌最近是炒作黑科技主题的最大庄家(紧随其后的是小札和小贝)。前不久谷歌人工智能刚刚在围棋上战胜了欧洲冠军樊麾,又马上抛出了Altas机器人这个重磅。人工智能与机器人的发展再次让科技界人士和民间科技爱好者(例如本人)。

  工业机器人是“一种应用于工业自动化的,含有三个及以上的可编程轴的、自动控制的、可编程的、多功能执行机构,它可以是固定式的或移动式的”。工业机器人目前技术已经较为成熟,在很多行业大规模使用,下面这些就是常见的工业机器人。

  事实上,工业机器人主要模仿人的腰部、手臂等功能,结构相对简单,运动径也较为固定,智能化程度不高。那些只有个位数度的传统工业机器人或许只能称为智能化程度稍高的机械,离我们所预期的机器人还有很远的距离。从科技树的角度看,目前大规模投入使用的传统工业机器人进化程度大约在“帮助人”和“部分替代人”之间,进化程度还很原始。

  而服务机器人则是“一种半自主或全自主工作的机器人,它能完成有益于人类健康的服务工作,但不包括从事生产的设备”。服务机器人更接近于我们理解中狭义上的机器人,主要从事保修、修理、运输、清洗、保安、救援、监护等工作,拥有视觉、语音等复杂的传感器以实现类人的信息交互功能。与工业机器人产业规模基本完备不同,服务机器部分还处于技术研发阶段,进化程度在“部分替代人”和“完全替代人”之间。

  例如家用机器人BUDDY,省去了四肢,只有面部一块大大的屏幕,但它能识别面部表情,自己也能在屏幕上显示表情,能识别部分自然语言,会撒娇会卖萌,会讲故事,虽然在外形上和人类相去甚远,但一定让你觉得倍感亲切。而之前随笔中提到的谷歌人工智能AlphaGo,并没有具体的人类形态,但其AI在模仿并超越人类思维方面前进了一大步。

  扯远了,继续回到主题。我们已经知道机器人进化之目前大致分为智能提升和机械运动提升两种,而开发本文主角Atlas的Boston Dynamics公司,就是机器人机械运动领域中的翘楚。

  “我们长期致力于创造一种机器人,它可以拥有像人类或动物一样,或在其之上的灵活、机动、力和智能,这一从24年前公司创立之初保留至今。新版Atlas是我们朝着这一目标前进上的一步。”当Boston Dynamics公司创始人兼Marc Raibert在25日接受IEEE Spectrum采访,被问及为何要开发Atlas平衡机器人时,他如此回答。

  值得一提的是,在收购之前,Boston Dynamics 是一家替美国研发军用机器人的公司,比如,与美国国防机构研究计划局(DARPA)签订的一项价值1080万美元的合同。对此,Google表示,尽管不打算成为一家军事承包商,但仍会让Boston Dynamics继续它所签订的军方合同履行协议。

  在机器人运动领域,很少有人专注于与双足动态平衡研究,目前很多机器人设计多是采取轮式或是干脆让它在那儿不动,即使是开发Atlas的Boston Dynamics公司,也曾在长达数年时间内研究机器狗,即四足平衡。公司设计的大狗Big Dog机器人一度被认为将成为战争载重利器,然而在一场大型实地试验中,由于“太吵,会目标”遭到美军陆战队嫌弃。随后就有了圣诞节的拉雪橇小狗Spot,小狗Spot相对轻盈安静,仍保留了踢不倒的特性,但负重能力远远不及大狗机器人,美军看完后依然给出了“然并卵”的评价,于是小狗也没能上战场。

  视频中的Atlas严格来说应该称为Atlas 3.0了,此前Boston Dynamics公司还研发过另外2个版本的Atlas。第一版Atlas基于公司早期的PETMAN人形机器人(用于检测化学防护衣的人形机器人),Atlas 1.0有四个液压驱动的四肢,手长脚长(最初版本还设计了手部精细动作),由航空级铝和钛建造,身高约1.8米,重达150公斤,并配备了两个视觉系统一个激光测距仪和一个立体机,由一个机载电脑控制。

  Atlas1.0可以在实验室中,走过铺满石块的道,并一直保持身体平衡不摔倒;引入不是很大的外部撞击力,仍能保持单脚站立不摔倒。在一只脚的行进线上放置障碍物,受的步态会自动在下一步更新步态,规划下一步的落地点离开障碍物。Atlas 1.0已经可以做到在野外中行进,尽管它需要拖着长长的尾巴供电,且测试中的森林较雪地平坦、容易观测很多。

  2015年年初,为了参加六月的DARPA机器人挑战赛,Atlas完成了自己的一次进化。Atlas 2.0的百分之七十五都被重新设计了,只有小腿和脚沿用了上一版的设计,新改进的Atlas比第一版本身材更加纤细,体型也更小,有效的机载液压泵也使得Atlas机器人在移动速度上更加迅猛。它可以与上位机进行通信,也脱离了电缆的。改进的目的也是使Atlas机器人更容易完成一些挑战,例如要求它挤入专为人类设计的空间。

  然而最终比赛时,包括Atlas在内的参赛机器人却都显得很笨拙,随时摔成狗。DARPA挑战赛上,机器人在室外场地完成了一系列任务,这些任务包括了打开阀门,攀登一些阶梯和开门。不过,在所有24台机器人中,只有两台机器人成功地完成了这些任务,其他机器人在比赛中因为各种各样的原因都没能完成,仿佛想要克服这些困难是一件完全不可能完成的任务。这些来自世界顶尖研究团队的机器人再次证明,

  看完这些双足机器人摔倒的窘态,也就不难理解大家在看到Atlas 3.0时的懵逼了。虽然Boston Dynamics公司仅仅称之为 Atlas的下一代版本,但看起来这是一个巨大的产品飞跃,因为它就像一个完全不同的。总结起来,最新版Atlas牛在以下三点:

  在双足行走方面,目前国际上大多数采用的是ZMP方法(Zero Moment Point,即当机器人足与地面完全接触无欠驱动现象时,水平方向的合力矩为零的点),本田的ASIMO也采用了该方法。ZMP依据的思想就是使机器人足与地面保持静止,在此条件下,只要在支撑多边形内,机器人就是瞬时平衡的,如果每个周期都是瞬时平衡的,则机器人就能达到长期平衡。

  从视频中也可以看到,采用此法,一般要求机器人保持上身躯干在竖直状态,若躯干不能保持竖直,则机器人很有可能摔个狗啃泥,甚至还有专门的反馈控制来此条件。相比Atlas,视频中的ASIMO走姿势更加“稳健”,但是测试是在室内进行的,在更为复杂的室外,或和Atlas一样受到棍击,ASIMO是否还能这样健步如飞保持平衡,就不得而知了。

  Capturability步态。Boston Dynamics公司非常神秘,不发Paper,也极少申请专利,因此大家对于这一步态具体实现方法知之甚少,不过可以肯定的是,它和ZMP步态控制策略完全不同,Capturability指导思想是抬脚高度高,不停的快速踏步,选择新落脚点。

  雪地其实是一种极为复杂的野外,雪层厚度无法事先通过参数设定,机器人必须做到动态调整(dynamically adjust)落脚瞬间保持平衡,才能在这样的下行走。同时,Atlas被研究员用戳后还能保持平衡,这一点也很牛,当机器人突然遇到冲击时,我们称之为一次刺激,系统通常很难回应。

  Atlas 给人的反应尤其深刻,因为工作人员在推它的,这是重心所在的。而拿箱子这个看似简单的动作,也涉及到了无数的机器人质心变换,机械臂输出扭矩的动态调整,当然,还有的小短腿。因此,Atlas在复杂地形行走时,或者遇到干扰要摔倒时,Capturability步态让其能够适应很大范围的障碍物,快速回应一定范围内的外力冲击,像人类一样踉跄着走。虽然看起来姿势不优雅,但是更稳定可靠了。

  在说液压驱动之前,先谈一谈目前机器人行业更加主流的电机驱动,上文中提到的ASIMO就是电机驱动的:它的主要执行机构都是通过电机和精密的减速器构成,每一个关节的速度,扭矩都是通过电机控制器直接发号指令。

  相比液压,电机有很显著的优势非常好控制:给电机驱动器供上电,插好电机和电机背后的编码器,上位机一输信号一个最简单的电机系统就可以工作了。同时,机器人行业的电机已经出现大批成品解决方案,如最常见的Maxon电机,基本已经成为业界标配。通过采购整套电机解决方案,步态算法工程师可以省去大量维修取材的时间,把时间用于纠结算法而不是机器人本身的实现,这一做法完全可以理解,毕竟,光是维持平衡就已经如此

  然而,Boston Dynamics公司是一家很有个性的公司,Marc Raibert也是一位很有想法的,他在各处时多次安利液压:“液压是一种被严重低估的机器人执行器”“液压完爆其它一切”。他们多年来一直这一,几乎每一个版本的机器人都是基于液压的。

  首先必须承认,液压系统极为复杂。即使想要使用最简单的液压执行器,也需要构建一整套液压系统:油箱,增压泵,溢流阀,分压阀,以及各种伺服液压阀,金属液压管,还有最重要的油缸。除执行外,反馈结构也很复杂:想要,扭力的数据,需要自己配合光栅尺,线性磁编码,压力传感器改装/设计/生产各种非标液压缸。

  双足机器人上下至少需要数十个制动器(actuator,Atlas 2.0使用了28个,即度28,3.0版本度目前未知),除了少数对称关节,几乎每一个制动器都有其独特的形态:各处的扭力需求,有效空间都不相同。如何做出数十个形态各异的制动器,逐一将他们设计优化,又如何将这些制动器放置到有限空间内,每一步都需要极为精妙复杂的考量,这已经不光是技术,而是艺术了。

  液压提供相比电机高许多的能力输出密度。同样的空间内,用液压元件所做的功是电机的数倍甚至数十倍。而电机,想要保持娇小体型的前提下,只能在响应速度加扭力,和扭力加响应速度二者之间做出抉择,若想两全其美,则只能背上大而沉重的电池。

  液压结构还能使机器人更有“弹性”,起到减震作用(shock absorption)。传统电机驱动机器人在很多状态下可以被视为一个刚体,以HUBO为例,直流电机+谐波减速器驱动,由于它对扭力需求很高,即需要极高减速比,才能在输出端将电机反向推动,机器人倒下或受到冲击时承受的力无法将电机逆推(non-backdrivability),但远远大于其关节承受的程度,那么机器就会受到“内伤”。而液压缸内可以通过增加储能器来充当缓冲器,变得更有弹性。

  液压+3D打印的技术成就了Atlas优秀的强度-重量比:身高1.75m,体重82kg(上一代是1.9m,156kg),更小、更轻,但依然Powerful,无论是手臂支撑弹跳起身,搬运货物,还是开门,都能干脆利落的完成。

  把这一点放在最后讲,是因为目前关于这点仍然有很多争议。我们看到Atlas开门,过雪山,搬砖,追箱子,但我们并不知道这些行为中有多少是机器人自发完成的,又有多少是人类控制的。有人指出,Atlas在完成搬箱子的过程中,头上的激光雷达定位器旋转飞快,但是在户外行走的时候,激光雷达定位器却一点都不动,所以极有可能户外行走并不是自主行为,而是人为操控。另外在搬箱子、出门推门等过程中,我们都能看到QR码,这也算是一种“作弊”吧!同时,视频中Atlas也只展示了狗吃屎式摔倒,相对来说这是最简单的起立方式了。

  IEEE Spectrum记者显然也对自动化还是人为控制这个问题很关注,并在对Marc Raibert采访时提出这一问题,Raibert表示,对于户外的场景,人类提供了无线电设施,而机器人使用立体声和激光雷达传感器,以适应地形的变化,Atlas 也有自己的平衡和运动控制系统。室内的场景是一些纸盒,一旦人类告诉他开始做,机器人会自动追逐盒子,并且把盒子堆砌起来。

  这些问题其实并不是关键。室外运动有人引导控制无伤大雅,最关键的动态平衡和运动控制还是Atlas自己完成的。如前文所说,雪地下无法人为提前预设坡度、不平整度,不可能一步一步地操控机器人,人为控制的程度应当是有限的。而QR码就更不是问题了,这只能说明Atlas的机器视觉有待提高,然而Boston Dynamics本来就没有将机器视觉作为研究重点,他们的研究核心是动力平衡,Atlas搬箱子只是为了测试在重心变化过程中怎样自动保持平衡,这和它搬什么东西,用什么方法识别出要搬的东西无关。

  至于只能用一种姿势摔倒站立,要知道这对于机器人来说已经是创举了,前文中提到的DARPA机器人挑战赛里,那些摔倒后的机器人只能通过重启再次运行,根本无法主动起立。总的来说,目前Atlas不能完全自主运行也是极为正常的,毕竟,双足机器人的控制系统“比战斗机还要复杂”。

  第一,Atlas机器人参加的DARPA机器人挑战赛模拟场景为,人类远程操作机器人进入核电站的情景,而且还模拟出了无线电干扰。那么双足人形机器人无疑是更合适的,它能挤入专为人类设计的空间,由于机器人将要接触的那些按键和工具原本是为人类设计的,那么将机器人设计的高度和人的形状将更有可能一场灾难。类似的应用场景就很多了。

  第二,双足前进的运动方式,的确可以适应大部分有人类居住的,比如:下楼梯(这个通过滚轮和履带就很难做到了吧),攀爬梯子,打开门,操作转轮、手柄,开车等,而且从视频中看,一些地形复杂的野外Atlas也可以无障碍通过,也就是说,人类能去的地方,未来Atlas都能去。

  第三,大家是否还记得,Boston Dynamics是一家有军工色彩的企业(详见前文,他们家帮研发军用机器人的),它把Atlas设计的如此powerful也一定是有原因的(毕竟精确操作救灾这些ASIMO也可以做到),在未来的战场上,一些需要精密打击或者潜入的战斗情景,如果出现了强大的人形机器人参与作战,那无疑是一个极大Buff。(请解放军叔叔们一定要重视这点!)

  最后需要补充一点,Boston Dynamics在13年被Google收购,我们都知道,Google在AI领域可谓呼风唤雨,试想,假如大老板Google在Atlas灵活平衡的上安上AI Head,二者又能完美融合,那将是机器人模仿(并超越)人类之上的一大步啊!

  仿生机器人是一种在外观上模仿人类或其他生物的机器人。日本人对于其中的人形机器人有着近乎狂热的追逐,全世界有四成机器人在在日本,日本也是世界上拥有机器人最多的国家。日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机主要被日本、、美国所垄断,其中包括了被大众熟知的松下、三菱等企业。鉴于日本企业几十年来在硬件上的技术积累,他们能在人形机器人上取得如此成就也就不足为奇了。这一方面让人感叹日本机械和电子工业的发展高度,另一方面也让人产生疑问:日本是不是对机器人的外观太过于而忽视了内在?

  行走与平衡并非ASIMO研究的唯一重点,本田还给了它一双灵活的双手,机器人甚至可以用双手拧开杯盖,将杯中的液体倒入另外的容器当中。上文中倒水的机器人就是ASIMO,在倒水时,ASIMO并不是直接将水杯倒置,而是先小幅度倾斜,再增加倾斜角度,与此同时,另外一只手也会配合着接水。

  最新版的ASIMO除具备了行走功能与各种人类肢体动作之外,更具备了人工智能,可以预先设定动作,还能依据人类的声音、手势等指令,来从事相应动作,此外,他还具备了基本的记忆与辨识能力。可以说,ASIMO虽然在平衡性能上稍逊于Atlas,但更加全能。

  目前人工智能领域“情感陪伴型”机器人也十分火热,其中最具有代表性的就是pepper。与Atlas和ASIMO的不同之处在于,Pepper并没有在仿生的道上进行过多的探讨,但却是最像人类的一款产品(五官俱全),它采用轮胎的转动达到移动效果,放弃了类足设计。Pepper 主打的功能是其具有人类情感,被称为“全球首台具有人类情感的机器人”,它不能协助人类处理一般性事务,如做家务,但讲笑话、教学甚至是协助家人朋友间的沟通则是它的拿手好戏。

  Pepper能够通过表情、语音等元素判读使用者的情绪,用自己的表情、动作和语音与人类交流,极大地满足了消费者的社交体验。例如,当主人一脸疲倦地回到家,Pepper就会播放一首主人最喜欢的歌曲,让他放松心情。

  Pepper于2015年6月20日开始在日本首发上市,标价为198000日元(约合人民币10650元),但是鸿海富士康代工的产量很有限,首发只有1000台,上市1分钟内就被抢光。日本还真是寂寞啊。

  看完了小而萌家用机器人,再来看大而剽悍战斗机器人。日本的Kuratas机器人由水道桥重工制造,装配着一个未来派武器系统,其中包括能够一分钟击6000发BB弹的加特林机枪,而启动机枪仅需要操控者一个微笑。 Kuratas机器人可通过单人驾驶舱内操控者进行控制,也可以由机器人外部使用连接3G网络的一部智能手机操控。看这外形,是不是有点像高达呢?

  同时,日本人也于发明“机器人”,据不完全盘点,较著名的有东芝“Ms.Aiko Chihira”通信机器人,日本产业技术综合研究所的HRP-4C,石黑浩教授制作Genminoid F等。这些机器人一般只能做到介绍、眨眼、微笑、做手势和最基础的语言交流。

  美国企业对于仿生机器人的关心程度不如日本那样强烈。在机械方面,目前最著名的还是上文提到的Boston Dynamics。美国更注重机器人的内在算法,包括国际象棋的深蓝和围棋的AlphaGo。在语音识别技术上,美国三家科技公司苹果、谷歌、微软都在加紧布局,Siri、Google Now、Cortana三款智能语音助手已经成为各家操作系统的一大卖点。在图像识别领域,谷歌、微软、Facebook等也开始发力。以图搜图、识别图像内物品、人像识别都是图像识别的重要应用。总之,与日本企业不同,自计算机技术以来,美国一直在软件领域处于领先地位。但相比日本而言,美国研发的成品机器人则较为逊色。

  Jibo是一款家用智能机器人,由MIT研究人员推出,它高28cm,外形非常可爱,但是不能移动,头部可以转动,支持WiFi和蓝牙连接。Jibo的神奇之处在于它能够通过面部识别技术识别家庭中的不同,针对不同的家庭,推送不同的信息,提醒每个人即将到来的事件安排。并且Jibo的面部有一个内置的高清LCD触屏,搭配有两个摄像头,以及360度的微型和语言识别程序,使得你在房间里的任意角落都可以与它交谈,通过脸部追踪,Jibo能始终让视频对话中的人脸保持在画面里,两个高分辨率的相机可识别人的面部,动态捕捉脸部表情。

  目前最新版的Jibo已经开始预订,新版的预订价格才749美元(约合人民币4647元),还配件有电池和充电底座。这还没有一部iphone贵啊。非常适合抢不到pepper的寂寞人士使用。值得一提的是,A股上市公司东方网力和GQY视讯都持有Jibo公司股份。东方网力7月投资200万美元,又在12月增资290万美元,共占JIBO公司完全稀释基础上4.10%的股权。GQY视讯11月投资140万美元,

  Valkyrie开发于美国约翰逊航天中心,身高1.89米、重124.7公斤。 Valkyrie的胸前亮着一个类似钢铁侠的灯,而腰部和关节也有着不错的度。至于它的动力来源,则是存储于背包之中,据悉动力大约能支撑1个小时。Valkyrie配备了声纳和激光雷达,头部、手部、腹部和腿部也都有传感器。 此外,腿部的摄像头也能够帮助机器人从多个角度进行观察。Valkyrie能够不受地四处,拿起并操作物体。美国航空航天局认为,Valkyrie将把探索太空作为它的之一,比如执行探索火星等任务。

  美国的Megabot II是美国机器人公司Megabots研发的一台战斗机器人,靠履带移动,配备了两把巨大的模块化空气大炮作为武器,可以以120英里/小时的速度发射出3磅重的喷漆炮弹。需要一名驾驶员和一名炮手共同驾驶。

  不久前,日本水稻田重工确认了与美国Megabot II机器人的大决战,日本方面表示要使用最新研发的Kuratas机器人来应对这场战斗。双方将在2016年开战,顺利的话,我们在不久的将来就会知道谁更厉害了。这场大战也象征着美国日本两大机器人领域最强国家之名的斗争吧!

  今年央视猴年春晚,540个Alpha 1S机器人与孙楠共同表演《冲向巅峰》,让广大观众耳目一新,Alpha 1S机器人的风头可谓一时无两。ALPHA1S人形机器人是优必选公司推出的一款高端产品,利用手机上的APP控制,预设的程序可以让ALPHA1S执行前进、后退等基本动作,同时随机附带如《小苹果》、《SORRYSORRY》等热门音乐,ALPHA1S随着节奏扭动着身体,作出各种高难度动作。通过数据线,ALPHA1S可以和电脑相连接,经过专门的软件,用户可以自行编辑程序,就可以设计自己想要的动作。

  ALPHA1S身高为418mm,宽度198mm,厚109mm,体重1.5kg,骨骼主要由铝合金组成,外壳采用ABS工程塑料,上下提供16个可以活动的“关节”。据资料显示,ALPHA1S的伺服舵机采用自主改进的PID算法,扭矩大,体积小,控制精度高,运算快,而价格相比日韩不到其三分之一。

  最近,美国《机器人商业评布了第五届2016年度RBR50名单(全球最具影响力50家机器人公司),有三家中国公司跻身其中,分别是第12名:大疆创新科技有限公司,第18名:富士康科技集团,第38名:新松机器人自动化有限公司。然而大疆主要生产无人机,富士康和新松主要生产工业机器人。至于人形机器人,仍然主要处于高校研究的阶段,很少有人形的民用级产品问世,与日本和美国还有不小的差距。

  在工业机器人领域,自2015年以来,全国各省在中央鼓励下相继出台“机器换人”政策:东莞市1号文《关于进一步扶持实体经济发展的若干意见》,安排1200万元补贴企业的数控设备升级,并设立东莞市“机器换人”专项资金,从2014年起每年出资2亿元,连续3年共6亿元支持企业实施“机器换人”,最高补贴比例可达设备总额的15%。

  随着浙江、江苏等地的跟进,部分地区的补助标准一般都在10%以上。虽然我国目前工业机器人核心产品需要从日本、等国家进口,导致整体成本较高,但在政策鼓励下,也有一部分企业开始自主研发国产工业机器人(如前文中的新松机器人公司,即A股公司机器人),相信未来,随着技术的不断进步,国产工业机器人可以逐渐取代进口产品。

  在服务机器人领域,投资也在逐渐升温。除了之前提到东方网力和GQY视讯投资Jibo外,阿里巴巴联合富士康向日本软银旗下的机器人控股子公司(SBRH,生产pepper那家)分别战略注资145亿日元(约合7.32亿元人民币)。

  生产春晚机器人ALPHA 1S的国内公司优必选,其下一产品Alpha2在美国的indiegogo上线后,45天众筹金额达一百三十多万美元,并在上线后短短一周内受到了Robotics Trends、IEEE Spectrum、Tech Times等21家外媒的报道。服务机器人领域方兴未艾。

推荐: