人工智能如何走出实验室?专访MIT在读博士李昀烛

在将门-TechBeat人工智能社区上线一周年之际,我们评选出Top30进入「2021年度TechBeat红人榜」,同时我们也潜心策划了AI工作者人物专访栏目「AI红人荟」,带大家更深入地了解他们个人成长的心路历程,感受来自青年科学家们的榜样力量。
本次为大家带来的是——MIT在读博士·李昀烛的故事。
「AI红人荟」系列回顾:
王乃岩 | 葛艺潇 | 杜少雷 | 石冠亚 | 胡庆拥 | 吴小毛
作者 | 马雨筱旭
用一副手套识别单个物体和估算重量、在机器人身上实现触觉反馈,这些之前只出现在科幻片中的场景,如今正一步步成为现实。通过多模态感知让视觉“看到”触觉,通过学习动力学模型让机器人更好地感知和环境的交互,李昀烛正在从事和开发的就是这样的研究。
从北大信息科学技术学院计算机系到麻省理工学院计算机科学与人工智能实验室(CSAIL),昀烛在不断探索和实践中找到了自己感兴趣的事业和方向。
01
『在探索中前进: 逐渐清晰的学术定位』

在高中之前,昀烛对物理学十分感兴趣。转折点发生在高中入学前的夏令营上,学校邀请了一批老师和学长做计算机竞赛方面的经验分享。被所描绘的计算机世界吸引的昀烛,开始接触这个对他而言全新的领域。
“从那个时候开始我对计算机和参加计算机竞赛都产生了非常浓厚的兴趣,计算机可以通过一段一段的程序,在很短的时间内帮助你完成一些用手需要花费很长时间才能完成的计算任务,也可以从零开始去建立一些有意思的小系统,这个过程对我而言非常有吸引力。”从高中起,他就陆续参加各种计算机竞赛,最终以优异的竞赛成绩成功保送到北大计算机系。
进入大学后,昀烛先是以课堂学习为主,夯实数学和编程基础,同时在不同的活动中尝试。“大学前两年我更多的是去探索不同的可能性,探索自己到底喜欢什么,这其实是一段非常有意思的时间,同时也是了解自己未来到底想往怎样的方向走的一个过程。”
在探索的过程中,昀烛发现了自己对科研的兴趣,于是在大二下学期开始通过北大的计算机视觉实验室接触科研。恰巧2015年前后,AI概念快速地进入大众的视野,人工智能技术也不断取得突破,甚至能够在某些比较狭窄的领域上超过人类水平。这些进展让昀烛看到了人工智能方向的可能性。在大三暑假去往斯坦福大学进行的科研实习,让昀烛体验到了世界顶尖学者的科研过程,包括从科研题目的选择到科研方向的把握。
很多时候,成功者并不是在一开始就站在了正确的起点上,而是在不断探索中逐渐找到了适合自己的道路。“包括到现在,AI从火热到冷静,这期间有很多成功的商业化案例,也有很多曾经定下但没有办法完全实现的承诺,大家也在整个过程中在不断地提出新的问题,产生新的要求。研究的过程永远没有止境,我想探索到底人工智能能做到什么程度,以及我如何能推动这个领域的发展。”
02
『曲折中求索:与问题和挫折斗智斗勇』

“做科研并不容易。”谈到自己的科研过程,昀烛坦率地说自己也遇到过很多困难。在麻省理工,昀烛有两个导师,他们在各自的方向上都是非常知名的教授,一位潜心计算机视觉,一位主攻机器人。因为领域不同,他们对研究的理解以及关注的问题并不完全一致。另外,他们解决问题思考的方向和使用的工具在很多情况下也有比较大的差异。“刚开始确定科研问题和解决方式时我遇到了很多协调上的困难。他们两位的意见我都很尊重,但很难找到合适的问题让两位导师同时感兴趣,并且在解决问题的方法上达成一致,所以来到麻省理工的第一年我并不顺利。”后来在不断的尝试和讨论,以及周围同学和前辈的帮助下,昀烛找到了合适的课题。
资深的教授给出的建议往往比较有前瞻性,但是在具体的实现细节上面需要自己去探索。而同专业或同方向的师兄往往有他们独到且一手的研究经验和方法,和他们的交流讨论的过程中,昀烛学习到了很多科研流程中具体技术细节的处理方式,慢慢地他逐渐实现了两者之间的平衡,顺利地度过了最开始的适应期。
用昀烛自己的话说,科研本身就是一个克服挫折的过程。“所谓科研,它和我们平时上课不一样。课程会有一个作业或者考试机制,因此就存在标准答案。但是科研不同,科研的价值在于创新和探索未知。科研需要做的事情往往是没有人涉足过的,研究者需要成为第一个吃螃蟹的人,把没人走过的路走通。”
这个过程必定会碰到许多新问题,甚至没有前人的经验可以借鉴,因此就要求研究者个人具备非常强的动力和执行力。科研工作者需要保持好奇心进行自我驱动,而不仅仅是在外界因素的促使下前进;科研和学习成绩也不能等同,前者需要创新精神,而后者往往存在标准答案。
在不断“升级打怪”的过程中,昀烛也对科研成果的评价标准有了新的认识。“在AI这个方向上,不少研究者致力于对准确率的提升。这在工业实践上很有价值,但同样重要的是以宏观的视野去观察整个领域,找到那些还没被人关注但很有价值的科研问题,并探索新的研究方法。”

尽管有种种问题和挫折,昀烛依旧享受和科研斗智斗勇的过程。“我很幸运,能够在不断的尝试之后找到自己感兴趣的领域。正是这种兴趣驱使我去探索,让我能够在体会科研的困难之后仍享受其中。”
03
『学术与商业眼光兼具:一位AI科研人的多面性』

科研并不完全局限于在实验室里的研究。在AI这样一个兼具学术和工业性质的领域,既需要科研工作者仰望星空以超前的眼光开拓未知,也要求科研人身处现实环境考虑技术落地和产业盈利问题。昀烛的研究过程向我们展示了一位AI技术工作者的多面性。“学术界探索的往往是目前效果并不理想、短时间内比较难迅速产生大量经济价值的技术项目,而工业界则更关心如何将技术应用到实际产品中并实现量化生产,这两者虽然不同,但都是我时常思考的问题。”
AI是一个学术界和工业界联系非常紧密的领域。技术公司需要紧跟学术界当下最前沿的算法,找到合适的商业模型和盈利点;学术界也要提供一些比较实用的算法,帮助技术和项目找到落地点。学术界和工业界知识和资源的结合才能在商业探索中成功实现产业化。
昀烛目前参与开发的触觉手套既在学术上有所突破,同时也具备较大的商业落地可能性。触觉手套可以贴合像手这样自由度比较大的物体,并采集手掌和环境之间力的反馈信息。人们带上这个手套就可以跟各种各样的物体进行互动,并且得到清晰度较高的触觉数据集,进而用人工智能的技术来分析人在抓取物体过程中的一些行为模式。
触觉手套的构建以及相关的课题基于昀烛目前主攻的两个方向:多模态感知与动力学建模。所谓多模态感知,就是人去感知周围环境的时候,并不只是通过视觉,而是同时应用触觉等多种感官。触觉对机器人完成某些任务是非常关键的要素,比如在接触物体时,作用力的交互能够很好地补充视觉所无法捕捉的信息。动力学建模的目标之一,则是为了让机器人具备一定程度的预测能力,即让机器人“想象”其下一步的行为会对环境造成什么样的影响。这可以帮助机器人进行决策;比如在捏寿司这类可形变的物体的时候,对不同行为所产生的形状的预测就能很好地帮助机器人自主地作出决定,将寿司捏成理想的形状。
在触觉手套上的科研成果,在传感器设计和制造方法上取得突破的同时,同样兼顾了产业化的需求。一幅触觉手套的成本只有10美元,使用的也都是市场上能买到的材料。“低成本就意味着有更多的扩展和商业化的可能性。”如何实现科研成果走出实验室,完成产业落地的转换,昀烛给出了他的判断。“这个领域的特殊性使得它不管是在学术方向还是工业方向都能有很多探索的空间。并且AI本身就非常具有吸引力,它本质就是赋予机器人智慧,使它能像人一样具备思考和探索的能力,完成本来只有人才能完成的一些任务。未来我希望能继续在这个方向做出进一步的探索。”
科研的迷人之处在于它没有标准答案,未知性使整个探索过程充满新奇与惊喜,但其难处也同样在于没有足够的的道路和经验可循。一步步解决小问题,最终完成大目标,在扎实的基础上向上攀登,是昀烛一直秉承的科研信念。
保持想象力,实现机器人与人共融、与场景共融,智能化的未来正在到来。
- The End -
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ