人工智能
打造出能够提高人类生活体验的技术,努力帮助解决大型社会挑战,这是丰田研究院的使命。
Gill Pratt拥有一种用简单的语言解释复杂问题的天赋。作为丰田汽车的首席科学家和丰田研究院(TRI)的CEO,他会坦率地同大家讨论新技术的前景和潜在隐患。最近在TRI的硅谷总部举办的开放日活动上,Pratt发表讲话时(在场包括SAE在内的科技记者和分析师),指出有关AI的公共讨论正在不断升温,而AI恰恰是TRI 200名科学家和工程师中的许多人关注的核心领域。
在谈及OpenAI于2022年底推出的富有争议的“聊天机器人”ChatGPT时,Pratt开玩笑说:“许多人担心ChatGPT会帮助大学生完成学期论文,这样的玩笑也反映出大众对这项技术及其善恶双重性质的焦虑。”他观察到,社会“在新技术面前不再那么天真,而是首先对其怀疑”。这种怀疑在很大程度上是由AI行业对自动驾驶汽车的早期炒作导致的,而TRI对此并不认同。
Pratt说:“在七八年前,我们的CES演讲首秀就与多数公司不同,我们花了很多时间解释为什么实现自动驾驶这么困难,为什么我们不知道需要多长时间才能让SAE L4级自动驾驶汽车进入实质性运行设计阶段,以及为什么没人知道如何实现L5级自动驾驶。”
TRI的态度审慎而诚实。TRI是丰田公司以10亿美元初始投资于2015年建成的研究机构。Pratt说,TRI的年度预算在丰田大约100亿美元的年度研发支出中只占“很小的一部分”。TRI的主要研究领域是机器学习、机器人、能源与材料研究和以人为本的AI技术,旨在帮助彻底解决气候变化、老龄化社会和人类理解能力等问题,进而从根本上开辟一条通往个人幸福和社会和谐的道路。参加本次活动的TRI主要部门的负责人表示,这一目标并没有听上去那么虚无缥缈。他们认为此目标植根于丰田自1926年作为自动织机制造商成立以来一直遵循的“Jidoka(自働化)”原则:“Automation with a Human Touch”。
Pratt说:“我们不应该因为擅长技术就傲慢地认为我们拥有所有答案。”
Pratt说,技术应该提高人类的工作能力,而非取而代之,这样才能“维护人类工作的尊严”。他解释说:“我们相信Jidoka原则可以在许多方面得到应用,而作为一个推动者,TRI的目标是“做风险最高、回报最高的研究”。
高风险意味着我们预计会在相当一部分时间内要面对失败。虽然我们不希望失败,但我知道如果项目的失败时长不到总研发时间的三分之一,那说明我们选择的项目太容易了,我们没有承担高风险来追求高回报。”
离任的丰田CEO丰田章男对Pratt的工作规划提出的期望非常简单,那就是“让我惊喜(Surprise me)”。新CEO佐藤浩二也对Pratt提出了同样的期望。“这就是我们的工作:在实现技术飞跃的同时承担风险。失败了也没关系,但有些时候需要取得成功。”正是通过践行这种理念,TRI将帮助丰田保持在创新和知识产权方面的前沿领导地位。
人类与AI共同参与“在环”
在汽车研发行业,能够帮助人类解决复杂的工程问题的AI正被逐渐接受并成为汽车和系统研发的组成部分。这样做的好处是减少了测试和验证的次数,能够加快上市并降低成本。此外,AI也是机器学习和车辆人机交互(HMI)及其功能设计的重要组成部分。
TRI的机器学习主管、斯坦福大学的计算机科学客座教授Adrien Galdon认为:“AI的历史就是一部炒作史,但我希望‘网络工具’未来可以真正发挥作用,特别是在有人类进行监督或是在人类和机器协同工作的情况下。”
Galdon强调了AI在其发展和应用过程中对人类的重要性。“但,我们已经看到将网络世界的AI应用到真实世界有多困难,因为数据收集是一个十分昂贵、缓慢、不全面和危险的过程,而且数据中总会出现盲点。我认为AGI(通用人工智能)也是如此,因为AGI假设了无限的计算、能源和金钱,但真实世界的数据要比网络世界复杂得多。”
除此之外,Galdon还向大家介绍了新一代机器学习模型——基础模型(Foundation model)。这个模型可以通过尽量广泛且通用的数据集进行训练。他说,这个模型就像地基一样,你可以在上面建造任何类型的房子。此外,通过语境学习和反复互动,模型会变得更加个性化。从执行单一领域特定任务的系统转向泛用性AI是AI转型的趋势之一,因为拥有更加通用学习能力的AI可以应用于多个领域并解决各种难题。
机器人应用程序和用例的多样性是“一个巨大的挑战”,机器人高级副总裁Max Bajracharya指出。(LINDSAY BROOKE)
TRI的机器人技术高级副总裁Max Bajracharya指出:“我们可以训练一个大型模型来一次性学习常识性知识,并通过自然语言编程并适应用户。”他说,机器学习既是为了归纳“我们”的集体经验,也是为了适应用户。Bajracharya说,他的50人机器人研发团队专注于应对老龄化社会挑战——到2050年,一半的日本人口将成为65岁及以上的老年人。因此,实现机器人应用和使用案例的多样化是一个“巨大的挑战”。
AI总监Charlene Wu解释道:“我们正在选择富有成效的方式来使用这项技术,使人类和人工智能能够更多地互动。”(LINDSAY BROOKE)
在Galdon所说的让人类参与“在环”的基础上,TRI的“以人为本”AI总监Charlene Wu对“技术的使用与技术本身一样重要”这一说法表示肯定。她分享了一个以人为本的人工智能案例,这也是她的团队未来产品创新的一个协作案例。
Wu解释说:“通过使用最近推出的一些生成式AI工具,我们实现了不错的人机交互效果。产品设计师可能希望将脑海中的概念可视化,因此,他们可以在AI工具中输入提示(prompt)以描述他们可能喜欢的画面。只需要输入单个提示,设计师就可以探索各种可视化方案;可以广泛地进行探索,甚至可能挖掘出一些他们从未产生的想法。”
一旦设计师发现想要进一步完善的概念或想法,他们就可以借助AI对原始概念进行完善和微调。Wu说:“AI真的很强大,因为它能提高人类的创造力和效率,而且你可以在短时间内获得某一特定想法的多种表现形式。这就是我们通过人类和AI多种交互方式来高效利用技术的具体思路。”
提升驾驶体验
TRI人类交互驾驶(HID)部门总监Avinash Balachandran在参观TRI的工程车库时解释说:“在人类交互驾驶过程中,我们希望为驾驶员打造极致的体验感,并且通过汽车提升这种体验。”在开发过程中,Balachandran使用了三个开发平台:一辆装有数据采集设备的雷克萨斯LC,用于收集驾驶员的输入和真实世界的道路数据;一辆采用了开放式管线框架结构设计,配有轮毂电机、线控系统和四轮转向功能的电动测试车;以及一辆用于测试自动驾驶漂移功能和数据采集的赛道版Supra。这三个平台均由丰田赛车部门TRD打造而成。从Balachandran所在的位置向上走几层楼就是一个由他的团队与TRD共同开发的多轴驾驶模拟器和控制室。
Balachandran这样定义他的团队的任务:“想象一下你正在进行滑雪、骑车或者任何让人感到愉悦的活动,正是从中获得的喜欢和快乐让你的滑雪或骑车技术愈发娴熟。这也是我们希望打造的AI与人类的关系,AI应当促进人类体验的改善。”
在加入TRI之前,Balachandran是Uber早期自动驾驶汽车项目的工程师,并曾是匹兹堡Uber首个(2016年)自动驾驶服务开发团队的一员。他的部门主要关注人车关系,所以首先需要了解人类行为。他解释说,团队的近期工作是确保在SAE L2级和L3级自动驾驶下的高级驾驶辅助系统(ADAS)“可靠且直观”,并且不会出现明显的技术入侵。他的团队同样坚持丰田章男的一个基本原则:永远不要忘记驾驶应该成为一种乐趣。
Balachandran指出:“我们已经知道,如果你想打造一个能够训练用户掌握驾驶技术的安全系统或汽车,使其真正地享受驾驶体验,那么驾驶中的乐趣就极其重要,这也是驾驶愉悦感的来源。”Balachandran表示,虽然丰田正在开发自动驾驶解决方案(TRI共同领导了丰田Guardian和Chauffeur系统的开发),但目前的重点仍是高级驾驶辅助。
TRI的联合创始人Pratt认为,打造出能够适应每个人的技术是其部门工作的最终成果之一。他补充说,技术专家应该始终保持谦虚。“我们不应该傲慢地认为,因为我们擅长技术、知道如何解决难题,所以我们也应有权为社会做决定或者代表社会。这种想法真的是大错特错。”
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !