开始具备认知能力甚至创造力的IBM[微博]第三代超级计算机,正在尝试成为厨师、医生、客服代表……
文|CBN记者 吴杨盈荟
制图|彭奥
瘦牛肉加巧克力,煮出来会是什么味道?相信很少有厨师敢于尝试这样的料理搭配。不过,一道新创造的菜肴“奥地利巧克力卷饼”里,就使用了瘦牛肉和2盎司黑巧克力,而品尝过的人表示,味道竟然还不错。
创造这道新菜的大胆厨师不是人类,而是一台机器—IBM超级计算机“沃森”(Watson)。准确地说,是“沃森大厨”躲在鲜红的餐车中,由4位人类厨师根据它的菜谱搭配,烹饪出的这道创新美食。
“我之前从来没有想过这种搭配。但我最后还是按照电脑说的去做了,结果非常让我惊喜。”纽约烹饪教育学院(ICE)的首席厨师Michael Laiskonis说。
“沃森大厨”可以根据人类厨师众多自主定义的选项来提供创新的菜谱。在其诞生于去年9月的专用App上,你可以选择喜爱的食材,以及一定不能出现的食物。然后,你可以菜单的风格,比如中华美食,或者地中海风味。你甚至还可以选择健康风格和创意程度。如果你是一个注重健康的人,“沃森大厨”会在你的菜单里省去黄油。而如果你选择“极度创新”一项,“沃森大厨”为你搭配出的菜单你从未听说过。
烹饪往往被视为一门艺术。人类凭借直觉、大量的经验,或许还有很多天赋的因素,才能烹制出一道道色香味俱全的菜式。在法国,一个甜点厨师的完整培训需要3至5年时间。中国高级餐厅中的主厨,经验必须超过10年。即使如此,最成功的厨师也只能成功驾驭有限的配料组合。
但“沃森大厨”不仅可以将“经验积累”的时间缩短到几秒钟,通过大数据分析和机器学习,它还能够顾及几乎所有食材的营养成分和味觉体验,在几秒钟就创造出可靠的菜单。
IBM认为,相比“艺术”,烹饪更是一门科学:美食背后有大量的化学、神经科学、营养学等理论和数据,食材配料也存在无数种组合。所以它认为,其第三代超级计算机“沃森”也非常适合应用于这一领域。
IBM和纽约烹饪教育学院(ICE)等美国专业烹饪机构合作,将全球3.5万份经典菜单输入“沃森”的系统中。这些就是“沃森”学习烹饪的教材。它能够根据这些菜单数据,分解出单一食材,分析每种食物的化学成分。同时它可以理解人类的味觉模式,判断出每种化学成分会刺激人类形成怎样的味觉感受。这些数据分析结果生成后,“沃森”会将其放入“食谱数据库”中。
此外,“沃森”还拥有一套新型算法(Novel Algorithm),能够深入分析食物的结构,包括表层、重原子数、旋转链数、氢键受体数等等。这方面的分析结果会生成“营养数据库”。综合两套数据库,“沃森”就能够在相当短的时间里创造出全新的菜单搭配。
2006年诞生的“沃森”以IBM创始人托马斯·J·沃森的名字命名。但它第一次引起人们注意是在2011年。当时,它参加了美国真人秀《边缘》。这是一档延续了47年的热门智力竞赛节目。节目的问题五花八门,涉及历史、地理等各个学科。和沃森竞争的是两名最优秀的人类选手。一位曾创下连续赢得74场比赛的纪录,另一位在比赛拿到325万美元金。但最终“沃森”战胜了他们,赢得了比赛。
“沃森”的获胜当时让许多人惊讶。机器赢得智力竞赛最大的困难在于,它首先必须要听得懂人类的自然语言。比如它需要明白,“总统”是一个职位,同时也可以是一个人。它也必须懂得,“纬度最高”是什么意思。“沃森要把全世界的知识读出来,变成自己的知识。这是第一次有个机器像人一样理解问题、阅读文献、回答问题、不断学习。”IBM中国研究院信息分析部研究总监苏中对《第一财经周刊》说。
而机器对人类的这次胜利,也让人们想起了18年前的人机之战。1997年5月11日,IBM“深蓝”超级计算机就曾和当时全球最伟大的象棋名家卡斯帕罗夫对弈。当“深蓝”将棋盘上的一个兵走到C4时,卡斯帕罗夫不得不承认自己输了。
“深蓝”和“沃森”分别是IBM第二代和第三代超级计算机的代表。二者的最大区别在于,“深蓝”拥有远超过人类的计算能力,而“沃森”开始具备创造力。
“沃森”这类认知型计算机的出现,让机器拥有了自主学习能力。它能模仿人类的学习过程,接触海量的数据,从中学习到自己总结的规律。比如给计算机看几万张猫的照片,它就能够自动学会什么是猫,从一堆动物里找出混在其中的猫—这让计算机能够从事跟创造性有关的工作了。
“沃森”擅长处理非结构化的数据。简单来说,就是数字和符号之外的其他信息—自然语言、图像、声音等。因此,它能够成为许多被称为“知识工程师”的职业助手,比如医生、厨师、金融分析师。这些职业都需要吸收大量的知识,并运用长期的实践经验对这些知识进行分析。
事实上,在成为“厨师”之前,“沃森”已是一名“医生”。它正在帮助纪念斯隆-凯特琳癌症中心、安德森癌症中心、克利夫兰医学中心、纽约基因组研究中心及梅奥诊所等机构寻找新的癌症治疗方案,为患者提供个性化的医疗途径。
同厨师需要大量的积累一样,一个医生要跟上最新的医学发展,每天也需要阅读大量医学论文。有数据称,医学院的学生在毕业5年之后,学习的知识就有一半将会过时。此外,还有大量的健康档案和病例尘封在数据库中。但医生每天忙于工作,不可能有足够的时间去阅读这些文献和病例。
医学论文和病例都属于非结构化数据。“沃森”能够做到将这些资料全部利用起来,在医生诊断病人的时候,在3秒钟的时间内给出诊断参考。
让一台机器做到这一点并不容易。“处理非结构化数据是对人工智能技术的一项挑战。比如我们学习一门语言,不是用教科书就能学会的。语言是发展的,夹杂着文化历史感情。所以让计算机处理文本、图像、视频,要做到理解常困难的。”苏中说。
“沃森”在准确回答问题的同时,会给出答案背后的支持。它的答案生成机制基于机器学习和概率统计,包括上百个引擎算法。在生成答案的时候,“沃森”会分两步行动。第一步,理解问题后,生成很多假设,组成一个答案集群。第二步,对答案进行排序,再去寻找,最后统一合并成一个有置信度的答案。
癌症的治疗经常面临着极大的不确定性。“沃森”在帮助患者治疗癌症的过程中,有时只能给出置信度不是那么高的治疗方法。但是,它能够同时给医生提供一些,哪些病例采取过这样的做法,哪些试验和文献中提到过这种方式。医生再结合自己的知识背景和实践经验,往往能发现更适合患者的治疗方法。
2013年6月,IBM还推出了IBM Watson Engagement Advisor,它可以充当各企业的“客服代表”,通过对人类自然语言的分析与解读,了解藏在这些语言背后的情绪和性格,并做出相应的回应。
每一台“沃森”如同一个新生的婴儿,它的知识库一片空白,但拥有超级强大的学习能力。使用它的企业可以根据自己的需求,为它足够多的专业知识。根据学到的知识,“沃森”会为不同行业的职业助理—厨师、医生或者银行咨询师。而这也意味着,未来的许多行业,可能都有“沃森”在背后协助人类工作。
2014年1月,IBM投资10亿美元,为“沃森”成立了专门的业务集团IBM Watson Group。该集团拥有超过2000名员工,专注于推动认知计算服务的商业化进程。而IBM对它的营收预期是,帮助大数据和分析服务业务到2015年实现200亿美元的营收。这或许还会成为正处在转型阶段的IBM未来的一个盈利增长点。
不过目前,“沃森”在很多方面,还远没达到让人类放心的程度。比如在那场《边缘》的竞赛中,对于一道“美国城市”类的题目,“沃森”就把位于的城市当成了答案。“本质上沃森是大数据系统,利用的是海量数据。数据本身就存在质量、有效性等各种问题。”苏中说。
所以目前,“沃森”仅仅是顾问的角色,最终享有决定权的还是人类。不过IBM或许希望它能走得更远些。“如果未来的某一天‘沃森’医生能够成为全世界最出色的诊断医生,也并不是一件不可能的事情。”IBM的一个合作方—麻省理工学院斯隆管理学院的一名教授就曾预测道。
网友评论 ()条 查看