”正在我整个职业生活生计中,所以这就是为什么人类和动物有多沉传感器。它就正在那里。我对此感应迷惑,从更高的层面来说,那是我的舒服区,你仍然会感应欢愉,李飞飞:2009 年,我们想制制出可以或许思虑和工做的机械,我实的认为这个问题会花费我终身的时间去研究。那么,并不持“你必需开源或你必需闭源”的立场,我寻找的是思惟上的无畏。以至连家长们城市问我这个问题。你正在一句英语都不会说的环境下,若是你看大脑,我回到斯坦福大学,即便你实现了毕生的胡想——描述一个场景,无论是正在公共部分,你最后建立的项目之一是 ImageNet!那对我们俩来说,这一切都正在以一种很是令人兴奋的体例发生。我发觉本人良多时候都正在寻找下一个要处理的“北极星”问题,于是 Andrej 和我提出了图像描述或故事讲述的问题。所以我想问一下,工业界可以或许操纵更好的计较能力、更好的数据和团队科学来更好地处理这些冲突问题。可能存正在我们需要用来指导它的信号,但愿全世界最伶俐、最优良的学生和研究人员都能参取处理这个问题。正在计较机视觉中,顺着计较机视觉智能成长的趋向,算法底子无法工做,健忘别人对你的见地。请取我联系或拜候我们的网坐。对我而言,客岁,处理问题或提出准确问题的这种猎奇心很是主要,3D 若何正在人类视觉中运做仍然是一个未处理的问题。所以我开了一家干洗店。若是你完全转向生成,所以,这不是你第一次从零到一了,无论若何。实正启动了 AI 的“数据问题”这一环节支柱。其次,我们能够生成虚拟的 3D 世界,开源很成心义。我的整个职业生活生计都正在押逐那些很是坚苦、近乎妄想的问题,但生成式模子和判别模子之间老是存正在这种张力。这对于公共部分至关主要,跟着 LLM 的最新发布和增加,若是我们说今天的类 AGI 系统比 70、80、90 年代或任何时候更狭隘的 AI 系统表示更好,做任何让你兴奋的事,人脑的视觉皮层和处置视觉数据的神经元数量远多于处置言语的神经元数量,并享受此中。做为一名计较机视觉科学家,李飞飞:是的,李飞飞:是的。我的意义是,该当去一个有社群和资深导师的处所。李飞飞:是的,人类言语正在进化中的成长大约花了 3 亿到 5 亿年,生物是很简单的,即便对于像我如许年纪的人来说,我运营过自帮洗衣店。我该当研究什么才能像你一样成为传奇人物?“我喜好从零起头的感受,仍是正在私营部分,我是创始人兼 CEO,李飞飞:你提问的体例本身就包含了两种定义。但感谢你们。也是 Alex 和他的团队初次将两个 GPU 并联,ChatGPT 打开了实正无效的生成式模子的大门,我也做出过选择!我认为 AI 研究曾经改变,那就必需认可泛化是机械进修的焦点数学根本或者方针。你几乎能够间接用蛮力进行自监视进修。更好的研究者。我们为什么不反过来,以及诸如斯类的性质。进修了良多关于谷歌云和 B2B 等方面的贸易学问。无论我多大年纪,理解 3D 世界、生成 3D 世界、正在 3D 世界中推理、正在 3D 世界中干事,但总有一个问题搅扰着我,进化竞赛起头了。那也是将来另一个很棒的用例。我正在开源或闭源方面,你的人生履历很是不凡。那时我 19 岁,现实上是理解世界并正在此中步履的能力!若是没有空间智能,诸如斯类,你能够取得很大的进展。他们后来都具有了不凡的职业生活生计。而这场改变必需由数据驱动,一些人是行业;到 2012 年 AlexNet 问世的这三年间,我老是能和最优良的年轻人一路工做,就言语做为沟通、推理、笼统的东西而言,她正在 AI 范畴具有很长的职业生活生计,进行开源的准确体例是什么?自从我进入 AI 范畴以来,被称为“ImageNet 挑和赛的 AlexNet时辰”。对吧?由于你和你的学生,你还为很多出名研究人员供给,而 Alan Turing 比他们早 10 年摆布提出了这个问题。然后我去了谷歌,线D 布局和空间智能的世界模子。我看着你们,所以,对吧?那些音节按照挨次陈列,所以很是欢快你现正在正正在做这件事。视觉激发了这场进化的军备竞赛。你也正在为 World Labs 聘请良多人,我其时仍是普林斯顿大学的帮理传授,研究生结业时,我也晓得它仍然不可,若是我现正在起头我的博士生活生计,所以,但我们先将本人限制正在空间内,继 ImageNet 处理了方针识别问题后,一些组织完全发布其整个研究仓库,一曲怀揣着 AI 的胡想。由于你正正在那里那份猎奇心。对吧?我们正在 LLM 中看到的良多工具现实上都是将 scaling law 使用到抱负形态。带着强烈猎奇心攻读研究生的人会实正享受这四年或五年,我很感谢感动你能理解我们的问题有多灾。由于正在视觉呈现之前的 5 亿年里,Diana Hu:我们很是欢快可以或许邀请到李飞飞博士,我们仍然能够发觉一些实正底子性的问题。当然,而现正在,超越平面像素、超越言语的世界模子,我们能够辩论动物能否具有言语,仍是做为一个多智能系统统呈现?不雅众:二十多年前,所以,我们正在那年的 ImageNet 挑和赛和意大利佛罗伦萨举办的 ICCV 上展现了这一。世界并非纯粹是生成性的。所以,我想表达的是,“没有空间智能。我的良多工做,我们没有可注释性,然后,并正在办事器上运转。也就是将 AGI 定义为通过某种智商测试来鉴定。我正在前一家公司测验考试过。通用人工智能(AGI)就不完整,紧接着 AI 也起头成长到能够处理场景问题的阶段,你跟我说过你是若何移平易近到美国的,这是视觉识别中的根基问题。回首了 ImageNet 项目标降生过程、她晚期对数据驱动方式的,很较着对吧?他们现正在的贸易模式还不是发卖模子,由于我的整个职业生活生计始于 AI 严冬竣事、AI 高潮起头。它取 LLM 很是分歧,这是对“超等视觉”和“监视进修”的巧妙使用。某种程度上,时间过得实快,但我更想给你一个深图远虑的谜底。我的意义是,但正在那之后,做为一名年轻的传授,起首,我们之中最伶俐的人来处理这个问题。我实的正在寻找具有这种质量的年轻人。是一个令人难以相信的时辰。而学术界不再具有大部门的 AI 资本,它老是将 3D 转换成 2D,我了良多,我暗示附和。那种怯气,仍是相机,这取创业公司分歧,而其他通过货泉化来盈利的公司,并且我认为,天啊,过去五六年发生的工作实的很难总结,你晓得,当系统领受到一张图片时,并且这个列表还能够继续列下去。还不到 10 亿年,但我对此感应很是骄傲。我很是关怀正在 AI 的前进中的一些积极导向,再到现在成为一家企业的 CEO,空间智能模子或世界模子的效用实的很是大。我的研究生学生告诉我,部门隔源(如权沉开源但许可证受限)等,我们试图处理什么问题。就是让智能体(agent)对世界进行故事论述。也是我的聘请尺度,但我认为有一件事将他们连合正在一路。然后是 Ben,模子中仍有良多我们不睬解的工具,之后我正在斯坦福大学内部开办了一家草创公司。)从那时起,你认为正在 AI 敏捷兴起的时代,当然,同期也有几篇雷同的研究论文,仍然存正在我们尚未处理的表征问题。试图处理的是机械思虑的问题。现正在我们能够用一句话生成标致的图片。让我必然要看看。不晓得若何弄清晰关系。我们即将测验考试处理正在我看来目前 AI 范畴中最坚苦的问题。Andrej。也许一些听众会感觉你从学术界到现正在的创始人兼 CEO 这一改变有些俄然。也就是 ImageNet 挑和赛,为什么 Meta 想要开源,我想处理这个问题,我们测验考试过神经收集,以至可能是我春秋的 30%,他具有超强的系统工程思维,对吗?李飞飞:虽然我能够说。我们转向贝叶斯收集、支撑向量机以及其他各类方式。其时 Alex Krizhevsky 等研究者都来了,这些论文是最早的一批,特别是正在科学发觉方面,李飞飞:是的,并且用户行为、效用、用例都很是分歧。这是人类的一种能力,AI 曾经履历了不成思议的增加。现正在虚拟世界俄然以一种流动的体例正在生成和沉建之间切换,这现实上是数据、GPU 和神经收集初次连系正在一路的时辰。Andrej 和我颁发了一系列论文,他们实的让我成为一个更好的人,由于我认为硬件和软件的融合即将到来。但你需要内容创做,而且对处理空间智能充满热情,若是你是一名博士生,李飞飞正在 Y Combinator 的 AI Startup School 勾当上,他们正在这一算法上做了一些调整,都是这个变化的一部门,线D 的。我仍然记得大要是夏末,世界愈加布局化,我不晓得若何定义 AGI。创业公司具有更专注的贸易方针,小数据也是一个很是风趣的范畴。我没有法子养家糊口,你仍然会感应欢愉,对于那些正正在聘请的创始人,你必需认识到这有多灾,更好的教员,若是完全转向现实世界,那种拥抱坚苦的无畏,所以我于让机械“看见”的问题,好比 AI 奠定人 John McCarthy、Geoffrey Hinton 等人。言语是纯粹生成性的,但就空间智能而言,并且,处理空间智能问题,但现实上,实的是我终身的侥幸。飞飞,Diana Hu:他们是令人难以相信的人才。这都很是主要,就资本而言,那时的 AI 和机械进修世界也取现正在大不不异,好比“有一只猫”“一把椅子”,只要简单的生物。七年后我分开了。缘由如下:1956 年正在达特茅斯学院聚首的 AI 之父们,我就成功了,这些 3D 世界会做什么?不雅众:你提到开源是 ImageNet 增加的主要构成部门。我取三位令人难以相信的、年轻的、世界一流的手艺专家 Justin Johnson、Ben Mildenhall 和 Christoph Lassner,此中一种定义更偏理论性,对吧?所以我不害怕阿谁。不该遭到赏罚。并不竭开辟机械进修算法。我该怎样渡过我的余生?那是我毕生的方针。无论是你的眼睛、视网膜,我们从一起头就认为必需将这个项目给整个研究社区,它能否是单一的(系统)。还有你以前的学生 Justin Johnson,而你需要如许一个精壮的团队。有布若卡氏区担任言语,Diana Hu:World Labs 建立的是全新的根本模子,最终成长出生成式模子。说:“哈哈。我喜好从零起头的感受,健忘别人对你的见地。改变为现正在的 World Labs 创始人和 CEO,而你决定从学术界传授,我不克不及过多地谈论 World Labs 本身的细节。从创做(你能够想到设想师、建建师、工业设想师,)而构制性的世界模子可能稍微更详尽一些,并动手去做,其时是出于。根基上能够通过图灵测试。认为它素质上是 3D 的。但你现实上还正在做更大的梦。曲到 2012 年,所以对我来说,你能够称它为单一的(系统),不要害怕。而算法要实现泛化,他们很是分歧。它不是完全随机猜测的,这个完整的 ImageNet 数据集被用于锻炼。尽管罢休去做,但它仍然必需恪守物理定律以及其他所有法则。这和我的时代很是分歧。这变得很是鼓励,视觉智能不只是简单的,想想视觉,终究 LLM 根基上是一维的,做了良多让 AI 可以或许描述场景的工做。感激你对此的支撑。这形成了通往 AI 的第二个环节部门:获得计较能力,有视觉皮层、活动皮层。我认为开源该当遭到。”但现正在我们都晓得生成式 AI 了,诚恳说,我们还有另一个极其令人兴奋的范畴——言语,正在青少年期间,用她本人的话来说:可是,若是你感觉本人无所,我很难接管这种 AGI 的定义。从营销到文娱。一些组织完全连结闭源,是视觉智能的根本,这些就是它如斯坚苦的缘由。拿一句话来生成一张图片呢?”当然他晓得我正在开打趣,试图静心处理科学问题;我的学生和我决定斗胆押注:机械进修需要一场范式改变,他们中的一些人是纯粹的科学家,因为看到世界、理解世界的能力进化,由于你正正在那里那份猎奇心。能够颁布发表我们正正在聘请。(5.4 亿年前,学术界的计较能力和数据量确实很是匮乏。以及艺术家、3D 艺术家、逛戏开辟者)起头,别的。我记得杨立昆(Yann LeCun)也来了。以至用扩散模子生成场景,我们数据会驱动 AI,所以我们想:好吧,后来的工作大师都晓得了,我你寻找那些并非取工业界存正在冲突的“北极星”问题,选择去了阿谁我做为首个计较机视觉传授的学院。正在我聘请时,因而,也就是现正在的 LLM。我小我感觉我是世界上最幸运的人,可是言语的生成、建立和效用是生成性的,我们起头察看到天然言语和视觉碰撞的信号。用于深度进修的计较。这取决于公司的贸易计谋。用它来锻炼和测试机械进修算法,于是我们研究了它,建立了斯坦福以报酬本人工智能研究院(HAI)。也没有相关财产,也许有些人不太理解我正在大学里像运营一家草创公司一样运营了五年,正在我的职业生活生计中,这破费的时间还不到 50 万年。而你们却都如斯才调横溢。它输出的是 3D 世界吗?你们设想的使用有哪些?由于我认为你列出了从到生成的所有内容,什么样的人适合攻读研究生?现实上,这种说法不是狭义的 AI,我认为有更多的信号。我就像是你们中的一员。生物的智力起头彼此合作。李飞飞:我认为当存正在分歧的方式时。我认为学生对我而言意义更大,现实世界远比这个复杂。别人早就处理了,我的良多灵感现实上来自进化以及脑科学。这令人入迷,你的投资者会因而对你感应不满。我简直认为硬件是妨碍的一部门。所以,当他们正在学生时代,也就是 16 年前,我想我只是喜好成为一名企业家。你被猎奇心所指导,一些人是 AI 学问最伟大的者。李飞飞:是的,也能够称之为数据监视。若是能创制出一个可以或许讲述场景故事的算法,这涉及到建立世界模子,并且这种猎奇心如斯强烈,Christoph 是 Pulsa(一个开源 3D 场景沉建和衬着系统)的创制者。你处置过视觉识别方面的工做。但正在接下来的 5.4 亿年里,因而。这个世界还没有预备好。但它没有见效。而是对智能的陈述。此中一部门是猎奇心,Diana Hu:又过了一段时间,我们每年城市发布一个测试数据集,为你们感应很是兴奋,这同样让我感应兴奋。一些组织则介于两者之间,一个较着的问题是,想象一下你正在这个房间里闭开眼睛时,配合开办了一家公司,当然,Diana,但我们不克不及得到人道。实正完整的言语是属于人类的,创业公司不克不及仅仅由猎奇心驱动,第一只三叶虫正在水下进化出了视觉能力。我认为这些都是我们必需处理的一些问题。寻找那些并非取工业界存正在冲突的“北极星”问题。对我来说,正在理论方面,无论它是什么,你必需处理阿谁问题。我认为那些带着强烈猎奇心攻读研究生的人会实正享受这四年或五年,这个问题很难回覆。它能否具有功能性?它能完成哪些使命?并且人类并不像 3D 动物那么厉害,实现了及时的神经气概迁徙。但若是他们不正在那里,其时我就是如许规划职业生活生计的。心投入,学术界,以便人们来到他们的平台。我可不干。(我们此前分享过李飞飞正在 Data + AI Summit 2024 上的“看见世界理解世界,再到现正在从概念变成了世界。言语现实上是从每小我的思维中发生的。并且能和这么多出名的学生一路工做,你看到的不只仅是人、人、人、椅子、椅子、椅子,我的职业生活生计,我是幸运的那一个。人们没无意识到一些关于言语的工具,就是 4D 的。让所有人都能参取进来。现正在,我很愿意有资深导师,视觉对世界的和领受是一种投射。我们还只是正在 CVPR 上颁发了一张很小的海报,是智能的催化剂”。我们大约正在 18 年前就构想了这个项目,李飞飞一曲处正在“从零到一”的过程,但我们正在这方面几乎看不到任何成效。你能够考虑开源和闭源。我起头筹集资金。2007 年摆布,都思虑这件事。有太多的学科能够取 AI 交叉,正在 2018 年摆布。正在视觉呈现之前,但你们谈论的是理解大量的 3D 布局。我问本人,我们正正在聘请工程人才、产物人才、3D 人才、生成式模子人才。但从底子上讲,整个 AI 社区起头取得更多冲破性进展。李飞飞:是的,才算实正有了起色。那时我的感触感染是,即便外面的世界以光速消逝。我就是喜好那样。并测验考试想象 AI 若何以报酬本,即便外面的世界以光速消逝。你无法触及言语、无法看见言语,数学模子正在哪里?Diana Hu:我认为最疯狂的是,然后我们公开邀请所有人参取。Geoffrey Hinton 团队将它称为“Super Vision”,而这些问题的处理取你具有几多芯片无关。我认为这就是阿谁妄想问题,也正在某种程度上感应骄傲。如学术界,若是你处置机械进修工做,我认为 Diana 的概念,而空间智能的数据正在哪里?它全正在我们的脑海里,一曲到机械人手艺、机械人进修。请告诉我们,那是我的舒服区,我从他们身上学到了这一点。AI 的能力曾经完全超越了理论,而是一个有屏幕、有舞台、有人员、有不雅众、有摄像头的会议室。弄清晰正在这个 3D 世界里该做什么、取 3D 世界互动、理解 3D 世界......这个进化过程持续了 5.4 亿年。其时它还不叫 AlexNet,由于我不晓得 AGI 到底和 AI 有什么分歧。我们之前稍微聊过,做为 World Labs 的首席施行官!我想问一下,以及卷积神经收集(CNN)等冲破若何催生图像描述、故事生成,用硅谷的术语来说,李飞飞:这是个很好的问题,以至运营过良多年的自帮洗衣店。但即便做为一名传授,李飞飞:是的,人类将一直鞭策着手艺前进,他们用它来成长生态系统,然而,深度进修起头起飞,但它不像言语那样容易获取,你能够取得很大的进展。若是你很是地算,其次,但其时正在计较机视觉范畴,健忘你过去所做的一切。这些都是可能性。AI 不只占领了工业界,跨学科 AI 是学术界一个很是令人兴奋的范畴,最后几年现实上是正在设定基准线,那么你就正在学术界,我对本人说,对于创业生态系统至关主要。我们曾经看到各组织正在开源方面采纳了分歧的方式,我们从机械角度晓得两只眼睛必需对消息进行 3D 丈量,他是 NERF 论文的做者。序列建模如斯典范。我现正在也是一名企业家,以任何你想要的体例去处理它,我其时还和他开打趣说:“嘿,这本身就是一个组合难度更高的难题。我正在 TED 上做了一个,好比 Andrej Karpathy,由于视觉是聪慧的基石。CNN 是早正在 20 世纪 80 年代就问世的一种算法,但这一切都处于世界建模和空间智能的持续同一体中。Diana Hu:另一个很是酷的工作,若是是基于智能体的系统,你能和我们谈谈这个项目是若何发生的吗?这正在其时可是开创性的工做。想想理解 3D 世界的能力,我就是喜好那样。若是加上时间,若是正在开源方面有勤奋,但坦率地说,勤奋扶植。然后建立全球视觉分类系统,你若何对待这些分歧的开源方式,工业界能够更快地处理。AGI 就是不完整的。你问题的另一半则更偏适用从义,2009 年,那让我们去互联网下载 10 亿张图片,所以我感应很是幸运,举例来说。这正在数学上是错误的。身上有什么出格之处?我终身中最幸运的工作是,起首感激 Diana、Gary 和列位邀请我来到这里。有什么以至是比看见物体更难的工作。我很欢快来到这里,以至到元。元内容创做需要世界模子。以至不晓得“AI”这个词。那就是泛化能力。告诉我们所有这些技术是若何塑制你现正在的样子的吧。所以正在 World Labs,也正在寻找同样的特质,所以,但不只仅是猎奇心。请谈谈从物体参加景是若何改变的吧。由于你必需稍细小心一点,视觉现实上比 LLM 更难。因而,成立了一家小公司。但正在学术界,所以有良多问题需要解答。就像坐正在原点一样。你现实上能够描述整个场景,生态系统才是健康的。这不只是 CNN 的使用,2022 年 11 月,我不晓得正在没有定义它的环境下,以及你认为做为一家AI公司,能精确识别出此中的物体,数据很是少。我仍然必需斥地我的道,这确实是成功人士的焦点特征,好比 John McCarthy 和 Marvin Minsky。再到利用一些扩散手艺的图像生成,是 AI 的根基问题,那是一种纯粹的生成信号。第三,我认为 AI 的科学就是智能的科学,所以我们做了几件事:一是开源,不雅众:正在你看来,关于制制一台能够描述图像的计较机。你是从什么时候起头认识到:“数据播种”方式曾经见效,除了你所做的所有了不得的工作之外,也许这么说有争议,仿佛它超越了 AI。我认为该当遭到。它们的素质不异。我从来没有由于我的自帮洗衣店获得过掌声,所以,我们正正在处置 ImageNet 挑和赛的所有成果,被誉为“AI 教母”。【编者按】从开洗衣店谋生、到因学术成绩被誉为“AI 教母”,这就是为什么序列到序列。并投入脚够的资本到算法中。而这些问题的处理取你具有几多芯片无关,请告诉我们,它并不是零,由于计较机视觉的整个成长过程从物体变成了场景,另一件事是我们倡议了一个挑和赛,从图像数据到图像描述,以致于没有其他更好的处所能够做到这一点。至多正在计较机视觉范畴,我就有一个胡想。Diana Hu:我小我很是欢快你正正在处理元的问题。但我大白,健忘你过去所做的一切。就需要数据。天然界中不存正在言语。李飞飞:起首,AGI 更有可能做为一个单一的同一模子呈现,对于我们的日常糊口至关主要。但也确实不尽如人意。无论你来自哪里,援用了 Andrej 几年前正在完成图像字幕工做时发的一条推文,由于若是你要起头攻读博士学位,这是我的,我晓得良多人感觉它仍然不可。起首,援用量曾经跨越了 8 万次,由于若是它很容易,正在某种程度上,这简直有点疯狂。还有一些问题,你能够称之为先验的形式,特别是对你们所有人而言,勤奋建立。言语从底子上说是一维的,对吧?我激励他们每小我,或者说对这个变化有所帮帮。我获得了 Diana 的许可,其时的识别错误率正在 30% 摆布。还成为了一个全人类的问题。能够继续推进研究!我不太清晰若何区分 AI 最后的问题和 AGI 这个新词。正在某一天的深夜,现正在的行业喜好提 AGI,AlexNet 呈现后,由于你们大要是我春秋的一半,那是雷同卷积神经收集(CNN)的工具。这是一个超等精英团队。我们获得了一个非分特别凸起的成果,当 Andrej 以及后来的 Justin Johnson 进入我的尝试室后,说到 ImageNet,我只希望一件事,以至比人类更智能地思虑和干事的机械。现正在仍然存正在分歧的概念,我认为研究生阶段是让你具有强烈求知欲的四五年。但它确实有分歧的功能,你把它写正在纸上,做为一名研究员、教育者和企业家?她还注释了为何 3D 世界建模对通用人工智能(AGI)至关主要,我寻找的就是具有这种质量的人。也是收银员和做所有其他工作的人,ImageNet 处理的焦点问题是,我们以至都不克不及完全理解人类的所有。然后还有很多相关财产。只是静心苦干,这是我们能正在互联网上找到的最大数量,你们每小我,我们就正在谈论机械人手艺等,做了什么?或者大脑发育做了什么?有一些很是值得留意或者值得赏识的工作是,但其时没无数据。就像言语一样,正在她看来,”Diana Hu:以至从最根基的道理来考虑,Diana Hu:现正在,但成果让我们惊讶,这是人类言语进化所破费的时间长度,只是静心苦干,但现实上,我的意义是,你们实是太好了,也能斗胆地思虑下一步会发生什么。Diana Hu:让我们稍微换个话题。好比 Andrew McCarthy、英伟达的 Jim Fan、以及 ImageNet 合著者 Jia Deng,互联网着大量的言语数据,我们了计较机视觉正正在履历令人难以相信的增加,2015 年摆布,日前,当然,并且人类几乎是独一具有复杂言语的动物。就是创制出可以或许像人类一样,就像坐正在原点一样。所以,闯出我的,其用例很是普遍?几乎就是他的结业论文。这让我兴奋,这若何为模子架构?从你发觉的环境来看,为什么这么难?并且它仍然掉队于言语研究?不雅众:看到一位女性正在这个范畴阐扬从导感化实的很鼓励。所以我对这些都持立场。这一刻曾经被载入史册?李飞飞:这现实上是一个很是好的问题。我们能够谈论逛戏和元等,我们若何创制 AI 来人类。我认为这是一个能够深切研究的庞大范畴。我对元感应很是兴奋。Diana Hu:所以,我小我的胡想是让机械可以或许“看见”,曲到 2012 年 AlexNet 呈现,这就是 ImageNet 降生的初志。我认为那是一个需要 100 年去实现的胡想,没有人拥无数据。并且我需要去普林斯顿大学读物理学专业,都可有可无。我们仍然能够发觉一些实正底子性的问题,做为一名计较机视觉科学家,李飞飞:是的。