划时代的扎克伯格·化身Metaverse访谈:虚拟与真实

文:城主

昨天知名播客博主Lex放出了和小札(Meta CEO 马克·扎克伯格)的一个访谈。不到24小时,播放量已经突破天际的接近了百万。

这并不是Lex和小札的首次访谈。这次访谈之所以在油管炸裂,是因为正如访谈的名字:马克·扎克伯格 | 在元宇宙Metaverse里的首次访谈。

不是普通的元宇宙,而是一个超拟真写实的元宇宙:

你看得出来这是根据人物实时渲染的avatar吗?而且,有着和现实世界完全匹配的动态动作和表情。

城主看到这个访谈视频的内心震撼程度,只有当时第一次看到Midjourney的画作,和ChatGPT的横空出世能相比。

或许Metaverse离我们不远了。当这个技术真正普及的那天(需要解决初始头像扫描的问题,从"3小时-专有设备"的门槛降低到"3分钟-手机扫描", 但这是可以预期的),相信就是metaverse开始普及的开始 -- 无比期待使用这个技术来进行虚拟会议,以及虚拟人生。

视频完整版传送门:

【见证历史!Meta小札化身的元宇宙访谈【中英精校】-哔哩哔哩】 https://b23.tv/EeGOO3G

只要看看下面这个短视频,读者能感受到这个metaverse对话带来的震撼,如主持人全程震惊一般,这完全是真假难辨的虚拟世界:

城主相信,这次Metaverse播客以及背后所体现的技术,是足以划时代的,所以为之记。

=以下是本城对访谈的全文重写整理=

以下是我与马克·扎克伯格在虚拟宇宙中的一次对话。虽然在物理空间上,马克和我相隔数百英里,但我们感觉仿佛就在同一空间,因为我们都以3D柯达Avatar形式呈现。这项技术的逼真程度令人震惊,我坚信,这将是人类在互联网上实现深度有意义交流的未来方式。这些头像能够捕捉许多微妙的表情差异,展现了我们人类通过面部表情传递情感的方式。我现在正致力于进一步提升这种底层人类情感表达能力。这是由莱克斯·弗里德曼主持的播客。

亲爱的朋友们,这是马克·扎克伯格。我在哪里?马克,你在哪里?我们都在哪里?我们的脸被黑暗笼罩,感觉就如同身处同一房间。这真是我所见过的最不可思议的一幕。很抱歉侵入了你的个人空间。我说,我们之前曾一起学习柔术。

的确,我之前向团队发表过看法,感觉我们似乎已经能从更远的距离进行交流了。

这真是不可思议。我无法用言语表达我的感受。它真的给人一种我们身处同一房间的感觉。是的,这就像是未来。实在是太不可思议了。我正在逐渐适应它。这就是你,真的是你,但你并不在我身边,对吗?你戴着Headset,我也是。这真是令人震惊。

那么,能否描述一下目前都用了哪些技术使我们看起来如此逼真呢?

好的。作为背景信息,我们为Meta的一项名为“柯达头像 Kodar Avatar”的研究项目进行了扫描。该项目的初衷是,我们的头像是卡通风格的,而不是实际传输的视频,它的目的是通过不同的表达方式来审视我们自己。我们建立了一个包含每个人的脸部、身体和不同表情的计算机模型,并将其整合到柯达系统中。因此,当你戴上Headset时,它能看到你的脸,捕捉你的表情,并可以通过网络发送编码版本,让你看起来更逼真。因此,与传输完整的3D沉浸式视频相比,它在带宽效率上实际上更高。

它能捕捉到一切,甚至是脸上的小缺陷。对我来说,人脸的细微之处,甚至是那些小缺陷,都是令人吃惊的。这增强了你的身临其境感。它让你意识到,完美并不是最重要的,这会增强沉浸感。就像脸上的小雀斑、颜色变化,还有皱纹,鼻子的各种特征,和不对称性等。每个人的眼角和微笑都有所不同。眼睛是非常重要的。所有的研究都表明,大多数的交流并不仅仅是言语,而是一种表达方式。因此,我们试图用我们拥有的经典表达化身系统来捕捉这一切。它的设计较为卡通化,但你也可以在上面表现出这些表情。但无疑,提供这种逼真的体验确实带来了一种真实感。我只能说,这真的很奇妙。

这触及了虚拟现实和增强现实愿景的核心,就是传递一种存在感,让人感觉彼此就在一起,不论实际上身处世界的哪个角落。我认为这是一个很好的例证,我们虽然身处两个不同的州,跨越半个国家,但感觉就像你坐在我对面一样。这真是太不可思议了。

是的,我几乎要激动得无法自持了。这完全是一种全新的体验。当我与亲人进行这样的对话时,我感觉这会改变一切。为了更详细地了解相关内容,我访问了匹兹堡,亲身经历了包含众多令人惊叹技术的扫描过程。当前,软硬件开发仍在进行中,这是一个漫长的过程。您对这个行业未来有何看法?是否会让人们更容易接入?

众所周知,最初这些详细的扫描是由少数人进行的,这也是您和我目前所做的版本。在我们对大量人群进行此类扫描之前,我们可能会过度收集表达式,因为我们还未确定到底可以将流程简化到何种程度,并从已完成的扫描中进行推断。

然而,我们已有一个项目在努力实现目标,即仅通过手机进行快速扫描。用户只需挥动手机几分钟,说几句话,做一些表情,整个过程仅需两到三分钟,便可生成与现有质量相当的模型。我认为这仍是我们面临的重大挑战之一。若您有几个小时的时间,我们现有的技术和设备,例如市面上可购得的Meta Headset,都能够进行扫描。但是,如何以高效的方式生成这些扫描仍是我们需要解决的问题之一。此外,还有与此相关的各种体验问题。

当前,我们仿佛坐在黑暗的房间中,这一场景对您的播客观众而言应该很熟悉。但我相信,随着时间的推移,我们的愿景将不仅仅局限于视频通话。那样的体验确实很酷、很令人沉浸,但在虚拟世界中,我们能够做的事情远不止于在手机上的操作,我们可以一起做事、一起参与活动,玩游戏,举办会议。一旦混合现实和增强现实技术得以实现,我们就可以创建类似的化身,参加会议,一些人实际在场,而另一些人则以逼真的形式出现,叠加在物理环境之上。我认为这将非常具有革命性。

因此,我们还需要开发各种类型的应用程序并探索其使用场景。未来几年将围绕这个领域展开激烈的竞争,我对此感到无比兴奋。这真是太不可思议了,我希望大家都能亲眼见证这一切。真的感觉就像我们在同一个房间一样。看起来,我们似乎已经穿越了所谓的“恐怖谷”,给人一种与真人无异的感觉。

当然,我们仍有很多需要调整的地方。每个人都有自己独特的情感表达方式,如何调整化身以使其能够更好地反映每个人的个性,将是我们需要解决的问题之一。例如,有些人可能更喜欢化身比真人更加情感化,而我常因为表情相对僵硬而受到批评。但对我来说,我希望我的化身能够比我的身体更好地表达我的感情。从捕捉人们实际情感和表达方式的基线出发,我们希望找到每个人的平衡点。

首个版本已经相当令人印象深刻,我觉得我们已经成功跨越了“恐怖谷”,这并没有给人任何奇怪或不自然的感觉。但这使得问题变得更加复杂。眼睛的微妙表情在传达喜悦、无聊等情感时是多么的有表现力,即便有人说我表情单调,但其实不然,只是我的情感表达比较微妙。我非常好奇大家对此有何看法,因为这是我第一次以这样的化身身份进行播客。我们在VR和混合现实的工作中遇到的一个问题是,身临其境的体验往往比2D视频更为深刻,但我不知道,我非常好奇大家的看法。

确实,我对于人们是否能感受到我的心跳加速感到好奇。这真是一种有趣的体验,通过远程的方式便能实现如此亲密的对话。正因为如此,我并不做远程播客。这就好像摧毁了一切,让我感受到了一种难以置信的转变,走向了一种不同类型的交流,打破了所有地理和物理的障碍。你是否有意识到,要实现这样的技术,我们需要解决许多困难的问题,以便让这一切变得更为容易,就像使用智能手机进行扫描一样?

是的,我预见我们会逐渐推出这项技术。因此,并不是说我们一推出这个产品,就会立刻看到人人都有一个柯达头像。我们希望能够让更多的人接受扫描并加入到系统中,然后我们会开始将其集成到我们的每个应用程序中。实现这一点,我认为,将对许多工作方式、生产力产生深远的影响。在很多游戏环境中,这可能并不构成问题,因为游戏本身就有其独特的风格,不是吗?你可能会希望更加符合游戏的美学风格。但我觉得,对于开会这种场合,我们在工作室中得到了许多反馈,人们对于这种仿佛与人同坐一室的体验感到非常震惊。

然而,我们也收到了一些反馈,指出人们难以适应化身表现力如此强烈,以及在这样的环境中感觉不够真实的事实。因此,我认为这会对远程会议产生重大影响,尤其是随着Quest 3的推出,它将成为第一个主流混合现实产品。在这里,你可以真正实现数字化的人或物体,并将它们叠加到物理世界中。我认为能够进行远程会议和类似的活动,就像你在任何地方与朋友进行远程会议一样,将是非常令人兴奋的。

因此,是的,我们计划在接下来的几年内推出这项技术。虽然它还未准备好成为一种主流产品,但我们将继续调整,进行更多的扫描,并将其推广到更多的功能中。但毫无疑问,你将在未来几年看到更多这样的体验。我确实很想看到一些名人和非名人被扫描,并让更多的人体验到这一切。

看到这些,我简直感到心碎,失去了言语。仅仅传达信息就是如此困难,这真是令人难以置信。我如何感受这种情况,如何感受它的存在,如何感受这种情绪的微妙之处,在类似的工作会议或任何类型的场合,这对于播客来说都是极好的。我甚至不需要你的胳膊或腿,但是——好吧,我们必须得到它。这是它自身的一个挑战。

问题的一部分在于,进行了扫描后,你需要一定量的计算来驱动它,无论是对于头戴设备上的传感器还是渲染它。因此,我们正努力解决的一个问题是,究竟什么是最佳的保真度水平。你可以用编解码器来渲染完整的主体,这可能是相当复杂的。但我们正在考虑的是,也许你可以将身体的保真度降低一些,但仍然保留主要动作的主要类型。然而,你的脸确实是我们最重视的部分,因为它能够阅读和表达情感。就像你说的,眉毛的一丝微动,就足以改变你的表情和情绪,而移动手臂一英寸可能并不那么重要。所以,是的,我们确实希望将所有这些因素都考虑在内,这也将是我们下一阶段的工作重点。

你提到了即将推出的Quest 3,我也有幸试用了一下,真是太棒了。它不仅仅是虚拟现实,还实现了混合现实。

我相信,这将成为第一个主流混合现实设备。我们去年推出了Quest Pro,价格高达1500美元,但我为我们的创新努力感到非常自豪,我们不仅推动了最先进的技术和新功能的提供,还让每个人都能使用它。我们即将推出这款定价500美元的产品。在某些方面,我认为Quest 3中的混合现实比以前更为出色,甚至超过了我们目前在Quest Pro中使用的技术。因此,我为我们的团队能够实现这样的创新感到非常自豪。

但是,大家也清楚,有些软件随着时间的推移不断调整、优化,从而表现得更加出色。这其中,一部分工作是将多个产品整合在一起,进而找出什么是妨碍良好体验的瓶颈。因此,在 Quest 3 中,我们将混合现实摄像头和传感器的分辨率提升了数倍。当我们探索为 Quest Pro 提供何种体验时,我们发现这一改变产生了巨大的影响。部分原因也在于,高通近期推出了专为 VR 和 MR 设计的下一代芯片组,我们便与之合作开发了一款定制版本。

然而,虽然今年的 Quest 3 上有了这一功能,但 Quest Pro 却未能配备。所以,从某种角度来说,在 Quest 3 上,尽管它并非专业产品,实际上,它比 Pro 系列拥有更强大的芯片组,而价格仅为 Pro 系列的三分之一。我为能将这样的产品交到用户手中感到非常高兴。它能实现高通为 VR 所开发的所有功能,而且其他公司同样可以实现。Quest 3 的表现更加出色,因为它有更好的显示效果和更强大的芯片,所以图形表现更佳。而且,它的厚度减小了 40%,因此更加舒适。然而,混合现实确实代表了一次重大的技术飞跃。

当前,这个领域令人兴奋的一点是,它并不像智能手机市场那样,每年都会有新产品推出,但你几乎分辨不出与前一年的型号有何不同。相反,我们每次推出新的头戴设备时,都会有显著的新功能。现在,最重要的新功能便是混合现实,即采用人或物体的数字表示,并将其融入到真实世界中。

基本上,这意味着你可以拥有这些增强或全息图像和体验,并将它们带入你的客厅、会议室或办公室。我认为,还会有更为简单的创新出现。现在的很多 VR 体验并不需要完全沉浸式。如果你在玩射击游戏或进行健身体验,人们常常会担心挥动手臂时会不会撞到灯或其他物体。在混合现实中,这种担忧得到了缓解,对吧?你仍然可以获得沉浸式和 3D 体验,实现物理世界无法达到的效果,但通过观察周围的实体环境,人们会感觉更加安全、更有保障。我想,这也会是大家所喜欢的。所以,我真的很期待看到大家会如何使用它。而 Quest 3 预计将在今年秋天晚些时候推出。

是的,我必须要和他人一同体验这个设备,在那里有许多家具。这样,你就能看到这些家具,看到那些和你一起享受挥舞手臂乐趣的人。即使他们会因此取笑你,但这背后也蕴含着友爱。我确实体验过这一点。这与僵尸从墙里涌出的纯 VR 体验有着天壤之别。

是的,这就像有人朝你开火,而你要躲在真实的沙发后避开。集成度令人难以置信,同时也有一些细微之处,比如,在一个没有窗户的房间里,你可以添加窗户,当僵尸向你跑来时,你可以透过窗户看到外面,而外面的风景依然美丽。要实现这一点,我们需要在头戴设备的外部安装摄像头。在小型头戴设备上实现这种技术确实令人震惊。而这不仅仅是摄像头的问题。你实际上需要多个摄像头,以捕捉三维空间的不同角度和顺序。然后,将其映射到你的视线中,这是一个极为复杂的计算问题和人工智能问题。因为摄像头并不能精确地位于每个人眼睛的位置,每个人的眼睛位置都不尽相同,视角也会有所不同。你需要进行对齐,实时生成自然的视觉效果,并叠加你想要放置的任何数字对象。这无疑是一个技术挑战,我相信我们将在未来几年里继续进行优化和调整。

非常高兴能够推出Quest 3,我认为这款产品将成为数百万人的首款混合现实设备。只有当数百万人开始使用某项产品时,整个开发者社区才会真正投入到试验和构建中,因为这意味着现在有人真正使用它了。我认为,虽然我们在Quest Pro中已经配备了一些初步功能,但Quest 3的推出无疑会大大加速这一过程。我对此感到非常兴奋。

此外,Quest 3具备手部追踪功能,因此用户无需使用控制器。这款设备的摄像头不仅支持直通功能,还能捕捉用户周围的整个物理现实,并精确追踪手部细节,便于进行手势识别等操作。我们已经在较短的时间内取得了比预期更为显著的进展,这实在令人振奋。

我不知道你是否看到了我们围绕钢琴制作的演示体验?这真是令人难以置信,用户可以在桌子上弹奏虚拟钢琴,无需任何控制器,就像真实世界中一样。设备无延迟地追踪用户的双手和周围环境,实现了物理现实和数字现实的完美融合。

这种技术显然与我们推出的柯达头像密切相关,两者相辅相成,共同为我们在这个混合现实世界中提供了超现实的数字体验。我个人非常享受这样亲密的交流,但这项技术解锁的可能性远不止于此。例如,用户可以通过这种方式将数字对象叠加到物理世界中,实现照片级的真实感体验。

我认为,我们正朝着一个新的时代迈进,在这个时代,我们将拥有外观如同普通眼镜的设备,通过这些设备,我们不仅能看到物理世界,还能看到全息图。我预测,在不远的未来,也许在这个十年的末尾,我们将生活在一个充满全息图的世界,这些全息图与物理物体一样普遍。

这引发了一个有趣的问题:什么是现实世界?我越来越认为,现实世界是物理世界和数字世界的结合体。在混合现实技术出现之前,这两个世界是分开的,我们通过屏幕进入数字世界。但这项技术的一大任务是将物理世界和数字世界结合起来,为我们提供一个连贯的现代现实体验。因为我们是物理存在,所以物质世界始终至关重要,但我越来越认为,许多我们现在拥有的物体都可以以数字全息图的形式存在。

例如,任何屏幕、媒体、书籍和艺术品都可以以全息图的形式存在,这同样适用于各种物理游戏,如棋盘游戏、纸牌和乒乓球。全息图具有极大的便利性,用户可以随时随地实例化和展现它们,这无疑是一项强大的功能。

我认为,这种技术最重要的应用之一是实现人与人之间的混合聚会,无论是社交活动还是商务会议。当你走进一个会议室时,你可能会短暂地戴上眼镜或头戴设备,但我希望在未来的五年左右,这将变成一副眼镜。在这种情况下,一些人以物理形式存在,而另一些人则以全息图的形式出现,给人的感觉就像他们真的在场一样。

同时,这种融合也将涵盖数字世界、物理世界和人工智能。我设想,在未来的会议中,除了真实的人和全息图化身外,还会有像鲍勃这样的AI团队成员加入。

至于照片级真实的头像能带来什么,我认为这在很大程度上取决于人们对技术的接受度。我们现在能够实现的眉毛、眼睛和脸颊的动作等,理论上也可以应用于更具表现力的化身上。虽然这些化身可能无法完全复制用户的外貌,但用户仍然可以创建具有几乎同样表现力的卡通版本。

总之,我认为这种物理与数字的融合是一座桥梁,连接了我们目前在物理世界中的互动和我们在未来混合现实世界中的发展。这将使我们更容易接受这些新体验,并从更为逼真的化身开始探索。我对这个领域的长远发展充满了好奇和期待。

在我眼中,我能看到人们正努力塑造一个追求照片级写实的世界。他们或许会调整这些形象使之更加有趣,但我们似乎本质上偏爱逼真之物。然而,另一方面,我也能看到,在人们逐渐适应逼真化身及其带来的体验后,实际上可能会出现这样一个世界:人们更倾向于以某种方式表达自己,与他们的物理现实保持一定的距离。这正是让我深感好奇的问题之一。

不可否认,在我们进行的一系列内部实验中,有一点在心理层面上格外引人入胜,那就是人们似乎并不抵触混合使用照片级真实感与其他形式的元素。因此,在某种特定场景下,例如我们此刻所处的黑暗房间,审美选择或许部分基于个人对播客的偏好。我们曾经体验过这样一种情况,即你面前是一个逼真的人物,而背景却是卡通风格的,人们似乎觉得这完全正常,不会感到不适或奇怪。

我们还经历过另一种情况,那就是你与一个逼真的化身对话,而在他们旁边,则是一个表情丰富的卡通化身。这种情况也同样被视为正常,毕竟,这只不过是与不同的人以不同的方式互动。所以,我还未能确定,这些逼真的化身在多大程度上将成为我们从物理世界过渡到包括数字和物理元素的现代现实世界中不可或缺的一部分,或者它们是否会像长期以来那样存在。随着时间的推移,我认为它们对于表现力和照片真实感的需求将逐渐消减。至于平衡将如何实现,我也是未知之数。

确实,这是一个引人深思、非常有趣的哲学问题。对我来说,短期内,照片般的真实感令人震惊,远超我的预期,就像你所提到的工作室场景,或是我与朋友坐在海滩上喝啤酒的情景。能够尽可能地体验到真实,是一种令人难以置信的体验。因此,我并不希望给他加上任何虚假的元素,我只想与朋友一同坐着,喝着啤酒,欣赏着大海,尽管我们并未真正坐在一起。这样的经历,从根本上说,是一种高品质的友谊体验。无论我们在友谊中追求什么,它似乎都以我当前所见的这种真实形式存在。这无疑改变了一切,所以对我而言,我可以预见我会长期坚持这一点。

是的,这也是一种创新,同时也是一项技术壮举。实现这一点无疑是令人印象深刻的。我时常会忘记,你并非真实存在,这的确是新颖而深刻的哲学问题。

不过,这里确实存在一些问题。例如,我今天早上戴上了这个化身,它的头发比我现实中的要短一些,这让我觉得可能需要理发。实际上,我今天早上确实刮了胡子,但如果我没刮胡子,我依然可以选择一个刮胡子更干净的化身,即便我的实际外貌还需要几天时间适应。因此,我认为这将带来一些微妙的问题,这些问题将影响到化身的真实感,它们展现了你被捕捉的样子,但并不一定准确反映你当时的真实样貌。随着时间推移,这将成为一系列有趣的问题。

您的意思是,我们的身份本质是什么,您了解人们追求什么,例如,人们向往拥有如夏日海滩般的身材,如果愿意接受扫描,他们会尝试减肥,通过打扮使自己看起来更加出色和性感。这确实提出了一个问题:如果众多人都在与我们的数字版本互动,我们究竟是什么?我们是驱动化身的实体还是化身?

确实,随着时间的推移,我们的身体也会经历变化。因此,我认为一个类似的问题是:我们是哪个版本的自己?这确实是一个关于身份的有趣问题,因为,例如体重的波动等,人们可能并不总是认为自己是最好的版本。有人可能认为自己是最糟糕的版本,但我认为很多人可能认为自己是最好的版本。然后,您的日常生活并不一定与其中任何一个版本完全相符。

我认为,肯定会有社会科学家和心理学家研究我们对自己和他人的看法发生了何种变化。这可能是一个相对复杂且深沉的问题,但当我思考这个问题时,我首先想到的是与亲人交流的愿望,包括那些已经过世的。展望未来,人们虽然去世,但他们仍然可以在虚拟宇宙中存在。您还可以与去世的父母、祖父母交流。我认为,我们需要围绕这个主题制定很多规范。需要找到一种平衡,以便人们在失去亲人并感到悲伤时,可以以多种方式互动或回忆,但也避免变得不健康。我不是这方面的专家,所以我认为我们需要更深入地研究和理解这个问题。

我们已经积累了丰富的经验,知道如何处理死亡和身份问题。可惜的是,人们已经开始通过社交媒体获取数字内容,使用我们服务的人每天都会离世,他们的家人通常希望访问他们的个人资料。我们已经有了一套完整的协议,使家人能够访问逝者的账户,这样该账户就不会立即消失。但同时,还有一些私人信息,例如,我们不会允许家人查看逝者的私人消息。因此,我认为当前数字世界的一些最佳实践将会延续下去,但这也会带来一些新的挑战。

另一个考虑的方面是与人工智能的交融。我们真正关注的是,希望这个世界能够发展到不只有单一的超级人工智能,而是让众多人通过AI工具完成工作,提高生活质量。如果您是一位创作者,例如经营播客,您会拥有一个非常愿意与您交流的庞大社区。我知道您愿意培养这个社区,并且也会在播客之外与他们在线互动。但由于时间的限制,您无法满足与每个人互动的需求。因此,我认为,您可以创建一个AI版本的自己,它可以在您还活着的时候帮助您与更多人互动,满足他们的需求,同时帮助您建立社区。

围绕这个问题,确实有很多有趣的议题,它们不仅存在于虚拟宇宙中。我们希望在所有消息平台,例如WhatsApp、Messenger和Instagram Direct上,这一点都能发挥作用。如果您能在元宇宙中拥有一个自己的化身版本,人们可以与之互动,您可以定义这个AI版本,使人们知道他们正在与AI互动,而不是您本人。即便人们知道这是AI,这也可能是与您直接互动的下一个最佳选择。我认为这将是一种非常吸引人的体验。

我们尚未准备推出能让创作者构建自己版本的版本,但我们已经着手推出了一些可供人们以多种方式互动的人工智能。我预见,随着时间的推移,这将成为一组人们可以掌握的强大能力。

您提到了我们在开发早期人工智能个性方面所取得的重大进展。这个构想是,您可以通过Meta应用程序与它们进行有趣而独特的对话。您能描述一下您对这些早期进展的愿景以及其中存在的技术挑战吗?

的确,许多愿景源自于这样一个理念:我们不一定追求一种庞大的超级智能,而是希望每个人都能更加享受生活,实现他们的商业目标,完成他们所致力的一切。我们并不认为所有事务都应由一个实体处理。我不认为未来只有一种人工智能与我们合作。我预计会出现多种类型的人工智能,以满足不同的需求。

例如,对于那些更倾向于使用助理的人,我们正在开发一种名为META AI的简单明了的人工智能,您可以在任何线程中与之对话。它没有形象,是更通用、更中立、更真实的,能够协助您处理众多事务。然后,有更多以商业为导向的应用场景。比如,一家小型企业可能不愿雇佣专职人员接电话,而您也可能不愿意等待与人交谈。但如果有一个可以自然地与之交流的实体,无论是解决产品问题、进行预订还是在线购物,都能为您提供协助,这将大大提升用户体验。这对于企业和希望与之互动的用户来说都是非常有益的。

此外,我预见将会出现许多有趣的应用场景。我相信会有能讲笑话的人工智能,您可以将其加入到与朋友的聊天中。作为一家社交公司,我们致力于帮助人们以多种方式建立联系。我对如何让这些人工智能促进人与人之间的联系、使群聊更加有趣、围绕各种兴趣主题,如运动、时尚、琐事和视频游戏,感到非常兴奋。我特别喜欢游戏,《博德之门》就是一款令人难以置信的作品。有一个能与您一起游戏的人工智能,虽然听起来微不足道,但它能极大地丰富游戏体验。我深信 AI 将使游戏中的 NPC 变得更加出色,这让我非常激动。

我们在内部测试中开发的一种人工智能,人们最喜欢的部分就像是基于文本的冒险,类似于“地下城主”。这非常有趣,我们已经找到了一些真实的文化角色来扮演这些人工智能,使其成为他们的化身。以史努比狗狗为例,它实际上成为了地下城的主人,这是个非常有趣的设定。

如果您提到创建一个受史努比启发的人工智能,这其中会面临哪些技术挑战?对于史努比这样的角色,创建一个人工智能的体验会是怎样的?

创建全新的角色会相对容易,因为不必完全模仿真实人物的思维和行为方式。史努比在这种情况下是一个演员,他扮演的是地下城主,并不真的是史努比狗狗。如果您真的想要一个能够体现真实创作者个性的人工智能,就需要付出额外努力,以确保人工智能不会表达出创作者不愿表达的内容。人工智能需要理解事物,并能够以创作者期望的方式表达,按照创作者所知道的方式。我认为,让这些化身表达自己并非难事。

我们的V1版本即将发布,随着Connect的推出,这个版本不久将会推向市场,而且随着时间的推移,将会有所改善。但多数情况下,我们仍在不断地为这些AI制作模型,以便它们变得更加丰富,但其可靠性或可预测性,我不能完全确定。因此,当你想要创建可以与你的社区交流的Lex助手AI时,你是在训练它们,而不是像编程普通计算机一样对其进行编程。你希望它们在一定范围内保持可预测性,即便它们可能不是完美的。因此,我认为这是我们需要为创作者明确的重点之一。

这也是为什么我认为,创建新角色实际上要比从头开始更为困难。所以我预计这可能会在明年某个时候发布,而不仅仅是今年。我们会尝试现有的角色、助手、游戏以及不同的个性,同时也会探索一些小企业的可能性。我认为这些今年都会准备就绪,并且我们基本上会在Connect发布后立即推出它。

我很高兴能够反思并告诉自己:“嘿,伙计,你可能需要停止说爸爸笑话了。”我认为,播客的想法、人工智能助手Lex的播客,甚至柯达头像的体验,都是一种全新的体验,仿佛是首次意识到自己的存在。这是一种超现实的体验,就像猿猴第一次照镜子时意识到:“哦,那就是你。”这种体验就像我第一次看到颜色,第一次以一种全新的方式看待世界。这是物理现实,但同时也是数字的,这种可能性让我大吃一惊,非常令人兴奋。

我经历了互联网前和互联网时代,体验了语音通讯、视频通讯的变化。你会觉得这有一个上限,但这种体验让我意识到可能并没有上限,可能会有物理现实和数字现实的结合,这就是未来。这是一种全新的生活方式,人们可能会抱怨互联网不是现实,但这种体验感觉真实,带有所有的缺陷。在设计新计算产品时,一个重要方面是它们应该是物理的。

电脑、电视、手机等设备都有一个共同问题,虽然你可以在不同地方与它们互动,但它们基本上让人静止。我们不应该一直坐着,我们需要四处走动,这是我们成为人的一部分。人类体验是一种物理体验,所以不仅仅是数字世界的沉浸式体验,而是将两者原生地整合在一起。我确实认为现实世界是物理和数字的结合,有太多的数字内容无法局限于一个小屏幕上,而物理世界同样重要。

因此,我们不应整天坐在办公桌前,我认为这是未来的发展方向。我希望世界能够以一种将物理和数字世界更加连贯地融合的方式运转。作为一个社会,我们需要解决一些困难的、哲学的甚至伦理的问题。

虚拟宇宙能够解锁我们在物质世界中无法体验的许多事物。问题是,虚拟宇宙中允许什么和不允许什么?在电子游戏中,我们允许各种疯狂的事情发生,但在物理现实中,这些行为很多都是非法的。那么界限在哪里呢?电子游戏和物理现实之间的灰色地带又在哪里?

确实,我们有内容政策等,限制人们能够创建的东西,但对于物理规则,我认为我们应该尽可能地创建一个自由的社会,这意味着人们可以自由行动,除非这会伤害到他人,侵犯他们的权利。在数字环境中,“伤害”的概念有所不同。在现实世界中,我们不会互相射击,因为这会造成真实的伤害。但在游戏中,这是一种有趣的互动,甚至是游戏的一部分。我们需要重新审视这个问题,物理世界中可能有害的行为在数字世界中可能就不再有害,因此数字世界的限制应该更少。然而,数字世界也可能出现新的伤害方式,如匿名性可能带来更多问题和有毒行为,这些都是我们需要解决的问题。

关于可接受的行为,我觉得应该从其可能导致的伤害程度来审视。不过,还有些问题并不仅与伤害程度相关,它们更多地涉及到可能发生的事和物理定律。例如,要见我本人,你需乘坐数小时的飞机。但若进入虚拟会议室并戴上头戴设备,我们能即刻感受彼此的存在,这突破了物理的束缚,我相信这将开启许多新的机遇。

我时常思考关于远程工作的话题。我觉得这使得我们即使身处不同地点,也能有身临其境的感觉。我期望人们将来能在他们心仪的任何地方工作,同时享有与现场工作相同的体验。我们目前主要依赖视频会议和其他基础技术,但我相信随着技术进步,这个理想会更接近实现。这将为人们提供在他们喜欢的地方生活的自由,同时仍然与同事保持紧密的联系,有助于塑造多元文化和加强彼此的信任。

真正的问题是,如果从未亲自见过对方,会产生哪些影响。思考这种技术所带来的所有潜在影响和风险是个巨大的挑战。我们希望能放大正面效果并缓解潜在问题。但实际上,这是一个逐步推进的过程,我们只能不断地观察它的发展和人们如何使用。

至于Llama 2,这确实是个具体的技术议题。我知道你最近发布了它,并觉得这周围发生的一切都很令人兴奋。关于你对Llama 2的发布有何感想?是否计划推出Llama 3?

记得上次播客中我们讨论过Llama 2的开源话题,我为我们最终做到了而感到自豪。我坚信,开源像Llama 2这样的模型的价值远大于其风险。我们经过了深入的评估和红队测试后决定发布Llama 2,看到大家如此热情地接受它真是激动人心。

关于Llama 3,我们一直在研究新模型。当前重点是将Llama 2集成到各种消费产品中,因为Llama 2本身不是一个最终的消费品,而是供人们构建应用的基础。我们正在微调Llama 2并创建基于它的消费品分支。当然,我们也在为未来的模型做训练,但目前没有新的消息可提供。和Llama 2一样,任何新版本的发布都需要经过深入的评估和讨论。

总之,感谢你开源了Llama 2并参与此次讨论。你为AI领域所做的透明化工作有助于我们开展更深入、有意义的对话。很有趣地看到如何将这些技术整合到个性化的AI系统中。当AI与人互动时,肯定会有一些有趣的失败例子。这可能会看起来很愚蠢,或者走到一个奇特的方向。但这也是我们共同学习和探索的过程,不是吗?

是的,在初始推出人工智能时,我们努力提供了多样的用例,仅仅是为了让人们尝试各种可能性,因为无法预知哪些会取得成功。人们会喜欢文本冒险游戏吗?他们是否更喜欢与善于插入笑话的喜剧演员对话,或者愿意与历史人物互动?我们为此塑造了简·奥斯汀和马可·奥勒留,而作为他们的狂热粉丝,我对这一切充满期待。我已与他们进行了对话。

的确,看到互联网上各种奇特反应,我为之击掌。这使我得以了解人们如何异想天开地构造模因,看到他们如何与之互动。在人工智能向全面智能化(AGI)迈进的初期,我认为,通过大规模使用和互动这些系统,我们能够更好地学习。

确实如此,这也是我们初步推出一组AI,同时开发名为AI Studio的平台的原因,它将允许任何人以用户生成内容(UGC)的方式创建自己的人工智能。我对这一切感到非常兴奋,因为除非整个社区都投入到创造过程中,我们才能真正看到AI的全部潜力。当然,实现这一点还需要我们做很多工作,所以我很高兴能分阶段进行。

我确信,没有人在做我们正在做的这些事情。有些人可能在做一些类似的虚拟角色类项目,但我们通过化身和表现力来构建这些项目,并使它们能够在各种应用程序间互动,拥有个人资料,能够在Instagram和Facebook上与人互动,这都是非常有趣的。

在与扎克伯格你的对话中,我一直感到惊讶,虽然你不在场,但给人的感觉却仿佛你就在这里。这让我经常忘记我们其实并不在同一空间。能够随时与生活中的任何人进行深度对话,就像现在通电话一样,将是一种全新体验,我认为我们甚至无法想象这将如何改变我们的生活。

这正是虚拟宇宙背后的众多理论之一,即给予人们与他人在一起的感觉。这是我一直在讨论的主题,但确实还有很多问题需要解决。从我的角度来看,我确实在这里,我们只是不在同一物理空间。但这并不意味着你没有与人工智能进行对话,对吧?

因此,我认为真正新颖的是通过技术传达一种近乎物理存在的感觉。虽然我们不在同一物理位置,但在其他方面都很真实。这引出了一个哲学问题,即现代现实世界的本质是什么?我认为,这不仅是物理世界和我们的存在感,还包括我们所拥有的日益丰富、强大和有能力的数字世界,以及在其中所创造的所有创新。

因此,我认为这是极为令人兴奋的,因为数字世界正日益壮大,拓宽了我们实现伟大壮举的可能性,然而物质世界的深刻却是不可忽视的。我们之所以成为人类,很大程度上是因为我们存在于物质世界。因此,我认为我们不应逃避这一事实,而是沉浸于屏幕之中。这也是我如此热衷于帮助塑造和加速未来计算平台发展的原因之一。我深感这是一项强大的力量。尽管现阶段我们还停留在使用头戴式设备的层面,我坚信这将成为至今最具人性化和社交性的计算平台,这也是我如此兴奋的原因。

是的,我认为,只要我们能够紧紧抓住现实的不断变化的本质,就如同抓住真实的事物一样,我们也许能够将其引向某种意识层面。因此,真实的不仅仅是主观体验,也与我们所处的物理空间有关。我们的感觉就好像我们处于同一个物理空间中。这种有意识的体验,或许就是真实的定义。时空并非如其物理学属性所表现的那样,就好像我们超越了物理学,转而关注于意识,这才是真实的,不论我脑海中怎样思考。

然而,伴随着这种过去仅限于身体存在的经历,确实存在许多社会和心理层面的因素,不是吗?我认为这其中蕴含着亲密、信任和一定程度的沟通,因为许多沟通是非言语的,基于你的表达方式,在这样的环境中,你正在与人分享。在这些变得可能之前,若我乘飞机飞往奥斯汀与你坐在同一地方,我想,我们实际上是在以更便捷的方式应对物理法则,传递社会情感。能够身临其境地感受到与他人的共融,我认为这对全球人类来说都是巨大的利好。我赞同你的看法,认为这将是一件具有深远意义的事务。这也正是虚拟宇宙所承诺的,是我认为我们正在探索的下一个前沿领域的原因。

当我开始研究社交网络时,它们主要基于文本,如Facebook的早期版本,仅包含个人资料和一张照片,其余的则是用户的兴趣列表。随后,我们进入了以照片为主的阶段。现在,我们正处于大多数内容以视频形式呈现的时代,但随着时间的推移,展现出一种明显趋势,即我们表达自我和获取对周围世界的洞察的方式正变得越来越丰富多彩和生动。

从我的角度看,能够与周围的人,或者与我们关心的人一起沉浸并感受存在,显然是下一个前沿领域。这在技术上是非常具有挑战性的,不是吗?实现这一目标需要构建新的计算平台和全新的软件堆栈。但我觉得,这正是我们作为公司应该去做的事情。

我真的很欣赏你们通过对话建立的联系。对我而言,这种照片写实主义确实非常令人兴奋。我对这个未来充满了期待。感谢你们为此做出的努力。同时,我也要感谢我遇到的杰出的Meta团队、工程师以及我在这里接触到的每一个人。感谢你们共同建设这个未来。

感谢你,马克,与我在虚拟宇宙中进行交流。这真的让我震惊。我几乎无法言表。我真的很想不断地测量我的心率。如果你现在真的就像坐在海滩上一样,那真是太有趣了。我并不在海滩上,我在会议室里。好吧,我确实在海滩上,而且没穿裤子。对于在物理空间中看到我的人,我真的很抱歉。无论如何,非常感谢你今天的发言。这确实让我震惊。这是我一生中最不可思议的经历之一。

所以,感谢你带给我这样的体验。真是太棒了。很高兴能与你交流,而且对话总是如此有趣。好的,希望不久后能再次与你交流。再见了。回头见。

这真是太棒了,伙计们。这实在是太神奇了。