AIGC向何处狂飙?

雾里寻你
预计阅读时长 25 分钟
位置: 首页 技术前沿 正文

精彩导读:

  2023年2月9日晚,由守业邦以及XR产业投资同盟独特举行的“‘兔’飞猛进,将来可期——守业邦开年直播特辑”正式启动。  本次专场将针对于2023年最热投资趋向,启动“XR&AIGC专场”。并约请到高通创投中国区...下面就跟着背时财经一起来了解【AIGC向何处狂飙?】相关的内容吧!

  2023年2月9日晚,由守业邦以及XR产业投资同盟独特举行的“‘兔’飞猛进,将来可期——守业邦开年直播特辑”正式启动。

  本次专场将针对于2023年最热投资趋向,启动“XR&AIGC专场”。并约请到高通创投中国区董事总经理、高通全世界副总裁沈劲,启明创投合伙人周志峰,蓝驰创投合伙人曹巍现场连线,从创投角度深刻讨论XR与AIGC的倒退现状以及投资思绪。

  启明创投合伙人周志峰在《AIGC向何处狂飙》的主题演讲中示意,GPT⑶每1做1次训练预估要460万美元。这几周爆火的CHATGPT,其1次训练的本钱也是100多万美元。将来怎样处理算力本钱问题?英伟达被美国政府限度向中国进口两代旗舰高算力芯片A100以及H100。国产的高机能AI芯片能否在超大范围预训练模型的训练中施展作用,何时可以施展作用,是否可以知足大范围集群的算力、互联带宽、算法适配以及协同的需要,能不能升高本钱?都是值患上咱们去察看的。

下列为演讲全文:

  我是启明创投的周志峰,2023-02-15 的分享主题是《2023年AIGC向何处狂飙》。大家1看这个名字也知道,《狂飙》是1个大热门,同时此外1个热门就是生成式人工智能的范例之1ChatGPT。

  我但愿从投资以及守业的角度,跟大家分享生成式AI和违后的技术以及产业倒退情况。

  过来10年,启明创投1直是国际无比活泼地布局人工智能的投资机构,咱们投资了良多AI公司,也已经经在人工智能生成式技术以及超大范围预训练模型技术上实现布局。其实过来1两个月里,媒体、投资机构、征询公司都分享了良多对于AI大模型的观念,启明创投以为,AIGC把人工智能技术带向了1个新的高度,是人工智能倒退进程中1个无比首要的拐点。

  这1波的AI或者者AIGC的群众热潮是自2022年的夏天,从图文生成模型开始的。这是我用两个全世界最流行的文字到图象生成模型-Midjourney以及Stable Diffusion,生成我本人的各种各样作风的头像图。

  近1两个月,生成式AI的次要热门,就是基于对于话生成的ChatGPT大型言语模型。为了守业邦的这个开年直播,我向ChatGPT发问,让它帮我写了1段演讲开场白。这个进程中,我没有做任何的额定训练或者微调,确切写患上无比流利,也无比相符直播的主题。

  假如下1次还有这样的直播机会,我感觉我可让AI学习1下我之前的报告、发言等音频数据,融入守业邦直播的特色,用机器来分解出我的声响,用Stable Diffusion模型生成配合直播主题的我的虚构面貌,用CLIP模型以及StyleGAN模型把单帧图片扩大到完全的视频流,并且同步我的情绪、口型、手势、表情等等,而后用NeRF模型将我的虚构人以及空间违景分解。

  制造出这样1整套AI生成视频流,我其实就不需求真实的呈现在镜头前。最近几年减速倒退的AI生成技术让咱们真正觉得美妙将来可期,这与10年前有着微小的模式转变。

  过来10年,AI企业次要集中辨别式AI的畛域。咱们耳熟能详的AI企业以及其外围技术,如图象辨认、人脸辨认或者语音辨认等,都是依据输出进行剖析以及断定。

  但2023-02-15 咱们看到的这些则是生成式AI,依据输出可以生玉成新的内容。从辨别式AI到生成式AI,这是技术的1个很大的奔腾。

  所以咱们以为,2022年确切是AI技术倒退进程中,星光灿烂的1年,它标记着AI技术倒退达到了1个无比症结的拐点。

  从产业界的角度看,我查问了GitHub开源社区的数据,在去年文字到图片生成模型Stable Diffusion模型公布后,短短90天内,其开发者的认可度超过了3万次,但比特币Bitcoin以及以太坊Ethereum的底层开源技术,则是用了8年的时间,才到达3万次的认可,这阐明Stable Diffusion的开发者驳回速度远超其余技术。

  回望技术倒退的历史,电话用了75年才到达1亿用户,手机用了16年,FACEBOOK用了4.5年,2011年推出的微信誉了14个月。ChatGPT仅仅用了两个月时间,就在全世界到达了1亿用户数,用户增长速度无比惊人。

  ChatGPT近期的火爆,不禁患上让咱们想起两3年前1个1样很火的利用Clubhouse,它是1个音频社交APP。它在2020年的年中上线,迅速积累了几千万的用户数,成立半年多,估值就到达了几10亿美元。然而在过来两年中,Clubhouse的用户的运用率降落了80%⑼0%。ChatGPT会不会也面临1样的问题,值患上咱们察看。

  看到这些爆炸式增长的产品,总让我不禁患上思考,在将来几年AI技术到底是会继续“烈火烹油,鲜花招锦”,仍是终究“落了片白茫茫大地真洁净”?这是1个无比值患上咱们去延续讨论以及关注的1个话题。

  接上去,我重点跟大家讲讲启明创投对于于生成式AI的了解。基于过来两年多的钻研,咱们画出了这样1张产业架构图。基于这张图我想跟大家分享1下怎样了解生成式AI和它违后的大模型在技术世界中的地位。

  在这个基础上,也聊聊生成式AI与过来10年上1代AI技术的区分。而后,从投资人的角度,讲讲哪些子畛域是更值患上关注的。也包含这些不同的子畛域如何可以树立长时间的竞争劣势,和生成式AI在咱们国度有哪些应战以及机会。

  咱们把整个生成式AI分红了3层。最底层称之为生成式AI的基础设施层。

  工具链指的就是可以匡助生成式AI和它违后的大模型去做减速、紧缩的软硬件技术,目的是在大模型进行训练的进程中,帮其晋升效力,升高本钱,和大模型在真正利用进程中更好地进行治理。工具链畛域,海内公司有AnyScale,中国有像潞晨科技、面壁智能等守业公司。

  右侧的智算平台,次要指的是为生成式AI技术提供基础算力的平台。这1畛域的介入者次要是科技大厂巨头。比如为Open AI提供了几亿美元算力的微软Azure,还有中国的阿里云、华为、曙光、浪潮等,都在中国各地建设了智算中心,外围是为AI提供底层算力。所以工具链与智算平台组成为了整个生成式AI的第1层。

  两头则是最首要的1层,我称为模型层,其中模型层又有3品种型。

  最左侧是闭源模型,美国的人工智能钻研机构Open AI从GPT3模型之后,再也不公然源代码以及模型权重,而是把它的技术封装成效劳,即容许用户调用其API,享用其AI才能。Open AI本人担任1切大模型的训练、推理,1直迭代。Open AI对于外提供已经经封装好的AI才能,第3方公司乃至是集体均可以调用。另外还有Cohere、Anthropic,Anthropic刚刚成立两周,就拿到了谷歌4亿美元的投资。

  国际的代表企业,包含启明创投投资的智谱AI。智谱AI是跟清华大学、北京智源人工智能钻研院等1些第3方机构协作,训练了几个千亿或者万亿级别参数的大模型。包含最新推出的GLM⑴30B,这是1个1300亿参数的超大范围预训练模型。是国际大模型畛域中,倒退比拟快的1家公司。另外,百度推出了文心大模型,它对于外也是提供API,供第3方去调用运用。

  本图由智谱AI结合主题生成

  两头这个叫做开源模型及Model Hub,能够了解为大模型的技术社区。它无数10万个开源预训练模型供第3方开发者运用,并且不但开源代码以及模型权重,还提供了良多辅佐开发工具、数据集等,相似于1个开源社区的商业模式。

  美国那边起步比拟早是Hugging Face,阿里云近期也公布了Model Scope。

  最右侧的是从自建模型到开发利用的端到端模式,指的是科技公司或者守业企业针对于1些特定的畛域,自行实现寄出模型的开发,再针对于指标市场以及利用,进行模型、常识、以及数据的特定优化,并开收回间接交付给用户的利用产品。比如国外的Adept、Runway,国际的澜舟科技,聆心智能,还有启明创投投资的无穷光年,针对于医疗畛域做本人的模型以及利用。

  第3层是利用层。这些利用,依赖于第2层底座模型进行开发,这些利用公司不需求构建AI模型的才能,只要要调用第2层底座模型的效劳,专1于本人的用户以及场景,把利用做好就行。

  比如Jasper AI,它是1个应用Open AI的才能,给广告主提供营销案牍生成的企业,在过来两年倒退无比快。去年,Jasper有将近1亿美元的支出。但它的AI才能其实不是本人开发的,而是由第2层底座模型提供的。

  启明创投投资的Gemsouls是1个应用Open AI大模型才能,做聊天机器人的企业。

  这是咱们对于生成式AI生态的了解。把这个生态了解分明了,就很容易看到生成式AI的将来。我尤其喜欢北京智源人工智能钻研院理事长张宏江博士说过的1个比喻,他感觉,过来的AI更多的是“大练模型“,也就是说每1家科技公司都是各自独立研发公用小模型。比如人工智能4小龙,根本上是从零开始自建模型,而后自建模型之上的特定利用。

  2023-02-15 这1代的AI技术,叫做“练大模型”,底座模型是由某些特定的机构研收回超大范围的通用模型。这个模型再也不是针对于某1个专门利用开发的,它的训练数据是互联网上可以看到的1切数据,数据也不需求做尤其的标注,训练也不需求监视,做进去的是通用人工智能才能,而后第3方基于底座模型,针对于千万个利用场景去开发软件。

  这是1个从“大练模型”到“练大模型”的范式转变,我感觉,这个范式转变对于AI将来10年、210年的倒退有严重意义。

  咱们以为,2023-02-15 AI生成大模型是1个更先进的算法架构,集中了人类的全体数据,会集大量算力,粗放化训练,训练进去的AI才能供给1切用户运用,这其实才是10几年前AI业内专家所假想的那样,AI必定会成为相似“水电煤”1样的人类的公共资源。只有这样能力做到AI技术赋能万业。

  哪些模块是启明创投以为更拥有投资以及守业价值的畛域?智算平台更合适有范围效应,如已经有的私有云平台,或者者数据中心经营方参与,不是守业公司合适进入的畛域。

  工具链跟着大模型延续倒退迭代,用更好的工具去匡助大模型的训练以及治理去降本增效,必定是无机会的,且会有1些顶级AI工程人材1直进入,我感觉这确定是1个很规范的VC投资机会。

  在闭源模型及API效劳畛域,将来确定也会看到愈来愈多科技大厂进入,是否还有守业公司进入的机会,我感觉值患上张望,由于这对于于人材密度的请求以及资本的投入是微小的。我前段时间跟几位中国AI行业顶级钻研人材聊,他们以为,目前中国真正掌握大模型架构才能的人,可能也就100多人。

  所以,假如有人进去守业,那确定也就是100多人中的1部份,其违后可提供的顶级人材基数其实不是很大。

  此外,训练大模型需求良多的资本投入。跟大家举个例子,Open AI的GPT3模型是用了Nvidia的上千张旗舰级GPU芯片A100,用了大略120天的训练周期,2年前训练1主要460万美元。GPT3训练的共投入到达了数千万美元。

  这是1个微小的投入,每1做1次训练,研发人员承当着几百万到上千万的本钱,假如训练后果不能收敛,失败了,几百万就打水漂了。它象征着,只有顶级的人材,才具有这类顶级资本的帮持,能力去做这件事。

  应用第3方的底座模型构建利用的方式,我感觉是将来的次要趋向,置信会有不计其数家守业公司涌入这个市场。对于于守业者而言,他们对于某1个场景或者者行业无比懂且有超越业界的认知,他们看到了生成式AI的才能,2者结合去推翻这个场景或者行业。不用从头构建AI才能,只要要间接应用这些底座模型。

  某些特定的畛域、行业、场景,可能会有1些守业者选择从头做,自建模型及利用,端到端进行尤其优化,我感觉也是无机会的。因而,以上这几块是咱们以为,生成式AI从守业投资角度来说最无机会的畛域。

  公司怎么发明1个长时间的、耐久的竞争劣势,树立护城河?

  比如,应用第3方底座模型构建利用,那末你在AI层面是没有任何竞争劣势的,由于你能够去调用Open AI,其余竞争对于手也能够。那末,你长时间存在的护城河究竟是甚么?我感觉这是无比值患上去想分明的,由于过来的34个月中,我看到了中国有上百个团队进入这个畛域,这也是每1次跟他们讨论时会去问的问题,但愿可以听到1些更深刻的思考。

  自建模型的利用,针对于某1个场景利用优化本人的模型,而后把利用层也做起来。这个听起来无比有情理,但大模型机构用上亿元的代价去训练以及迭代模型,他们的模型的先进性会不会比你要更强?有其余人应用先进模型构建与你同1畛域的利用时,你的自建模型利用要如何走患上更远?这些都是没有谜底的问题,都是值患上守业者去思考的问题。

  最初,关于中国在生成式AI以及底座大模型的1些应战。

  我感觉,首先是算力问题。我后面讲到,GPT⑶每1做1次新的训练要460万美元。

  这几周最火的ChatGPT,其1次训练的本钱也是100多万美元。咱们投资的智谱AI已经经把这个训练本钱升高到几百万元人民币,但仍然无比贵。将来怎样处理算力本钱问题?特别是这些大模型,过来都是用的Nvidia的旗舰芯片做训练以及推理,然而自从去年10月之后,A100以及H100等高机能芯片对于中国有了进口限度。咱们怎样用国产的AI芯片进行替换,并升高本钱?国产的AI芯片是否可以、何时可以知足大范围集群的算力、互联带宽、算法适配以及协同的需要,都是值患上咱们去察看的。

  第2个,过来1周良多人说国际的科技大厂以及守业公司推出的大模型与ChatGPT是有代际差异的,咱们后进了至少1代。在看Open AI的倒退时会发现,ChatGPT也好、GPT⑶也好,是需求很长期研发累积的。

  Open AI是2015年年底成立的,2018年推出了第1代GPT⑴,过后包含中国在内的全世界大部份企业以及机构还在做Bert方向的尝试,是有必定区分的。2019年,它推出了GPT⑵,有15亿参数,2020年推出了GPT⑶,有了1750亿参数。Open AI已经经累积了这么多年才到达2023-02-15 的才能,中国企业要去追逐,确定是需求时间的。GPT⑷往年又要公布了,是不是会把咱们甩出两个代际的差距,这也是值患上察看的。

  中国在大模型的研发上,需求给本人更多的时间倒退,能力够渐渐地到达全世界抢先程度。

  第3点,更首要的是,由于GPT大模型倒退的比拟早,并且已经经向世界展现出它的才能,所以它已经经在渐渐构成本人的生态,有600多家守业公司在间接应用Open AI GPT⑶模型来构建本人的利用。

  包含1些比拟着名的科技公司,比如微软上个月宣告,从搜寻引擎到Office等1切产品,都会片面拥抱GPT⑶的AI才能。在线文档Notion也已经经在产品中植入了生成式AI的才能。

  缭绕着Open AI或者者东方科技大厂的大模型已经经构建出了1个初步的生态,国际科技大厂或者者守业公司的大模型在技术以及工程上,有良多之处需求1直追逐,假如只是训练出大模型,没有人去用,缺乏完全生态,也是没有任何意义的。

  最初,我仍是无比坚决地看好生成式AI以及大模型,它的呈现标记着1个微小的AI开发范式的转换,将会真实的被应用到更多利用场景。但如今也处于科技的炒作周期,叠加了良多情绪以及等待,1位美国AI研发人员说,ignore the hype cycle, build boring business,疏忽这类短暂的炒作周期,而是去树立无聊生意。

  真实的AI才能表现,其实不仅仅局限于作画、对于话聊天这些看起来很好玩的畛域。AI对于人类的意义,是走进各行各业,融入现有产业的工作流,并且提供更高的商业价值,它远比咱们2023-02-15 看到的1些示范性的To C利用更有价值。但要把AI这类才能利用到良多产业中去,实际上是1件很“无聊”的事件,不但需求AI大模型才能,也需求踏塌实实的长期投入,去以及产业做结合。

  但愿看到这个直播的守业者,可以对于生成式AI有足够信念,同时还需求良多的耐烦,应用技术踏塌实实构建To B的产业利用,这才是对于咱们人类社会最有价值的奉献。

  所以,AI技术又上了1个台阶,这件事儿已经经没有甚么疑难了,尤其等待可以看到中国有更多钻研人员、产业界从业者,和守业投资机构1起致力,应用AI技术的提高,真正带给人类更大的福祉。

  以上就是我的分享,谢谢大家。

以上内容是由背时财经作者整理的关于“AIGC向何处狂飙?”的相关内容,希望对您有所帮助!

本文来自投稿,不代表本站立场,如若转载,请注明出处:
-- 展开阅读全文 --
头像
融资丨「Share,Creators」实现新1轮五00万美元融资,5源资本以及福昕PDF投资
« 上一篇 2023-02-15
江苏海润城发拟发行一0.六0亿元超短时间融资券,期限为二七0天
下一篇 » 2023-02-15
取消
微信二维码
支付宝二维码

发表评论

暂无评论,7986人围观

动态快讯

热门文章

1
2
4
6

最近发表

标签列表

目录[+]