十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
ChatGPT是OpenAI开发的大型预训练语言模型。这是GPT-3模型的一个变体,经过训练可以在对话中生成类似人类的文本响应。
创新互联-专业网站定制、快速模板网站建设、高性价比东平网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式东平网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖东平地区。费用合理售后完善,10年实体公司更值得信赖。
ChatGPT背后的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。ChatGPT可用于创建能与用户进行对话的聊天机器人。这对客户服务很有用,因为它提供了有用的信息或只是为了好玩。
ChatGPT使用方法和注意事项:
支持中文和英文,都可以问,它不是Siri这种机器人,他是一种生产力的工具,要把它当作真实的人来对话,可以让它改进,支持上下文多轮对话,放心大胆的问,每次回答的字数有应该有限制,可以使用“继续问”等来追问,它会继续写。
AI届已经进入新的范式,学会提问题会越来越重要
ChatGPT其实并没有创新性可言,其出圈的关键在于选对了落脚点。也有人认为,市场对于ChatGPT过于乐观了。
为此,本次CNMO推出了“聊聊ChatGPT”系列专题,旨在让大家更好、更全面地了解ChatGPT,而本文,要跟大家聊的是“这些行业会搭上顺风车”。
ChatGPT本质上是一个对话模型,主要以文字方式互动,不仅可以通过人与人自然对话的方式进行交互外,还可以处理相对复杂的语言,可以完成包括自动文本生成、自动问答等在内的多种任务。ChatGPT亮相以来,被广泛应用在了聊天机器人、编写和调试计算机程序、文学相关领域的创作,更有甚者还用来写论文。可以看出,ChatGPT对各行各业都有所影响,那么哪些行业能抱上这根“大腿”呢?
ChatGPT让AI行业生机勃勃,在一定程度上也带动了自动驾驶行业、金融行业、翻译行业等发展。自动驾驶行业:毫末智行CEO顾维灏认为,ChatGPT的技术思路和自动驾驶认知决策的思路是不谋而合。他提出了人驾自监督认知大模型,让自动驾驶系统从人类反馈中学会选择和辨别,并稳定地输出最优解。
如果将ChatGPT作为车机系统,可为车辆提供语音识别、语音合成、对话处理等功能。目前汽车行业中较成熟的语音交互解决方案,识别率可以达到90%以上,但与ChatGPT相比还是差距过大。如果想让系统理解我们说的话,就得运用到NLP(自然语言处理)技术,而ChatGPT目前是自然语言类的天花板。如果将ChatGPT用于车机系统,一方面可以让车机更容易理解“长难句”,让驾驶更具趣味性
金融行业:招商银行此前发布了一篇名为《亲情信用卡温暖上市,ChatGPT首次诠释“人生逆旅,亲情无价”》的推文,被认为是金融行业首次尝试与ChatGPT搭档生产的宣传稿件。ChatGPT背后的“金主”——微软,曾在发布会上演示了全新功能——财报分析。微软在Edge浏览器打开了GAP公司15页的三季度财报PDF,利用ChatGPT实时总结核心点,并于Lululemon三季度财报做对比,各项指标对比结果飞速呈现。可以预见,ChatGPT如果用于金融领域,可以极大提高效率,减少出错。
翻译行业:随着全球化的加深,企业和个人越来越需要在全球范围内进行业务,这将导致对翻译和本地化服务的需求增加。ChatGPT在翻译行业属实“专业对口”,一来可以减少翻译人员的工作量,提高翻译效率;二来可以学习翻译历史数据,在此基础上生成翻译,改善翻译质量;三来由于ChatGPT可以自动完成翻译,可以降低翻译公司的人力成本。
ChatGPT的未来
ChatGPT的优势在于,可以做到用人们能理解的方式解释概念、传递事实,甚至还有“自己的想法”,但也存在着局限性。由于ChatGPT的能力上限是由奖励模型决定的,需要大量的语料来拟合真实世界,因此可能会出现“创造不存在的知识”等低级错误。
ChatGPT的发展离不开技术的应用和商业化,必须先聚焦于资源、资金高度集中和技术应用性强的特定领域。例如应用于实现自动化办公,由于需求量大,或许可能成为技术应用首先发展的领域。
近日,一年一度的英伟达 GTC 大会再度拉开帷幕。穿着标志性皮夹克的「AI 黄仁勋」向开发者介绍了英伟达在硬件和 AI 领域最新的进展。
年初的 CES 刚刚过去,对于英伟达来说,短时间就要拿出很多新的东西,挑战不小。但是从 CES 到现在,短短 3 个月里,全球 AI 领域发生了翻天覆地的变化,这也成了英伟达的新契机。
AI的 「iPhone 时刻」
「AI 的『iPhone 时刻』已经到来」,老黄这样形容最近 AI 行业的「大事件」。
2016年8月,黄仁勋将当年全球第一台 AI 超算捐给了 OpenAI。6年多后,OpenAI 带着 ChatGPT搅动了整个地球。大量的新型创业公司希望借助于这股东风来颠覆既有的传统商业模式,而许多传统的科技巨头也在纷纷拥抱 AI,来维系自己的领先地位。
在 2023GTC 大会上,英伟达宣布了将和谷歌云、微软 Azure、甲骨文云联手推出 DGX 云服务。ChatGPT 将从目前使用的 A100 GPU 升级到使用微软 Azure 超级计算机用上 H100,理论上回复速度将快 10 倍。
毫无疑问,ChatGPT 将会引发新一轮的人工智能革命,其对整个汽车行业也会产生深远的影响。ChatGPT 模型也将逐渐从人机沟通逐步赋能包括自动驾驶在内的智能网联系统的各个环节。在百度推出「中国版 ChatGPT」的「文心一言」后,吸引了包括集度、长安、吉利、长城、东风日产、零跑等车企纷纷抛来合作的橄榄枝。
而在 ChatGPT 以及其他一众 AI 大模型技术的背后,都离不开英伟达在算力层面的大力支持。自从英伟达向 OpenAI 交付首台 DGX 超级计算机后,目前台 DGX 超级计算机已经成为市场上最主流的产品。最新 DGX 超级计算机的核心,是英伟达的 8 块 H100 模组。当 ChatGPT 这样的 AI 工具逐步渗透车企之后,最大的赢家之一依然会是英伟达。
联想 x 英伟达,汽车行业新亮点?
对于英伟达来说,在这次 GTC 上,和车企的合作,尤其是自动驾驶领域着墨不多。但这并不影响未来汽车领域的业务会成为英伟达的一个快速增长的新引擎。
作为如今全球可以和特斯拉齐平、最为炙手可热的新能源车企之一,比亚迪与英伟达进一步扩大合作当消息得到了官宣。比亚迪的下一代王朝系列和海洋系列中的多款车型都将使用英伟达 DRIVE Orin 高性能计算平台。其中,在今年二季度,比亚迪首款采用英伟达芯片且搭载了激光雷达的车型就将上市。
在王传福看来,作为新能源汽车的上半场,比亚迪在电动化方面凭借刀片电池赚得盆满钵满;而在新能源汽车的下半场,比亚迪选择了英伟达作为智能化方面的最重要合作伙伴之一,也是希望在芯片算力层面,能够走在市场的最前列。除了 Drive Orin 平台之外,在今年 1 月份的 CES 展上,比亚迪也作为首批合作企业,将落地英伟达旗下 GeForce NOW 云游戏服务计划。而后者也是英伟达进军智能座舱市场的最新布局。
不过让我们惊讶的是,联想成为首家采用英伟达新的自动驾驶域控制器的一级制造商,在不远的未来,其域控制器将采用英伟达的 SoC 芯片。
对于联想这样从事电脑服务器的硬件公司,进军智能电动车的高算力中央计算平台,既在意料之外,也是情理之中。对于联想来说,布局智能座舱、智能驾驶和中央计算平台等领域是对现有技术和产品的延伸,虽然会面临一定的困难,但是联想并不是从零开始,过往的技术积累可以发挥不小的作用。众所周知,联想一直没有涉足芯片领域,因此引入英伟达的雷神芯片将帮助联想补齐最重要的一块短板。
根据英伟达的介绍,雷神这款 SoC 芯片内部拥有 770 亿个晶体管,可以实现 2000 TOPS 的 AI 算力,或者是 2000 TFLOPs,其在算力上不仅已经远远超过了满足高等级自动驾驶的需要,已经完全有能力承担起汽车高算力中央计算平台的重任。这款芯片将在 2025 年大规模量产,而这个也和联想在 2025 年推出高算力的中央计算平台的时间表相吻合。
在此之前,联想会推出算力达到 32TOPS 的行泊一体方案,而这也是目前被不少国内车企,尤其是在低成本车型上广泛应用的驾驶辅助解决方案,市场前景较为看好。
不过对于国内汽车领域来说,已经有不少像联想这样的跨界玩家入局,甚至已经上车量产;对于联想来说,除了首发英伟达自动驾驶域控制器的一级制造商的先发优势外,还有哪些优势能让它赢得市场,还是未知数。
Omniverse,英伟达征战车圈的新工具
在汽车行业,英伟达的触角不仅仅是提供自动驾驶算力平台以及中央计算平台,其早已经将目光投向了汽车零部件的设计以及整车制造领域。通过赋能汽车行业的虚拟制造和虚拟工厂,英伟达希望让汽车设计和生产的数字化进程再上一个新的台阶。
在过去几十年里,CATIA、UG 这些软件已经成为工程师必不可少的助手。整车企业使用这些虚拟仿真软件,通过数字化模拟的手段提前对后期的成品进行预览的方法来进行前期的零部件设计以及整车的总布置工作。如果没有前期的虚拟仿真,后期重新设计不仅成本较高,而且很有可能造成项目的时间节点的延误。
但最近十多年来,这些软件都没有突破性的革命成为席卷全球的 AI 浪潮的「法外之地」,没有能够对整车企业的零部件设计提供更大的帮助。
为此,英伟达打造了 Omniverse,它说到底是一个虚拟世界仿真引擎,不仅可以精确反映真实的物理世界,同时也能够遵守物理学定理。所以 Omniverse 不仅能够在前期验证零部件与整车的装配关系,避免后期的包括动态干涉在内的各种装配上的问题,同时也能指导工厂设计,并帮助整车企业对工厂布局进行持续优化。
对于绝大部分希望全面转型电动车的传统车企来说,工厂的改造任务非常繁重。前期虚拟阶段验证地越充分,后期实际占用工厂时间就会越少,而节约出来的时间就可以被用来进行生产。
根据 GTC 现场黄仁勋的介绍,宝马时下正在使用 Omniverse 来对全球 30 家工厂的运营进行规划。在每座工厂正式投入量产前两年,宝马就会使用 Omniverse 模拟建造一座完整的虚拟工厂,并进行持续的调整和优化,以此避免后期工厂建设完毕之后再进行比较大规模的调整,进而影响生产。
宝马之外,包括沃尔沃、通用汽车、奔驰、捷豹路虎、Lotus、丰田等都已经是英伟达 Omniverse 的用户。
从某种程度上来说,未来英伟达很有可能利用自己的优势地位来逐步取代我们熟悉的 CATITA 和 UG,成为整车企业的数字化设计工具。而这个所能撬动的,同样是一个体量巨大且前景非常可观的市场。
最后
「生成式 AI 正在推动 AI 的快速应用,并重塑无数行业。」 在 ChatGPT 之后,相信没有人再会去怀疑这句话。汽车行业只是英伟达当前涉足的一个产业而已,可能深深埋藏在老黄心底的,是让 AI 去赋能整个社会的方方面面,以此来推动全世界科技的进步和产业发展的梦想。
AI 的「iPhone 时刻」,也正是英伟达「核弹发射」的时刻。
【本文来自易车号作者GeekCar极客汽车,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
百度文心一言是每日更新的一句古诗词,旨在激发读者的思考,增强文人文魂。我期待文心一言能够带给我更多美好的文学体验,更深刻的文化意境,以及更多有趣的历史故事。
进入3月中旬,全球科技巨头再次竞相亮相大语言模型赛道。
一周之内,开发出ChatGPT的美国初创公司OpenAI,对OpenAI投入巨资的科技巨头微软,以及中国互联网龙头企业百度,相继发布了在大语言模型(LLM)领域的最新动态。这也再次引发了全球对该领域的关注。
当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4,它比GPT-3.5的问答质量和技术都有明显提升。
3月16日下午,百度开启新一代大语言模型、生成式AI产品文心一言测试,从而成为第一家加入该赛道竞争的中国企业。
在发布会现场,百度创始人、董事长兼首席执行官李彦宏通过问答的形式,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。几个小时后,微软宣布,将把GPT-4接入Office全家桶,新名为“Microsoft 365 Copilot”。
正如财经E法在2月17日发布的文章(OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?)所述,中国内地和中国香港的手机号均无法注册ChatGPT账号。此外,虽然OpenAI的应用程序编程接口(API)已向161个国家和地区开放,但不包括中国内地和中国香港。
一方面,业界普遍关注,在AIGC(生成式人工智能)势不可挡的科技浪潮中,谁将成为下一个弄潮儿?另一方面,在中美科技竞合的敏感期,各方亦颇为关注百度迈出的第一步带来的涟漪,以及中国企业该如何应对。
01“真的ready了吗?”
3月16日,李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问,“最近一段时间,很多朋友问我,为什么是今天,你们真的ready了吗”?
李彦宏的回答是,虽然百度已投入AI研究十多年,为发布文心一言做了充分准备,但“不能说完全ready了”,因为文心一言对标ChatGPT、甚至是GPT-4,门槛很高,还“有很多不完美的地方”。但他强调“一旦有了真实的人类反馈,文心一言的进步速度会非常快”。
李彦宏解释,之所以选择当天发布,是因为市场有需求:客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。
如何理解李彦宏所言的“对标GPT-4的门槛很高”?
当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4。值得注意的是,GPT-4是大型的多模态模型,即能够接受图像和文本类型的输入。而GPT-3.5只能接受文本输入。
在演示视频中,OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图,并将图片输入GPT-4。仅1到2秒后,GPT-4就生成了网页代码,制作出了与草图高度相似的网站。根据OpenAI发布的实验数据, GPT-4模型相较前一代GPT-3.5已取得了巨大的进步,在许多专业测试中表现出超过绝大多数人类的水平。
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,文心一言未来还有待全面开放来获得用户检验。无论是通过B端API还是直接向C端用户开放,用户体验口碑都是硬道理。当前ChatGPT没对中国用户开放,在国内市场,百度将获得先发优势。
对OpenAI和百度的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示,GPT系列大模型,包括GPT-4与文心一言本质上都是同一类产品,只是它们各自的数据覆盖范畴和数据模型的积累长短不一。从短期看,OpenAI的产品准备时间相对更加充足,智能程度暂时领先一些。但是对文心一言而言,能在这么短的时间内训练出这样的一个产品,也是非常了不起的。
同时,张毅也对百度做出更好产品更有信心,他的理由是,从人工智能、大数据、大模型的人才储备来看,中国会更有优势。
中央财经大学数字经济融合创新发展中心主任陈端则认为,与海外竞争对手相比,百度最大的优势是立足本土,构建了语言和文化层面理解的护城河。
作为中国公司研发的大语言模型产品,文心一言的中文理解能力备受关注。重要原因是,此前很多评论人士认为,ChatGPT的中文问答能力不如英文问答能力强。
李彦宏表示,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”创作了一首藏头诗。
李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。
受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。
法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。
此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。
受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。
法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。
此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。
发布会前后,百度的股价经历了大落大起。3月16日,港股百度盘中股价跌幅一度扩大超10%,报120.1港元。截至收盘,百度股价跌幅为6.36%,报125.1港元。但百度股价在美股势头强劲,当日百度美股开盘低开高走,振幅超7%。截至收盘,报138.16美元,涨幅为3.8%。3月17日,百度港股表现强势,盘中一度大涨超15%。截至当日收盘,百度港股涨幅为13.67%,报142.2港元。
文心一言宣布开启邀请测试一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。
文心一言的市场热度持续飙升,资本市场也给予了价值重估。张毅认为,这也代表了公众对大语言模型/生成式AI “既期待,又担忧,然后是希望”的心情。
02谁都不能错过的科技革命
事实上,“真的ready了吗?”并不仅针对百度,也是伴随此轮“ChatGPT”热潮以来,公众普遍的疑问。
李彦宏观察到,从2021年开始,人工智能技术开始从“判别式”向“生成式”转变。
创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示,AI 2.0时代的第一个现象级应用,就是以GPT-4为代表的AIGC,又称生成式AI(Generative AI)。李开复表示,AI2.0 是绝对不能错过的一次革命,它将会是一个巨大的平台性机会,这个机会将比移动互联网大十倍。他还表示,AI 2.0也是中国在AI领域的第一次平台角逐机会。
受访专家普遍认为,此前全世界的AI企业都遇到了一个极大的问题:即使技术储备十分丰富,AI应用并没有给它们带来丰厚的收益。造成这一问题的原因在于,AI产品的应用主要集中在B端(企业用户)和G端(政府用户),AI产品在进入企业或机构时往往流程复杂,这在某种程度上会限制AI产品在市场上的快速扩张。
因此,张毅认为,AIGC的产品应用方向在C端更有可能产生巨大的商业机会。他分析说,在美国市场,此前C端市场被谷歌、亚马逊、Meta等企业抢占,让微软压力非常大,更需要一款产品来扳回一局。在中国市场,百度的优势和谷歌一样,都有强大的搜索引擎对数据的抓取能力,以及储存、整理、分析能力的基础。中国本身拥有十几亿人口的巨大市场,百度完全可以做得很优秀。
“百度和微软、谷歌本质上是两个不同市场的竞争,所以我相信文心一言以及系列产品也一定会跑出来。”张毅说。
李彦宏坚称,文心一言不是“中美科技对抗的工具”。但他也承认,ChatGPT 的成功,加快了百度推出该产品的进度。
百度CTO王海峰表示,人类进入AI时代,IT技术的技术栈可以分为四层:芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司,在各个层面都有领先业界的自研技术。例如,高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。王海峰认为,百度全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。
文心一言与ChatGPT一样,都使用了SFT(模型微调)、RLHF(从人类反馈中进行强化学习)以及Prompt(提示)作为底层技术。此外,文心一言还采用了知识增强、检索增强和对话增强技术。王海峰表示,这三项是百度已有技术优势的再创新。
陈端认为,在当前技术创新的集成性越来越高的当下,全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。
信心很重要,但差距无法忽视。
在本月初的两会期间,中国科技部部长王志刚在回应ChatGPT相关的问题时,用足球打比方,指出中国还有很多工作要做。“踢足球都是盘带、射门,但是要做到梅西(足坛巨星利昂内尔·梅西)那么好也不容易。”
王志刚指出,中国在这方面也作了很多布局,在该领域的研究也进行了很多年,并且有一些
成果,“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。
王志刚说,ChatGPT出来以后,引起了大家的关注。实际从技术本身源头来讲,它叫做NLP、NLU,也就是自然语言处理和自然语言理解。ChatGPT之所以引起关注,在于它作为一个大模型,有效结合了大数据、大算力、强算法,计算方法有进步。同样一种原理,做得有区别。比如大家都能做出发动机,但质量是有不同的。
然而,无论是ChatGPT还是文心一言,其背后的大语言模型是核心竞争力。北京大学王选计算机研究所研究员赵东岩告诉财经E法,国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。
一位科技系统人士则对财经E法指出,客观而言,中美目前在该领域的基础研究成果差距较大。这些基础研究成果包含自然语言处理(NLP)、数据库、GPU产品,“美国切断GPU芯片(的供应),(中国的)算力就跟不上”。
大型算力的核心在于高性能GPU芯片。北京航空航天大学软件学院助理教授周号益告诉财经E法,在GPU芯片等计算硬件上,中国与国际的差距在十年左右,硬件水平会严重制约大语言模型以及科学计算类模型的发展。
周号益认为,在技术和模型上,中国的科技公司与OpenAI并没有代差,差距仅在五年以内,在一些较小的技术领域差距只有2-3年。在数据采集方面,以GPT-3大模型为例,其训练的语料中中文只占5%,中国科技企业对中文语料的积累具有一定优势,因此极有可能在中文领域实现突破。
03巨头下一步:构建生态
对于以ChatGPT为代表的大语言模型赛道如何实现盈利,是各方公认的难题(ChatGPT爆火的冷思考:盈利难题与治理挑战)。
开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。而2023年1月,投资银行摩根士丹利(Morgan Stanley)的一份分析报告称,ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。
但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为,ChatGPT能带来多少盈利,并不是OpenAI关注的重点,重点是基于它的模型能长出什么样的服务和应用,从而构建起一个生态系统。“ChatGPT的发展需要一个产业生态,比如它和微软相关应用的融合就是很好的思路。”曹建峰说。
当地时间3月15日,微软副总裁兼消费者首席营销官余瑟夫·梅迪发文表示,新版必应搜索引擎已经在 GPT-4 上运行。另据OpenAI披露,GPT-4是在微软Azure AI 超级计算机上进行训练的,并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。
谷歌则宣布开放其大语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite。通过PaLM API 接口,开发者们可以将PaLM用于各种应用程序的开发。MakerSuite则可以让开发者快速对自己的想法进行原型设计,并且随着时间的推移,该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。
微软迅速跟进。当地时间3月16日,微软宣布将把GPT-4接入Office全家桶。新功能名为“Microsoft 365 Copilot”。
李彦宏则在发布会上表示,文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。
根据文心一言的邀请测试方案,3月16日起,首批用户可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。该服务于3月16日起开放预约。
截至3月18日早11点,排队申请百度智能云文心一言企业版API调用服务器测试的企业用户增加到9万家,百度收到关于文心一言合作的咨询 6588条。
陈端认为,这一轮的竞争,不仅是商业主体的竞争,实际上也是关乎下一轮国家数字竞争力的竞争。所以,百度的当务之急不完全是技术层面的研发,也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。
在陈端看来,中国在构建生态系统上具有优势。陈端指出,中国的移动互联网经过多年发展,应用层生态化的配套创新已经非常成熟。应用层的很多中小微创业团队,在过去配合移动互联生态做了大量的局部、垂类场景端的创新,把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。
04中小企业还有机会吗?
面对大语言模型的浪潮,中国企业该如何抓住机遇,避免风险?
在中国,布局ChatGPT的企业有两种类型:第一种是传统的互联网大公司,第二种是一些初创企业。
陈端认为,目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说,
重新打造生成式AI企业,跟时机、底层的生态支撑度,还有创始人自身的阅历、经验、视野、个人IP的自然调动能力都是息息相关的。此外,大模型在前期的投入,不管是算力还是其他的成本,以及时间窗口都很重要。
陈端表示,目前,百度有能力把自己的其他的产品与文心一言协同,就像微软把Office与GPT-4协同推出Copilot,而“创业者单纯去拼大模型却没有配套生态,这是很成问题的”。
张毅也认为,对于能够有资金、实力支撑的企业来讲,单独构建大模型产品可能会更受资本和创业者的青睐。但对于中小企业来讲,依托文心一言的开放平台去嫁接自己在细分领域的应用,也是一个不错的选择。
因为要做出大语言模型,需要长时间,以及巨额资金的投入。
OpenAI成功的背后,是微软多年来的巨额投入。美国时间2023年1月23日,微软宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。在2019年和2021年,微软曾向OpenAI两次投资。2019年的投资为10亿美元,而2021年的投资未公开金额。
AI公司“彩云科技”的创始人袁行远在接受36氪采访时指出,要想跑通一次100亿以上参数量的模型,至少要做到“千卡/月”这个级别,即:用1000张GPU卡,然后训练一个月。即使不用最先进的英伟达A100,按照一张GPU五万元的均价计算,1000张GPU意味着单月5000万的算力成本,这还没算上算法工程师的工资。
“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。”李彦宏在发布会上表示,深度学习、自然语言处理,需要多年的坚持和积累,没法速成。大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。
百度提供的数据显示,百度近十年累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。但百度并未透露大模型研发在核心研发费用中的占比。
李彦宏在发布会上表示,百度对文心一言的定位,是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。李彦宏认为,大模型时代将产生三大产业机会,分别为新型云计算公司、进行行业模型精调的公司和基于大模型底座进行应用开发的公司,即应用服务提供商。
李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
“大模型、生成式AI最终的产品形态还不得而知,所以这条路注定是长跑,需要整个科技界在资本、研发、模式创新上密切、持续地跟跑。”张毅说。
李开复认为,AI2.0会最先应用在能容错的领域,而毫无疑问最大的应用领域现在是内容创造。每个领域都可以把原有的App重写一次,创造出更赚钱的商业模式,最终AI2.0的生成能力会把成本降的几乎到0。