chatpgt是什么
ChatGPT是OpenAI开发的大型预训练语言模型。这是GPT-3模型的一个变体,经过训练可以在对话中生成类似人类的文本响应。
站在用户的角度思考问题,与客户深入沟通,找到永平网站设计与永平网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:成都网站设计、成都做网站、企业官网、英文网站、手机端网站、网站推广、空间域名、虚拟主机、企业邮箱。业务覆盖永平地区。
ChatGPT背后的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。ChatGPT可用于创建能与用户进行对话的聊天机器人。这对客户服务很有用,因为它提供了有用的信息或只是为了好玩。
ChatGPT使用方法和注意事项:
支持中文和英文,都可以问,它不是Siri这种机器人,他是一种生产力的工具,要把它当作真实的人来对话,可以让它改进,支持上下文多轮对话,放心大胆的问,每次回答的字数有应该有限制,可以使用“继续问”等来追问,它会继续写。
AI届已经进入新的范式,学会提问题会越来越重要
「智能新能源」时代,谁才是真正的硬核技术玩家?
2022 年中国新能源车产销超过 680 万辆,新能源车渗透率 27.6%,其中有 80% 的产销来自于中国新能源汽车品牌。在这几个数据背后,反映的是:
虽然在燃油车领域,合资品牌销量依然占据着国内汽车市场的半壁江山;但在新能源汽车领域,国产新老势力联起手来已经甩开了对手好几个身位。除了在电池、电机、电控核心三电系统产业链上构筑了很强的产品力,目前国产新能源车在智能化层面也同样将合资品牌甩在身后。这是一场「智能+新能源」的弯道超车。
01中国品牌「智能新能源」时代强势崛起
汽车行业所展现出来的,是新能源车对传统燃油车的逐步替代,而往更宏观去看,是全球正在经历从化石燃料向清洁能源的能源形式的革命。事实上,能源形式革命往往和产业革命是交织在一起的,两者相互促进,推动着产业持续演进变革。煤炭的使用让蒸汽机车成为可能,写就了第一次工业革命的历史;石油的应用催生了发动机,让其可以为汽车、轮船、火车、飞机提供动力,现代化的工业体系得以建立;而清洁能源则是现在新能源汽车的助推剂,电能、氢能、风能等等越来越成为重要的能源供给,一个更加低碳的世界成为大家的向往。在刚刚过去的特斯拉投资者日上,科技狂人 Elon Musk 就为大家描绘出了一个可持续的清洁能源的世界的样子。汽车产业的新能源化,也带动汽车上下游、供应链千行万业的变化。其不仅是推出了新能源车产品这么简单,而是围绕着产品而构筑的新能源人才、智能化核心技术、零部件产业链(三电系统)地基,这块牢固的地基将支撑起中国新能源车未来起码 30、50 年的长远发展。事实上,中国对于发展纯电动车、混动车以及其他新能源车型的支持很早就开始了,大家最为熟知的就是针对新能源车的补贴政策,包括各种减税政策,让新能源车发展如沐春风。在经过早些年的混乱发展和「骗补」风波之后,中国新能源汽车产业逐渐步入正轨,走在了快速发展期。国产新能源车企们互相卷,卷出了一片新天地。无论是从产品的多样性、技术的先进性还是绝对的市场份额,目前已经在全球第一大汽车市场取得了领先。站在 2023 年这个时间节点,当我们国家的汽车工业在「新能源化」这一仗上已经取得了阶段性胜利,那么在接下来,战场会转移到哪里呢?答案是「智能化」。如今的汽车消费者,电动、混动这样的新的动力形式并不是吸引他们购车的主要因素,更多的需求来自于「智能化」所带来的全新体验。汽车仅仅作为交通出行工具的属性已经满足不了 Ta 们的需求,Ta 们需要的是一个能够支持出行的「智能化终端」。所以对于国产车企来说,在坚持「新能源化」方向的同时,接下来发力的重心就是「智能化」,这也是目前全球最受关注车企 —— 特斯拉正在深耕的领域。
02征战「智能新能源」新能源是地基,智能化是核心
汽车智能化包括了智能驾驶、智能座舱、智能底盘、智能电子电气架构,甚至是智能制造等等。为什么「智能化」如此重要,堪称新能源车未来的发展核心?
可以从三个方面来看:其一是大量企业正在聚焦汽车智能化做产品技术开发,这是一个当之无愧的「风口」。造车新势力、传统车企的造车新品牌纷纷入场,以智能化为主要竞争点,以智能驾驶、智能座舱为用户体验差异化开始「拼刺刀」。以「蔚理鹏」为代表,它们的掌舵人都是互联网背景或者是高科技公司背景,他们受到老大哥特斯拉的启发,在国内展开智能汽车创业,将互联网的玩法带到汽车行业,将用户体验、产品体验作为最核心努力的方向,其中智能化是这些企业目前收获众多消费者青睐的主要原因。传统车企方面,上汽智己、东风岚图、长城沙龙、长安阿维塔、吉利极氪、北汽极狐,也都纷纷揭竿而起,朝着新能源化、智能化方向努力,实际上这些车企在很早之前就已经入局了新能源,但为何还要成立新的品牌?根本原因还在于要造出区别于上一代汽车的下一代汽车,下一代汽车核心就是「智能化」。同时,越来越多的科技公司如苹果、华为、小米、百度、大疆等进入到汽车行业,希望颠覆以往传统汽车只作为交通工具的属性。它们投入大量的资金、资源和人才,并非仅仅为了造一辆纯电或者混动的传统车,它们希望汽车变成「移动智能终端」。除了入局造车,很多企业也在汽车智能化的产业链上深耕,成为了新兴供应商,助力整个中国汽车产业向智能化方向转型。汽车「智能化」已经是潮水的方向,是不可逆的,关于智能化的想象空间无穷无尽。供给端如此繁荣,那么在需求端呢?事实上也同样未来可期。这也就引出了「智能化」如此重要的第二个原因:中国消费者对智能汽车的接受度已远超其他国家的消费者,而且随着中国智能车出海,海外消费者也对智能化的体验更为向往。目前智能化车型上的很多功能让消费者们「旦用难回」,一套好用的辅助驾驶功能可以很大程度上减轻驾驶疲劳、提升安全;一套好用的智能座舱系统能让开车不那么无聊;一套好用的车控功能能让用车变得省心、省事……智能化给汽车带来了实实在在的体验提升,消费者在买车时也越来越关注车型的智能化配置和软件功能。有一项关于自动驾驶技术的消费者调查显示:美国有 16% 的消费者认为自动驾驶非常重要,德国也是 16%,中国高达 49%;关于愿意为自动驾驶汽车多支付的费用,中国消费者愿意多付 4600 美元,德国消费者愿意多付 2900 美元,美国消费者愿意多付 3900 美元。这样几个简单的数字,其实可以反映出消费者对汽车智能化是非常有需求的。如果从消费者本身的属性分析也能佐证这一调查结果:目前中国的年轻人已经成为消费主力,这个群体的成长环境是技术高速发展和迭代时期,包括互联网、大数据、云计算、物联网、5G、人工智能等等,这些「互联网原住民」,天生对技术的接受度高,对汽车智能化的接受度也很高。当初小米宣布造车,很多网友都说其是「年轻人的第一台智能汽车」,其中的关键词就是「年轻人」、「智能」。汽车智能化做得好,消费者体验则好;智能化做得不好,用户的感知也会非常明显。
实际上,「智能化」已经慢慢变成了用户的依赖,变成了用户要不要选择某款车的重要参考指标。「智能化」也给汽车这个古老的交通工具带来了新的生命,很多的模式可以畅想,与智能驾驶、智能座舱相关的软件能力,未来有很大的想象空间。类似于 ChatGPT 这种能颠覆互联网应用的事物,未来肯定会在汽车这个载体上诞生。这就是人工智能技术与汽车相结合诞生的新的玩法、新的服务、新的体验以及新的商业模式。其三就是中国政府已经有诸多政策支持汽车的「智能化」。除去新能源汽车的补贴政策,国家还在支持汽车智能化产业的发展壮大,发布了明确的智能汽车发展战略。一方面,国家牵头做大量的基础设施建设,包括智能交通设施,涉及通信、高精地图和定位、大数据、云平台等等;另一方面,国家也在开放更多区域,便于智能汽车测试和运营,为智能汽车迭代发展储备的核心的数据金矿。汽车智能化可谓遇上了「天时、地利、人和」,那么接下来到底如何发展,就看这些相关企业们如何各显神通了。虽说智能化是未来的核心,但新能源的地基也不可动摇。很多人会说,在燃油车上做智能化也是一条路径。笔者认为确实是,但不是最优路径。在过渡期,基于存量汽车市场的智能化也有其必要,承担起教育消费者的作用,但毕竟这不是彻底的颠覆,仅仅是在燃油车上增加一些智能化小功能,而且这里面要耗费更多的开发时间和精力,最关键的是不一定能做出来很好的产品体验。所以,最优解仍然是在新能源车上做「智能化」。从技术角度看,汽车的智能化:
从这个角度来看,新能源车更加适合智能化,将是智能化的最大赢家。如果说新能源化是传统汽车变革的上半场,那么智能化将是传统汽车变革的下半场,而且在下半场,新能源和智能化必定是紧密结合在一起的,必须同时推进。基于此,造车者们该如何做呢?最近,吉利汽车发布了其中高端新能源产品系列「吉利银河」,目标就是聚焦混动和纯电车型,并且在智能化层面加大投入力度,包括拿出了新的智驾方案和智能座舱操作系统。无独有偶,作为中国自主品牌车企代表的长城汽车,也即将完成向「智能新能源」生态企业的进阶。在近期的一次访谈中,长城汽车掌舵人魏建军表示:「新能源化是不可逆的,智能化也是不可逆的,这也给我们带来了巨大的想象空间,因为长城已经储备好了技术和供应链能力。」接下来,我们将以长城汽车为蓝本,来看看传统汽车如何做好「智能新能源」。
03「智能新能源」践行者:长城汽车如何厚积薄发?
(1)打好新能源地基
要做好「智能新能源」车企,必须先夯实新能源地基。提起长城汽车,多数消费者的第一印象就是哈弗 SUV,因为这个品牌和品类在过去很多年里确实少有竞争对手,是销量王者。而在新能源车层面,长城汽车旗下的欧拉品牌车型、其他品牌的混动车型也都面市比较晚,目前还没有如哈弗 SUV 那样被大众认知。其实早在 2009 年,长城汽车就已经开始布局新能源,只不过没有率先在产品层面发力,而是在供应链层面,包括孵化了一批动力电池、氢能、三电技术等相关的供应链企业,目标就是要建立一条自研、自主可控的产业链护城河。如今,这条护城河正在不断被拓宽。长城汽车是自主品牌车企为数不多拥有纯电、混动和氢能三条新能源路线技术储备的车企。2016 年,长城汽车进入氢能行业,成立了未势能源公司,至今已经累计投资超过 25 亿元,还制定了 2050 年建成氢能社会的计划,目前已经率先开始氢能源「制、储、运、加、应用」全产业链布局。2018 年,长城汽车内部剥离出蜂巢能源,成为专门的动力电池公司,目前已经超过 2600 人的团队,发展速度惊人。2021 年蜂巢能源的专利数达到 878 项,位居 2021 年中国动力电池专利公开量创新主体 TOP20 排行榜第一。2021 年度和 2022 年上半年,蜂巢能源动力电池装机量世界排名第十。同样是 2018 年,长城汽车成立了专注于汽车动力系统、新能源传动系统、智能转向系统研发的蜂巢易创,现在长城汽车最新的柠檬混动 DHT 变速器总成就是由蜂巢易创生产。长城汽车内部还有投资 2.2 亿元,占地 2100 平方米的国际一流变速器实验室,这里是长城汽车自研混动技术的摇篮。基本上,在新能源的三条路径上,长城汽车的技术地基已经建的很结实,接下来就是出更多成果以及爆款产品的时候。
根据长城汽车最新的产品规划:
这样一来,长城汽车各个品牌的新能源化路径已经十分清晰。如果说以往多年积累的新能源供应链自研能力是弹药库,那么各个品牌的新能源汽车产品就是趁手武器。相比于很多的造车新势力还在努力构建所谓全栈自研能力的路上,长城汽车拥有自己的先发优势。新能源的地基建好,接下来就是应对更为核心的汽车智能化的竞争。很多人会说,作为传统车企的长城汽车,没有智能化的基因,不如造车新势力拥有那么强的科技属性。事实上,在过去的几年中,长城汽车已经通过各种途径补齐智能化的短板,目前在某些方面已经取得了行业领先。类似于此前在新能源领域的打法,长城汽车也培育了一批专注智能化的生态企业,这些生态企业涵盖了智能驾驶、智能座舱、电子电气架构、线控底盘等多个智能化相关领域。
(2)征战智能驾驶无人区
在智能驾驶领域,目前毫末智行是长城汽车的核心武器,魏建军也非常关心智能驾驶的进展,经常会亲身体验测试版本的智能驾驶系统。目前国内的车企都在导航辅助驾驶领域互相卷,卷完了高速卷城区,毫末智行已经官宣要成为国内首批落地城市级导航辅助驾驶功能的企业,落地车型就是长城汽车子品牌魏牌的摩卡车型。事实上,长城汽车在 2009 年就开始涉足智能驾驶研发,只不过现在独立出智能驾驶子公司毫末智行聚焦这一领域,而且可以吸引外部融资,助力其快速壮大并将技术落地。毫末智行主力研发的系统包括了 HWA 高速辅助驾驶系统、NOH 导航辅助驾驶系统,同时在智能驾驶域控制器方面展开自研,另外在算法系统、数据驱动系统、人工智能大模型等领域储备能力。在智能驾驶技术自研的布局上,长城汽车依托于毫末智行,覆盖了底层硬件、中间件和智能驾驶软件等多个环节的研发,再通过设计一系列不同配置的感知、计算硬件方案,其使智能驾驶系统可以匹配不同品牌、不同价位的多个车型。在已过去的 2022 年,长城汽车共有 6 款搭载智能驾驶功能的新车型上市,用户辅助驾驶里程超过 2500 万公里,相关车型销量突破 20 万辆。而且,作为中国首批量产的城市导航辅助驾驶系统,城市 NOH 将率先在魏牌摩卡 DHT-PHEV 车型上搭载。智能驾驶再往前发展,就不是功能的有无问题,而是功能的技术实力以及在面对各种驾驶场景的灵活应对能力,而这就需要一个更高效更快速的迭代闭环,这里面就包括了大数据、AI 大模型以及计算中心等核心组成部分。而这也是长城汽车正在征服的技术「无人区」。以毫末智行为依托,长城汽车已经拥有国内自动驾驶行业里数一数二的智能中心 —— 雪湖 · 绿洲(MANA OASIS),通过喂养海量数据进行不断训练和迭代,智能驾驶算法系统将不断精进,体验不断提升,应用场景不断扩大,为最终迈向全无人驾驶做准备。打造智算中心,也是特斯拉、吉利、小鹏这样的车企都在做的事情。近期,ChatGPT 爆火,毫末智行也将旗下自动驾驶认知大模型(人驾自监督认知大模型)正式升级为「DriveGPT」,用 AI 大模型驱动智能驾驶算法的不断进步。除了发展自有的生态企业,长城汽车也通过投资布局智能驾驶产业链,比如其就入股了自动驾驶芯片明星企业地平线,后续地平线的芯片就将在长城汽车的车型上搭载。
(3)可进化的智能座舱
长城汽车有自研的「咖啡智能」智能座舱系统,也有两家生态企业,包括仙豆智能和嘉峪智能,在智能车载导航、智能语音、智能感知、智能多端车机互联以及整车 OTA 方面都有相关的技术储备。在硬件层面,长城汽车用的是高通 8155 芯片打造专属智能座舱平台,相比上一代主流车机系统 CPU 运算能力提升 2.5 倍以上,GPU 图像处理能力提升 3.5 倍以上,搭配可用于机器视觉和语音处理的专属高算力 AI 加速器,为多屏融合、多模交互、AI 感知、个性化自动配置等功能提供底层算力支撑。后续应该也要上高通 8295 芯片。在软件层面,长城汽车自研座舱操作系统 GC-OS 技术拥有多项开放能力和优势,首先是 APP 统一接口+HAL(硬件抽象层)统一接口,同时支持 UI/UE 平台化+品牌差异性,还可向下兼容多种高算力平台,向上可适配长城汽车旗下各大品牌车型,具备快交付、可成长、可插拔、生态互换、软硬件兼容等特点。以高算力芯片和 GC-OS 为基础,长城汽车目前已经开放了一部分智能座舱 API,包含车机、驾驶、车身、底盘相关系统;第二阶段,还将迭代设计语音、导航、视觉等能力接口。通过两个阶段的迭代,长城汽车的智能座舱 API 池,将覆盖 25+ 类型的功能集。长城汽车的智能座舱将成为一个主动式服务的「智能百变空间」,这也和「移动智能终端」的理念相符。
(4)电子电气架构为智能化而生
2021 年,长城汽车发布了为智能化打造的新的整车电子电气架构 GEEP 4.0,其包括中央计算平台、自动驾驶域和智能座舱域。该架构采用 SOA(面向服务架构)理念,开放标准 API 接口,支持功能可生长和车云一体化,是融合功能体验创新,软件平台化开发,形成便于开发、维护、灵活扩展、体验升级、创新营收的可生长智能架构。同时,基于SOA,长城汽车在软件层面搭建一个统一的、标准化的整车软件平台。
在这样一个架构的支撑下,智能驾驶、智能座舱的开发,相关系统的体验扩展和升级将更加方便和高效。而且,基于全新的电子电气架构,长城汽车也在开发智慧线控底盘。线控底盘是汽车
【本文来自易车号作者宇宙出行指南,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】
chatbots会颠覆传统聊天吗?
但是,由于不对中国用户开放,对ChatGPT的讨论还只是停留在科技圈、投资圈,目前电商圈对这个产品的讨论还停留在调侃阶段:看看ChatGPT给出的各种啼笑皆非、瞠目结舌又或者是答非所问的回答。
一方面是科技圈投资圈把ChatGPT说成神话,是个革命性的颠覆性的产品,甚至要让20多个工种失业;另一方面,圈外人看到ChatGPT给出的生硬回答,难免会觉得,“就这玩意要颠覆我?我怎么不相信呢!”
其实,大家又不是第一次听科技圈“听风就是雨”动辄颠覆革命的报道,上一次说AI要让人类下岗还是2016年,阿尔法狗打败世界围棋冠军李世石,并且随之而来的三年AI投资热门期,直到后来直播赛道崛起,AI之风才逐渐平静,没想到疫情刚刚过去,又一波AI热来袭。
这一波AI热潮在国内有着良好的土壤,《流浪地球2》和《三体》两个科幻影视作品的大热,让不少人热衷讨论未来科技;在国际上,去年底硅谷巨头谷歌、亚马逊、微软、Mate等开启了互联网史上最大规模的裁员,裁员就是因为看衰未来,如今,微软投资的openAI开发的ChatGPT,在web3.0和元宇宙熄火之后,成了硅谷寒冬里的一把火,而且是仅剩的火苗。
国内跟风的百度,在推出类似ChatGPT的计划之后,股价一度暴涨17%,阿里、腾讯、网易有道等先后透露正在内测类似产品,即将推出。
但是,ChatGPT到底能干什么?为什么大家对它的评价差异巨大?它真的会让很多人失业吗?
第一个,为什么ChatGPT的回答很扯淡?
跟很多人一样,当初我试用几次ChatGPT之后,觉得这回答的都是什么玩意?还有人说它会写诗,可是写出来的诗完全没有可读性。
但是,我们可能忽略了一个问题,ChatGPT不是一个成品,而是一个半成品,虽然它经过七八年时间,在3000亿单词的语料基础上,训练出了1700多亿个模型,但是,它仍然是一个半成品,一方面需要openAI继续开发,另一方面,也需要使用者不断训练它,它就跟刚会走的小狗一样,要经过主人训练,才会更懂你。
ChatGPT作为一个聊天机器人,并不是一开始就很懂你,何况,大家目前使用的ChatGPT并不是直接的机器人,而是经过了国内的中介,中介把你的问题给到国外的ChatGPT,得到回答之后再转给你,这中间最大的问题就是,ChatGPT对回答者并没有精准的区分,只是中介一个或者多个ID在和机器人对话。
真正使用好ChatGPT是需要一对一的磨合,才能不断得到高端AI对你的服务升级,否则,永远尝不到AI的“甜”。
不过就算经常使用ChatGPT,也还是很难解决大家的实际问题,需要根据使用场景二次开发,微软就把ChatGPT与自己的搜索引擎Bing结合起来做了New Bing,这样一来,就比单独的搜索引擎更好用,能够得到更智能的答案,还能减少搜索引擎的广告问题(想想百度的广告,你就知道这个产品的好处了)。
第二个,ChatGPT不是什么吊炸天的技术。
在ChatGPT之前,对话机器人早就普遍存在,比如微软小冰,还有各种智能音箱,甚至大家网上购物找客服时,得到的第一个回答,一定是机器人,机器人无法回答,人工客服再介入。
ChatGPT比他们先进的地方在于大语言模型,也就是学习了互联网上的各种资料,建立各种模型,但是,以前的聊天机器人侧重于文字语音理解,然后通过设计无数的固定对话来响应,所以,以前的聊天机器人是解决固定的某些问题,比如退换货啊,促销政策,天气情况,操作指令等,不是开放性的自己组织语言。
ChatGPT是让大家看到了一个可以自己理解、自己思考、自己组织语言、自己调整应答语气和策略的机器人,这是很厉害的。
不过,ChatGPT并非独一份,国际上至少有近十个公司在做这种模型产品,国内互联网巨头要开发相应的产品,也已经有了基础。有媒体报道说,国内跟ChatGPT的差距也就一年多而已,国内巨头们对AI的重视,从未放松过。
百度文心一言是什么?你对文心一言有什么期待?
百度文心一言是每日更新的一句古诗词,旨在激发读者的思考,增强文人文魂。我期待文心一言能够带给我更多美好的文学体验,更深刻的文化意境,以及更多有趣的历史故事。
进入3月中旬,全球科技巨头再次竞相亮相大语言模型赛道。
一周之内,开发出ChatGPT的美国初创公司OpenAI,对OpenAI投入巨资的科技巨头微软,以及中国互联网龙头企业百度,相继发布了在大语言模型(LLM)领域的最新动态。这也再次引发了全球对该领域的关注。
当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4,它比GPT-3.5的问答质量和技术都有明显提升。
3月16日下午,百度开启新一代大语言模型、生成式AI产品文心一言测试,从而成为第一家加入该赛道竞争的中国企业。
在发布会现场,百度创始人、董事长兼首席执行官李彦宏通过问答的形式,展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。几个小时后,微软宣布,将把GPT-4接入Office全家桶,新名为“Microsoft 365 Copilot”。
正如财经E法在2月17日发布的文章(OpenAI独家回应|ChatGPT为何不向所有中国用户开放注册?)所述,中国内地和中国香港的手机号均无法注册ChatGPT账号。此外,虽然OpenAI的应用程序编程接口(API)已向161个国家和地区开放,但不包括中国内地和中国香港。
一方面,业界普遍关注,在AIGC(生成式人工智能)势不可挡的科技浪潮中,谁将成为下一个弄潮儿?另一方面,在中美科技竞合的敏感期,各方亦颇为关注百度迈出的第一步带来的涟漪,以及中国企业该如何应对。
01“真的ready了吗?”
3月16日,李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问,“最近一段时间,很多朋友问我,为什么是今天,你们真的ready了吗”?
李彦宏的回答是,虽然百度已投入AI研究十多年,为发布文心一言做了充分准备,但“不能说完全ready了”,因为文心一言对标ChatGPT、甚至是GPT-4,门槛很高,还“有很多不完美的地方”。但他强调“一旦有了真实的人类反馈,文心一言的进步速度会非常快”。
李彦宏解释,之所以选择当天发布,是因为市场有需求:客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。
如何理解李彦宏所言的“对标GPT-4的门槛很高”?
当地时间3月14日,OpenAI公布了其大型语言模型的最新版本——GPT-4。值得注意的是,GPT-4是大型的多模态模型,即能够接受图像和文本类型的输入。而GPT-3.5只能接受文本输入。
在演示视频中,OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图,并将图片输入GPT-4。仅1到2秒后,GPT-4就生成了网页代码,制作出了与草图高度相似的网站。根据OpenAI发布的实验数据, GPT-4模型相较前一代GPT-3.5已取得了巨大的进步,在许多专业测试中表现出超过绝大多数人类的水平。
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,文心一言未来还有待全面开放来获得用户检验。无论是通过B端API还是直接向C端用户开放,用户体验口碑都是硬道理。当前ChatGPT没对中国用户开放,在国内市场,百度将获得先发优势。
对OpenAI和百度的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示,GPT系列大模型,包括GPT-4与文心一言本质上都是同一类产品,只是它们各自的数据覆盖范畴和数据模型的积累长短不一。从短期看,OpenAI的产品准备时间相对更加充足,智能程度暂时领先一些。但是对文心一言而言,能在这么短的时间内训练出这样的一个产品,也是非常了不起的。
同时,张毅也对百度做出更好产品更有信心,他的理由是,从人工智能、大数据、大模型的人才储备来看,中国会更有优势。
中央财经大学数字经济融合创新发展中心主任陈端则认为,与海外竞争对手相比,百度最大的优势是立足本土,构建了语言和文化层面理解的护城河。
作为中国公司研发的大语言模型产品,文心一言的中文理解能力备受关注。重要原因是,此前很多评论人士认为,ChatGPT的中文问答能力不如英文问答能力强。
李彦宏表示,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”创作了一首藏头诗。
李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。
受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。
法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。
此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏称,文心一言的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上能够独一无二。
受访专家也指出,由于汉语的特殊性,中国企业在研发大模型时面临的难度更大,但若突破了,也会在提供本土服务时,具备更大的优势。
法国里昂商学院人工智能与商业分析教授丁文璿日前对媒体指出,语言对话模型训练,需要让机器对文字产生理解,英语比中文稍微容易一些。丁文璿解释,中国人工智能技术所处理的中文语言,大多都是象形词,而英文是解释性的,相较而言词语也并非特别丰富。
此外,上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授林洲汉认为,未来大语言模型大概率会往多模态、交互式的方向发展,进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示:“多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
在多模态生成方面,李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容,并根据文本生成了一段视频。但李彦宏透露,文心一言的视频生成成本较高,现阶段还未对所有用户开放,未来会逐步接入。
发布会前后,百度的股价经历了大落大起。3月16日,港股百度盘中股价跌幅一度扩大超10%,报120.1港元。截至收盘,百度股价跌幅为6.36%,报125.1港元。但百度股价在美股势头强劲,当日百度美股开盘低开高走,振幅超7%。截至收盘,报138.16美元,涨幅为3.8%。3月17日,百度港股表现强势,盘中一度大涨超15%。截至当日收盘,百度港股涨幅为13.67%,报142.2港元。
文心一言宣布开启邀请测试一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。
文心一言的市场热度持续飙升,资本市场也给予了价值重估。张毅认为,这也代表了公众对大语言模型/生成式AI “既期待,又担忧,然后是希望”的心情。
02谁都不能错过的科技革命
事实上,“真的ready了吗?”并不仅针对百度,也是伴随此轮“ChatGPT”热潮以来,公众普遍的疑问。
李彦宏观察到,从2021年开始,人工智能技术开始从“判别式”向“生成式”转变。
创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示,AI 2.0时代的第一个现象级应用,就是以GPT-4为代表的AIGC,又称生成式AI(Generative AI)。李开复表示,AI2.0 是绝对不能错过的一次革命,它将会是一个巨大的平台性机会,这个机会将比移动互联网大十倍。他还表示,AI 2.0也是中国在AI领域的第一次平台角逐机会。
受访专家普遍认为,此前全世界的AI企业都遇到了一个极大的问题:即使技术储备十分丰富,AI应用并没有给它们带来丰厚的收益。造成这一问题的原因在于,AI产品的应用主要集中在B端(企业用户)和G端(政府用户),AI产品在进入企业或机构时往往流程复杂,这在某种程度上会限制AI产品在市场上的快速扩张。
因此,张毅认为,AIGC的产品应用方向在C端更有可能产生巨大的商业机会。他分析说,在美国市场,此前C端市场被谷歌、亚马逊、Meta等企业抢占,让微软压力非常大,更需要一款产品来扳回一局。在中国市场,百度的优势和谷歌一样,都有强大的搜索引擎对数据的抓取能力,以及储存、整理、分析能力的基础。中国本身拥有十几亿人口的巨大市场,百度完全可以做得很优秀。
“百度和微软、谷歌本质上是两个不同市场的竞争,所以我相信文心一言以及系列产品也一定会跑出来。”张毅说。
李彦宏坚称,文心一言不是“中美科技对抗的工具”。但他也承认,ChatGPT 的成功,加快了百度推出该产品的进度。
百度CTO王海峰表示,人类进入AI时代,IT技术的技术栈可以分为四层:芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司,在各个层面都有领先业界的自研技术。例如,高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。王海峰认为,百度全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。
文心一言与ChatGPT一样,都使用了SFT(模型微调)、RLHF(从人类反馈中进行强化学习)以及Prompt(提示)作为底层技术。此外,文心一言还采用了知识增强、检索增强和对话增强技术。王海峰表示,这三项是百度已有技术优势的再创新。
陈端认为,在当前技术创新的集成性越来越高的当下,全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。
信心很重要,但差距无法忽视。
在本月初的两会期间,中国科技部部长王志刚在回应ChatGPT相关的问题时,用足球打比方,指出中国还有很多工作要做。“踢足球都是盘带、射门,但是要做到梅西(足坛巨星利昂内尔·梅西)那么好也不容易。”
王志刚指出,中国在这方面也作了很多布局,在该领域的研究也进行了很多年,并且有一些
成果,“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。
王志刚说,ChatGPT出来以后,引起了大家的关注。实际从技术本身源头来讲,它叫做NLP、NLU,也就是自然语言处理和自然语言理解。ChatGPT之所以引起关注,在于它作为一个大模型,有效结合了大数据、大算力、强算法,计算方法有进步。同样一种原理,做得有区别。比如大家都能做出发动机,但质量是有不同的。
然而,无论是ChatGPT还是文心一言,其背后的大语言模型是核心竞争力。北京大学王选计算机研究所研究员赵东岩告诉财经E法,国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。
一位科技系统人士则对财经E法指出,客观而言,中美目前在该领域的基础研究成果差距较大。这些基础研究成果包含自然语言处理(NLP)、数据库、GPU产品,“美国切断GPU芯片(的供应),(中国的)算力就跟不上”。
大型算力的核心在于高性能GPU芯片。北京航空航天大学软件学院助理教授周号益告诉财经E法,在GPU芯片等计算硬件上,中国与国际的差距在十年左右,硬件水平会严重制约大语言模型以及科学计算类模型的发展。
周号益认为,在技术和模型上,中国的科技公司与OpenAI并没有代差,差距仅在五年以内,在一些较小的技术领域差距只有2-3年。在数据采集方面,以GPT-3大模型为例,其训练的语料中中文只占5%,中国科技企业对中文语料的积累具有一定优势,因此极有可能在中文领域实现突破。
03巨头下一步:构建生态
对于以ChatGPT为代表的大语言模型赛道如何实现盈利,是各方公认的难题(ChatGPT爆火的冷思考:盈利难题与治理挑战)。
开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。而2023年1月,投资银行摩根士丹利(Morgan Stanley)的一份分析报告称,ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。
但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为,ChatGPT能带来多少盈利,并不是OpenAI关注的重点,重点是基于它的模型能长出什么样的服务和应用,从而构建起一个生态系统。“ChatGPT的发展需要一个产业生态,比如它和微软相关应用的融合就是很好的思路。”曹建峰说。
当地时间3月15日,微软副总裁兼消费者首席营销官余瑟夫·梅迪发文表示,新版必应搜索引擎已经在 GPT-4 上运行。另据OpenAI披露,GPT-4是在微软Azure AI 超级计算机上进行训练的,并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。
谷歌则宣布开放其大语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite。通过PaLM API 接口,开发者们可以将PaLM用于各种应用程序的开发。MakerSuite则可以让开发者快速对自己的想法进行原型设计,并且随着时间的推移,该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。
微软迅速跟进。当地时间3月16日,微软宣布将把GPT-4接入Office全家桶。新功能名为“Microsoft 365 Copilot”。
李彦宏则在发布会上表示,文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。
根据文心一言的邀请测试方案,3月16日起,首批用户可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。该服务于3月16日起开放预约。
截至3月18日早11点,排队申请百度智能云文心一言企业版API调用服务器测试的企业用户增加到9万家,百度收到关于文心一言合作的咨询 6588条。
陈端认为,这一轮的竞争,不仅是商业主体的竞争,实际上也是关乎下一轮国家数字竞争力的竞争。所以,百度的当务之急不完全是技术层面的研发,也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。
在陈端看来,中国在构建生态系统上具有优势。陈端指出,中国的移动互联网经过多年发展,应用层生态化的配套创新已经非常成熟。应用层的很多中小微创业团队,在过去配合移动互联生态做了大量的局部、垂类场景端的创新,把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。
04中小企业还有机会吗?
面对大语言模型的浪潮,中国企业该如何抓住机遇,避免风险?
在中国,布局ChatGPT的企业有两种类型:第一种是传统的互联网大公司,第二种是一些初创企业。
陈端认为,目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说,
重新打造生成式AI企业,跟时机、底层的生态支撑度,还有创始人自身的阅历、经验、视野、个人IP的自然调动能力都是息息相关的。此外,大模型在前期的投入,不管是算力还是其他的成本,以及时间窗口都很重要。
陈端表示,目前,百度有能力把自己的其他的产品与文心一言协同,就像微软把Office与GPT-4协同推出Copilot,而“创业者单纯去拼大模型却没有配套生态,这是很成问题的”。
张毅也认为,对于能够有资金、实力支撑的企业来讲,单独构建大模型产品可能会更受资本和创业者的青睐。但对于中小企业来讲,依托文心一言的开放平台去嫁接自己在细分领域的应用,也是一个不错的选择。
因为要做出大语言模型,需要长时间,以及巨额资金的投入。
OpenAI成功的背后,是微软多年来的巨额投入。美国时间2023年1月23日,微软宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。在2019年和2021年,微软曾向OpenAI两次投资。2019年的投资为10亿美元,而2021年的投资未公开金额。
AI公司“彩云科技”的创始人袁行远在接受36氪采访时指出,要想跑通一次100亿以上参数量的模型,至少要做到“千卡/月”这个级别,即:用1000张GPU卡,然后训练一个月。即使不用最先进的英伟达A100,按照一张GPU五万元的均价计算,1000张GPU意味着单月5000万的算力成本,这还没算上算法工程师的工资。
“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。”李彦宏在发布会上表示,深度学习、自然语言处理,需要多年的坚持和积累,没法速成。大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。
百度提供的数据显示,百度近十年累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。但百度并未透露大模型研发在核心研发费用中的占比。
李彦宏在发布会上表示,百度对文心一言的定位,是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。李彦宏认为,大模型时代将产生三大产业机会,分别为新型云计算公司、进行行业模型精调的公司和基于大模型底座进行应用开发的公司,即应用服务提供商。
李彦宏断言,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
“大模型、生成式AI最终的产品形态还不得而知,所以这条路注定是长跑,需要整个科技界在资本、研发、模式创新上密切、持续地跟跑。”张毅说。
李开复认为,AI2.0会最先应用在能容错的领域,而毫无疑问最大的应用领域现在是内容创造。每个领域都可以把原有的App重写一次,创造出更赚钱的商业模式,最终AI2.0的生成能力会把成本降的几乎到0。
文章题目:ChatGPT将颠覆移动互联网 chatplatform
文章URL:http://lswzjz.com/article/ddiccco.html