比尔·盖茨盛赞的ChatGPT改变了什么

内容概要:2022年12月,OpenAI发布了对话式AI新模型ChatGPT。ChatGPT和无数人印象中“笨拙”的机械AI聊天工具完全不同。它不仅能分辨出提问者的真实诉求,甚至在很多领域超过专业人士的精准性和博识程度,在短时间内给出意料之外的回答,同时ChatGPT也可以与其他AIGC模型联合使用,获得更加炫酷实用的功能。比尔·盖茨给出了高赞评价,他认为像ChatGPT这样的人工智能聊天机器人,将与互联网的诞生或个人电脑的发展一样重要。微软早在2019年就向ChatGPT母公司OpenAI投资了10亿美元。今年更是表示将进行”多年、数十亿美元”的投资,据说投资金额达到了100亿。随着ChatGPT火爆全球,短短两个月时间就成功收获了上亿用户。国内外各大IT厂商也闻风而动,其中,谷歌将于2月发布“Bard”的新对话式人工智能(AI)技术应用,准备与投资ChatGPT的微软展开一场AI大战。国内企业百度公司计划于4月份推出类似产品,阿里、腾讯、华为等企业也纷纷布局抢占人工智能产业新高度。这场AI大战能否改变未来,我们拭目以待!

当前,全球已经进入数字经济时代,数字经济公司也快速崛起。从2013年至2018年,全球前十大市值排名发生了天翻地覆的变化,苹果、谷歌、Facebook、亚马逊、阿里巴巴、腾讯6家公司迅速跻身全球值钱公司前列,在加上业务转型后的微软,全球前十大市值公司中新数字经济模式的公司达到了7家。数智技术是这些公司快速崛起的第一推动力,依托智能产品和各种App在全球范围内形成数据平台,在为普通大众提供高效服务的同时,也利用手中的数智技术改变个别产业模式。

在ChatGPT未出现之前,各大数字经济公司围绕人工智能开展诸多业务模式,通过大数据、机器学习和深度学习等多次技术浪潮革新,企图打开一个新的业务增长点,虽然就人工智能性能而言“能力持续飙升”,特别是在计算机视觉等领域,但基本中规中矩,距离理想中的智能化还有一定差距。但ChatGPT的出现打破这种局面,或许基于ChatGPT的广泛应用真的能够改变未来!

.ChatGPT简介

ChatGPT是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。该模型是OpenAI基于先前推出的NLP预训练模型GPT-3.5之上的衍生产品,使用简单,只需向ChatGPT文字提出需求,即可让其完成回答问题、书写代码、创作文本等指令,根据用户输入的文本,完成智能内容生成并回复内容。通过学习大量现成文本和对话集合(例如Wiki),ChatGPT能够像人类那样即时对话,流畅的回答各种问题。(当然回答速度比人还是慢一些)无论是英文还是其他语言(例如中文、韩语等),从回答历史问题,到写故事,甚至是撰写商业计划书和行业分析,“几乎”无所不能。甚至有程序员贴出了ChatGPT进行程序修改的对话。ChatGPT也可以与其他AIGC模型联合使用,获得更加炫酷实用的功能。例如上面通过对话生成客厅设计图。这极大加强了AI应用与客户对话的能力,使我们看到了AI大规模落地的曙光。

(一)核心技术

ChatGPT是OpenAI开发的一个大型预训练语言模型。它是GPT-3模型的变体,GPT-3经过训练,可以在对话中生成类似人类的文本响应。ChatGPT 旨在用作聊天机器人,我们可以对其进行微调,以完成各种任务,如回答问题、提供信息或参与对话。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。

(二)核心算法

ChatGPT背后的算法基于Transformer架构,这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。以ChatGPT为例,该模型在大量文本对话数据集上进行训练,并使用自我注意机制来学习类人对话的模式和结构。这使它能够生成与它所接收的输入相适应且相关的响应。

ChatGPT可以通过从数百万个网站收集信息,以对话式、人性化的方式生成独特的答案,能在一定程度上替代搜索引擎。Chat强调了其为了对话而优化,具有记忆能力,可以完成连续性对话。GPT即生成型预训练变换模型,是解决NLP(自然语言处理)任务的训练模型之一。该预训练模型基于Transformer架构(具有自注意力机制,可以捕捉句子中的上下文关系),可以根据给定文本预测下一个单词的概率分布,从而生成人类可以理解的自然语言。它代表了OpenAI最新一代的大型语言模型。

ChatGPT的算法突破带来了NLP(自然语言处理)技术上限的进一步提升,有望加速NLP技术在在机器人、人机交互、智能客服、语音对话、A视觉、AIGC、智能公文写作等领域持续落地的应用,预计到2026年国内NLP带动相关产业规模有望破千亿。

三)数据流说明

ChatGPT是一个聊天系统,用户输入一句话,那么ChatGPT就需要依据用户输入的信息反馈相关内容,比如图3用户输入“背《观沧海》”,系统接收到信息后,就经过以下处理,来为用户生产相对准确的答案:

  • Li处理:既语言识别(Language identification),ChatGPT是面向中国区之外的用户,因此用户输入的信息有多种语言,至于是那种语言需要先进行识别。识别之后既可以确定在PPO中使用的是中文、还是英文、还是其它模型数据。
  • Ea处理:既情感分析(Emotional analysis),ChatGPT对于输入信息进行了多中情感分析,如果情感不符合正能量方面的要求,ChatGPT会自动拒绝回答相关用户问题。这点也是非常必要的。Ea处理也需要基于PPO模型库来分析计算。
  • Ei处理:既抽取信息(Extract information),从用户输入的信息中提取关键特征,为下一步准备数据
  • NER处理:既命名实体识别(Named entity recognition),负责提取其中的人名、地名、专业术语等信息
  • SS处理:既句子相似性处理(Sentence Similarity),用户输入的信息可能存在错别字等信息,通过此步可以进行一个修正
  • TC处理:既文本分类(Text Classification),把用户输入得信息进行分类,通过此步分类,好定位到下一步搜索用到的相关搜索索引
  • Full Search处理:既全文搜索处理,ChatGPT是一个自然语言+搜索引擎集成的架构,通过Ei处理得到的数据就是全文搜索的输入数据,比如EI提取出NER=观沧海,SS=,TC=文学,那么此步就可以去搜索文学索引中的《观沧海》,得到想要的答案。
  • TG处理:既文本生成(Text Generation),上一步搜索的结果可能有多条数据,那么那一条最符合用户需求呢?则通过RM模型来进行选取,选取后生成对应的文本内容。
  • QA处理:既问题解答(Question Answering),把上一步生成的答案进一步转换成适合问答的形式或格式。

四)总体架构

ChatGPT总体架构技术是:NLP是核心,搜索辅助,算力是硬核。

  • NLP:上述流程描述中:Li、Ea、Ei、NER、SS、TC、TG、QA等处理,都需要依赖ChatGPT自身的GPT-3.5自然语言模型数据,而且按照上述流程执行,流程步骤长,上一步的结果就是下一步的输出,一步出错,结果必错。ChatGPT能做到现在这样已经是相当的了不起了。NLP自然就是ChatGPT的核心了。
  • 搜索:一般自然语言处理后的特征数据,是句子或者词组,对此搜索,常规的搜索肯定不行,而全文搜索技术自然就成为首选,比如开源流行的Elasticsearch,在里面主要存储了大量的问题答案、范本数据等。
  • 算力:告诉大家一个事实:一般一个NLP模型数据非常大,上G上T都是非常正常的事情;那么这么大的数据量,每次搜索都要进行与其计算,普通的CPU肯定是更不上的,因此GPU是首选,而且最好是使用云上的GPU算力,才能收缩性更得上。

二.ChatGPT简介应用场景

如今的AI,文能写诗、画画、搞创作,武能编码、分析、做高数,为用户带来超出预期的交互体验,但多数产品集中于某一领域的应用和智能化业务。从产品的应用情况看,模式化、模型化和机械化程度较高,容易看到人工智能的影子。

ChatGPT的应用场景也很广泛,但它却能集合多种应用与一身。它可以用于处理多种类型的对话,包括对话机器人、问答系统和客服机器人等。它还可以用于各种自然语言处理任务,比如文本摘要、情感分析和信息提取等。在开通chatGPT之后,该程序就可以通过接口完成49个应用场景的建立。

通过上述49中应用场景分析,可以总结为三种归类:一是代码相关,如程序语言转换、生成程序命令、修复代码Bug和SQL语句生成等;二是日常生活相关,如对基本的问题进行问答、对文字做摘要说明、语言语法纠正、生成点评意见等;三是职业相关,帮助面试者准备面试、创作一个短故事、对问题进行头脑风暴、帮助产品取名等。

三.ChatGPT应用实践

注:以下内容均来源网络资源

从解答内容来看,ChatGPD的文字编辑能力确实不错,而且是段时间内完成这样的创造,如果普通人至少需要10分钟,所以文字编辑的效率很高。而且ChatGPD可以循环试的完善文字编辑内容,比如在这份情书中增加“春、夏、秋、冬”要素,ChatGPD会依据用户提出的需求,不断完成文本内容,一直到用户满意为止。

“老胡觉得”有着固定的回答模式,甚至在语言的运用上都有自己的特点,这就类似于大家基于“甄嬛体”、“流浪地球体”的文字改编,首先ChatGPD要清楚某某体的风格和特点,然后在依据这些风格和特点进行改变。这就需要搜索能力、学习能力和文本编辑能力的综合应用。

为了防止用户在使用ChatGPD提出违规和违法的内容?ChatGPD也设置了一些防范措施,还是能经受考验的。AI智能但也不能万能,互联网应用的底线和法律意识要时刻牢记,即使将来应用ChatGPD进行包装开发也要有防范意识。

如何实现一个亿目标的两个回答前后有很强的逻辑关系,这一点应用与以往的人工智能区别很大,对于在智能问答领域是一个很好借鉴方法。

这一点应用是让很多程序员最为紧张的,因此很多IT用户也通过大量的测试来证明ChatGPD的编程能力到底如何。目前看,能够快速给出相关代码,但是代码质量也是通过不断循环迭代才能更完美。

通过以上ChatGPD应用场景测试可以看出,作为一个跨时代的人工智能模型,确实在很多应用上颠覆了传统人工智能产品研发思路,是人工智能领域技术革新的又一次突破。ChatGPT嵌入了人类反馈强化学习以及人工监督微调,因而具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景。当前,ChatGPT所利用的数据集只截止到2021年。在对话中,ChatGPT会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的回复,因而ChatGPT也可实现连续对话,提升了交互模式下的用户体验。同时,ChatGPT也会屏蔽敏感信息,对于不能回答的内容也能给予相关建议。

四.ChatGPT能改变什么

(一)推动AI技术发展

结合现有材料来看,ChatGPT对AI技术发展的推动作用主要集中在如下几方面:一是推动了自然语言处理技术的发展,它为AI设计了一个较为实用的框架,帮助AI更好地理解人类语言,更准确地表达自己的思想。ChatGPT技术允许AI使用自然语言表达自己的思想,而不是将其转换为机器可理解的符号。这样可以更好地模拟人类的交流方式,能更好地理解用户的意图,从而实现更加有效的交流;二是推动了机器学习技术的发展,ChatGPT技术需要AI学习用户的语言习惯,以便于更准确地理解用户的意图,从而更准确地回答问题,并有效地处理用户的请求;三是推动了语音识别技术的发展,用户可以使用自然语言与AI进行交流,而不是通过键入文字的方式。这就需要AI能够准确地识别用户的语音,并能够根据语音输入提出相应的问题和回答;四是推动了语义分析技术的发展,语义分析技术可以帮助AI理解用户的语言,以便于更准确地理解用户的意图,从而更好地处理复杂的对话场景;五是推动了计算机视觉技术的发展,ChatGPT技术可以帮助AI理解用户的视觉输入,以便更准确地回答用户的问题;六是推动了推荐系统技术的发展,推荐系统技术可以帮助AI根据用户的输入,更准确地推荐相关的信息;七是智能客服系统技术的发展,智能客服系统技术可以帮助AI实现自动化的服务,从而更好地理解用户的需求,并准确地回答用户的问题;八是推动了图像识别技术的发展,图像识别技术可以帮助AI识别用户发送的图片,从而更准确地理解用户的意图,并准确地回答用户的问题;九是推动了对话系统技术的发展,对话系统技术可以帮助AI理解用户的输入,以便更准确地回答用户的问题;十是推动了机器翻译技术的发展,机器翻译技术可以帮助AI更准确地理解用户的输入,帮助AI更好地处理多语言环境,从而为用户提供更好的服务。

(二)推动多项技术融合

ChatGPT的出现确实在科技圈扔下一枚炸弹,但要说人工智能取代大部分人类的工作那肯定还比较遥远。但基于ChatGPT的技术融合就率先在搜索引擎领域炸开。比如微软拿到ChatGPT之后的第一件事,就是将其和搜索引擎Bing结合,并且已经在近期展开内测;谷歌也闻讯而动,仓促发布Bard,并也表示要在搜索领域落地。在国内,百度文心一言产品上线日期发布,欲引领搜索体验的代际变革。除了搜索之外,ChatGPT的应用也在向其他领域延伸,比如微软计划将其接入包括云业务在内的所有产品线。百度文心一言发布后,小度随后发布了首款搭载ChatGPT同源技术的平板产品。除此之外,以ChatGPT为代表的大模型在自动驾驶、翻译、文本撰写等方面也都有落地。

(三)加快数字化新基建

ChatGPT基于GPT-3.5这个大语言模型训练,使用了约45TB数据,包含约1万亿个单词的文本内容。这些数据显然不是从网上爬取下来就能用,所以对于模型训练来说,高质量且大规模的数据来源本身就是一个问题,而要训练如此大规模的数据也太烧钱,有数据显示,GPT-3训练的硬件和电力成本就达到1200万美元。这其实也是为什么OpenAI和Anthropic会分别接受微软和谷歌投资的原因。除了背靠大树好乘凉之外(给到充足的资金和落地场景),微软、谷歌都分别和OpenAI、Anthropic签订了大型的云计算供应合同,ChatGPT最终拼的还是算力。

因此,国内外各大IT厂商想围绕ChatGPT发展就必须提升信息和算力新基建。人工智能三大要素主要包括数据,算法,以及算力。AI技术的演进使人工智能训练任务中使用的算力呈指数级增长,催生了算力方面更高的需求。技术层面,AIGC技术产业链覆盖公司业务广泛,但目前国内玩家并不多。产业下游应用场景丰富,未来随着AIGC技术的不断演进,更多的应用场景值得期待。目前我国AI服务器市场增速较快,算力市场也保持持续增长。AI服务器方面,根据IDC最新发布的《中国加速计算市场(2021年下半年)跟踪报告》,2021年全年中国AI服务器市场规模达350.3亿元,同比增长68.6%。算力方面,经信通院测算2021年我国计算设备算力总规模达到202EFlops,增速约50%,高于全球增速。

(四)智能化应用平民化

随着ChatGPT的热度不断攀升,多家科技公司都开始布局ChatGPT相关技术领域,NLP技术有望迅速进入平民化应用时代。ChatGPT相关技术不仅对众多的C端应用带来革新,同时也将对B端应用产生重大影响,企业数字化转型有望真正从数字化走向智能化,ChatGPT在企业办公中的应用,具备很大的想象空间。例如,协同办公类应用作为企业各类应用的入口,同时具备知识管理、流程引擎等功能,具备很强卡位价值,在把ChatGPT技术引入后,可以极大提升产品的功能与应用体验。员工仅需给出想要办理的流程,由ChatGPT进行智能化办理,从而改变过去员工需要自行在OA、ERP及业务系统中完成信息录入、功能查找、业务办理的现状,将极大地提升办公效率和使用体验。目前微软已经将ChatGPT应用到了Dynamics365、Teams等产品线,未来将要应用到Bing搜索中,未来的商业价值空间十分可观。

五.总结

ChatGPT的出现开启了生成式AI商用元年,商业化应用方向包括信息检索与处理、AIGC、各行业的专业服务等。同时,ChatGPT发挥“鲶鱼效应”,国内外科技巨头加快生成式AI布局。ChatGPT的爆火引起了国内外科技巨头的重视,各方加快生成式AI的研发和布局,或利用ChatGPT提高产品竞争力。从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。从下游相关受益应用来看,包括但不限于无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等。随着算法技术和算力技术的不断进步,ChatGPT也会进一步走向更先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。

【参考文献】

[1].腾讯研究院 —《AIGC发展趋势报告2023》

[2].国泰君安证券 —《ChatGPT研究框架(2023)》

[3].ChatGPT的49种应用场景 —《https://blog.csdn.net/luoxueyong/article/details/128349889》

[4].中信建设证券 —《从CHAT-GPT到生成式AI:人工智能新范式,重新定义生产力》

[5].CDO研习社公众号 —《ChatGPT背后的核心技术》

[6].真格基金 —《ChatGPT-真格基金分享》

[7].今日头条 —《ChatGPT对于普通人的影响和机会是什么?》

[8].机器翻译观察公账号 —《ChatGPT全景图:产品+商业篇》