ChatGPT背后的核心技术原理是什么

2023-12-14 22:19:48| 冰倩

ChatGPT，美国“开放人工智能研究中心”研发的聊天机器人程序，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。下面是小编给大家整理的ChatGPT背后的核心技术原理是什么，希望大家喜欢!

ChatGPT背后的核心技术原理是什么

ChatGPT靠仿真聊天和回答出圈，蹿火的一方面还在于美国89%的大学生都用ChatGPT来做作业，各国投顾圈用ChatGPT能一分钟直接生成投研报告，科技界都开始关注ChatGPT背后的核心技术，甚至在ChatGPT还在普及阶段，斯坦福大学就已经研究了反AI的全新算法，制止学生用AI生成文本的DetectGPT。

伴随着ChatGPT火爆的ChatGPT概念股，在A股这几天也纷纷跟红。

亏损的AI龙头，股价6天翻倍。

愈演愈烈的ChatGPT概念，使得这在国内看起来不像是一场全球人工智能领域难得的突破性事件，而更像一场资本追逐概念股的狂欢。

一个ChatGPT应用的走红，A股是人工智能和不是人工智能的公司好像都瞬间获益了。

伪AI公司股价也已翻倍。

但获益的背后，也只是纯粹的市场概念炒作的结果，并非来自真正国内AI技术的突破和创新。

而说到ChatGPT背后的核心技术，缘起自然语言处理领域的一篇科研论文《Attention is all your need》中名为transformer的算法。

transformer算法自诞生之日起，就被广泛应用于AI领域，成为了近几年最热门的AI算法模型。

AI技术数十年间从transformer算法到GPT(Generative Pre-Training)，再到GPT2的迭代标志Open AI，以及GPT3和ChatGPT的“出圈”，未来很长一段时间，人类将迎来“科研、算力、基础架构、工程、数据、解决方案”循环的快速迭代。

transformer算法的核心内容是并行计算。

Transformer模型示意图

自然语言处理主要的算法叫RNN(循环神经网络)算法，其弊病是需要大量的串行计算，效率低。

而在Transformer算法里，作者将每个字与句子中所有单词进行计算，算出这个词与每个单词的相关度，从而确定这个词在这个句子里的更准确意义。

同时，机器学习领域最核心的一个概念——“向量”，诞生了。

在数字化时代，数学运算最小单位往往是自然数字。

但在AI时代，这个最小单元变成了向量。这是数字化时代计算和智能化时代最重要的差别之一。

向量是一组数据的集合，也可以想象成在一个超高维度空间里的一个点。

这种方法，可以在一个超长句子中发挥优势，而且最关键的是一举突破了时序序列的屏障，以前对于图像和NLP算法的划分，很大程度上是由于NLP有很明显的时序特征，即每个单词和下一个以及在下一个有比较明显的时序关系。

计算过程在于将attention数值就是除了“我”字自有信息和位置信息以外，成功得到这个句子中每个单词的相关度信息。

这是理论科研、算法、架构、工程的角度上，真正意义的进步。

ChatGPT到底可以关联多少行业?

公关，健身，金融，学术，数字营销

计算机，管理，体育，医美，自动驾驶

ChatGPT的火已经烧到了许多不同的行业。

程序员行业，ChatGPT拿下了谷歌120万年薪offer，可以做谷歌三级程序员。

金融行业，财通证券李跃博团队采用ChatGPT撰写了一篇医美行业研究报告《ChatGPT实测：提高外在美，增强内在自信——医疗美容革命》。

ChatGPT拥有强大的的语言理解能力，可广泛应用于多种对话问答场景，包括智能客服、虚拟人、机器人、游戏 NPC 等应用领域。

文娱传播行业，在ChatGPT输入你想要的文本要求，它一分钟就能生成小说，诗歌，企业年报，财报，金融研报，危机公关方案，健身计划，学术论文，高中作业，数字营销方案，计算机程序语言，医美方案，体育方案等等。

互联网行业，和目前的搜索引擎以及知乎等平台相比，ChatGPT给出的答案比较系统、全面，而且非常及时。

另外还有一些日常的文字处理工作，比如就某个主题写一个提纲或者起草一个方案，ChatGPT几秒钟就可以给出结果。

AI技术在2017年就曾写出过唯美诗歌集：“孤陈的城市在长夜中埋葬/他们记忆着最美丽的皇后/飘零在西落的太阳下/要先做一场梦……”(微软小冰《阳光失了玻璃窗》)

甚至，ChatGPT还能回答专业度较高的问题，充当AI在线知乎，以及创作小说大纲(仿《流浪地球》)。

AI绘画作品出圈、一级投资活跃，2022年AIGC爆发式发展。

AI作词、作曲、编曲等，具体包括由旋律生成歌词、由歌词生成旋律、不同曲风旋律生成、和弦生成、音乐续写等，可应用于音乐欣赏、游戏音效、实体场景配乐等多个领域。

使用AI对视频进行编辑，包括删除视频特定主体、自动跟踪剪辑、视频特效生成、自动添加特定内容、视频美颜等，大大降低了视频编辑的专业门槛，提升了视频剪辑效率，目前已广泛应用于视频创作领域，具体应用包括剪映、百度智能创作平台、抖音、美图等。

ChatGPT 在学术、房产等领域的应用逐渐落地。除了各大科技公司，ChatGPT也开始应用于学术、房产等领域。

美国房产中介也开始使用 ChatGPT，用于房源信息撰写、房贷计算等。

中国传媒大学数据科学与智能媒体学院副教授王小宁在接受《环球时报》采访时谈道，“ChatGPT的出现是一种机遇和挑战的结合，在发挥它优势的同时，也应该认真对待它可能带来的问题。”

ChatGPT时代，人类会逐步失业吗?

最近ChatGPT的再次出圈，让许多人又开始探讨和研究AIGC。

这样的氛围确实很好，不过人类可能也需要对AI抱有更多的理智。

一方面，AI还有很多缺陷。

比如ChatGPT作为语言模型，是一个极度偏科的“文科生”。

粗略来说，它可以通过极大的文本训练量把话说得人模人样，但却很难“长脑子”，也就是通过自己的逻辑思考来得出结果。

最主要的问题之一就是聊天机器人和文本生成工具无法判断内容的质量和好坏，可以学习网络上所有文本，可能产生恶意的甚至攻击性的语言输出。

另一方面，ChatGPT的记忆力有限。

虽然ChatGPT能够记住用户说过的话，但ChatGPT目前也只能从当前会话中引用最多约3000个单词，因为超出此范围的任何用户信息都不会被保存。

ChatGPT暂时还无法胜任人类营养师及健身教练的工作，因为这些工作涉及用户隐私、数据保存以及个性化推荐等。

如果ChatGPT算对了一个简单的加法，很可能是因为网上就这么说的，而不是它真的会算。

在对海量文本数据集的学习之上，ChatGPT形成的预测和关联知识，其实质是将人类已有的群体知识连接在一起的自动化媒介。

ChatGPT这类基于人类群体知识和记忆的知识生产方式，总体而言还是“人工”带来的智能，它的成就必然与既有的主要基于个体知识与记忆的知识生产方式产生冲突。

因此，在ChatGPT后时代，不少行业的从业人员工作会受到适量冲击。

但也像谷歌，微软等科技巨头和金融界大佬所分析的，ChatGPT只能从事基础程序员工作，更高级的工作需要更多学习，迭代后有望出现机会，但目前很多金融和科技类工作分析还是富含个性化思维，目前ChatGPT还很难建立自己的逻辑，并非《流浪地球》里的智能量子计算机Moss。

据投资公司 Radical Ventures 预测，GPT-4 或采用更大规模的数据集，可能在10 万亿个 token 的数据集上进行训练，同时它的参数有望比 Megatron-Turing 的要少。GPT-4 有可能是多模态的，支持文本、图片、视频等多种数据类型的输入。意味着 GPT-4 可以根据文本提示词(prompt)生成图像，或者是可以输入视频然后通过文本的形式回答问题。

但就目前而言，ChatGPT目前的成功主要是技术上的，我们在拥抱其带来的机遇的同时，也应当看到ChatGPT的漏洞。

比如，一，在各专业领域的运用，还需要进行各专业领域的特殊训练和模式适应。

如金融行业，人工智能算法可以生成研报，在投研领域，ChatGPT主要应用的大规模预训练语言模型技术已被广泛投入使用。

但是当其引入垂直金融领域落地时，其预训练环节还需要调整。

一方面需要做加法，用金融领域的私有、专有数据对其进行增强样本的训练，补足通用模型在金融领域的短板;另一方面需要做减法，将超大模型中金融领域用不到的资源摘除。

不过以上的深入，也涉及到了金融行业的隐秘性信息安全等问题。

二，在ChatGPT 风口已至，商业化落地加速的同时，ChatGPT面临的潜在法律风险却也大幅上升。

ChatGPT其仅仅是Transformer和GPT等自然语言处理技术的集成，本质上依然是一个基于神经网络的语言模型，按计算机专业人士行话评价，依然还是“人工”智能。

人工两个字就很巧妙，AI与法律的边界也在于使用人工的不同人类与法律的边界关系。

据新闻报道，ChatGPT技术也被黑客拿来利用，作为其破坏行为升级的“新武器”。

黑莓(Black Berry)的一份报告调查了英国500名IT行业决策者对ChatGPT这项革命性技术的看法，发现超过四分之三(76%)的人认为，外国已经在针对其他国家的网络战争中使用ChatGPT。

近一半(48%)的人认为，2023年，将会出现有人恶意使用ChatGPT而造成“成功”的网络攻击，譬如网络罪犯使用人工智能聊天机器人来伪造可信的网络钓鱼邮件(57%)，提高攻击的复杂性(51%)，并加速新的社交网络攻击(49%)。

苹果手机用户就经常吐槽，自己的手机下载了国家反诈中心也防不胜防，各种钓鱼网站短信走cloud纷飞，一不留神就是点击进了一个社交网络攻击的陷阱。

目前，中国尚无国家层面的人工智能产业立法，人工智能在中国整体监管仍有待完善。

同时，ChatGPT带来的虚假信息存在法律风险问题。另外，AI技术广泛应用还伴随着知识产权的合规问题。

三，虽然生成式 AI 赛道火热，资金扎堆涌入，但是国外头部机构引领技术和商业应用，国内整体进度落后 2到3 年。

技术发展可能存在不及预期的风险，且当前 AIGC 技术仍有局限。

新的技术需要商业化验证目前 AIGC 的商业化仍处于早期探索阶段，有存在不及预期风险。

毕竟，不得不面对的残酷现实是，国内AI四小龙至今没有一家实现盈利。

ChatGPT背后的核心技术原理是什么