对于我个人来说,应该说很少对某些事件、事务去表达一些个人的主观看法,但是ChatGPT这一波确实是让我想破这个例,所以我也在这里留一下一些观点,看看未来的发展与我目前的想法会有多大的差别,我也很乐意被打脸。

ChatGPT是在2022年12月初的时候放出的,我记得刚出来那会并没有很快传播到大众视野,但是我还是很快从科技媒体相关的地方得知这个消息。因为之前玩了一把DALL•E已经有了OpenAI的账号,我也很快体验了一把,不过那会并没有多想,基于当前从事的内容,只是觉得它会颠覆智能助手。到如今这个时间点,已经是各种自媒体奔相走告、贴个对话截图就能发个视频、随便哪个领域的都要来蹭一脚、根本不相干的概念股直接起飞的情况,这个传播状况和当年DeepMind AI攻略围棋圈还不太一样,那会是一下就爆了,但是后续也并没有持续太久,而这次略微慢了一些,势能却是要比当时强很多,而且我觉得普罗大众目前对这个东西的感受还是不够,大家只是从各种信息中频繁看到并觉得它很牛逼。

我是觉得它还会引发更进一步的重视,要给予更多关注,尽可能的去熟悉、利用好它。尽管热度已经很高,并且我还处在极其相关的工作圈,目前在日常工作中,还没有很大的浪花,从我把GPT相关的东西摆在同事眼前让他直呼惊呆的状况可以看出,大家对于它强大的感受还是在表层。之所以这么觉得是因为最近百度的竞品文心一言发布后,从有所了解到逐步接触,花费了不少时间去体验和感受,强化了它确实能够对工作生活造成影响的意识,越体验越觉得有必须要给予更多时间到这个东西上面,当然了,这个重视肯定不是指看各种垃圾自媒体制造的垃圾,不过垃圾自媒体的狂轰滥炸也确实促使了我对它的进一步了解,反思一下会觉得毕竟我也只是个俗人。

简单介绍

GPT 是 Generative Pre-trained Transformer 的缩写,它是一种基于Transformers架构(一种用于自然语言处理的神经网络)的自然语言处理模型。通过在大规模文本数据上进行预训练,GPT 可以生成高质量、连贯的自然语言文本。其研究历史可以追溯到2015年Google发布的基于深度学习的循环神经网络语言模型。2017年,OpenAI推出了第一个版本的GPT,通过单向Transformer解码器进行训练。2018年,OpenAI发布更强大的GPT-2,采用更深、更大的Transformer解码器,并在多个任务上预训练。最近引爆热度的GPT-3采用1750亿个参数,能够实现多种自然语言处理任务,而更加强力的GPT-4也已经发布,其效果又有了进一步的大幅提升。

目前GPT让人感到惊讶、惊艳的点我觉得主要在于:

  1. AGI(Artificial General Intelligence)的General,通用、广泛是很长时间以来人类智能区别于高端机器智能的特点
  2. 逻辑推理:GPT展现出来的推理能力虽然有时候会翻车,会被弱智吧调戏,但是能够理解并且在理解之后给到类人专家级别的回复,这带给使用者的感受无疑是震撼的。
  3. 交流对话:对上下文的感知、修正、适应,会让使用者不自觉的赋予它类人的感觉,它可以被调教纠正。

数字工作者

那作为一个俗人,我也只能关注到我所在的群体,所以把范围缩小到我认为影响颇深的一部分:数字工作者,或者说更通俗一点是用电脑工作的人,我会把这部分分成内容创作和逻辑表达,不过这个不是互斥的,数字工作者往往同时需要这两种特质,只是比重有所不同。

对于内容生产来说,其实很多自媒体、UP主已经表达了一些担忧的心情,AI模型生成的内容质量已经达到了不错的高度,而且AI模型在调教之下是拥有极强的模仿、泛化能力的,这可能使得IP更加凌驾于内容之上,博取关注愈发地压制高质量内容,这是一个不太好的点,但就目前来说,毕竟模型还是现有的语料喂养出来的,真正硬核的内容生产者应该还没有这么快被卷到,反而AI能够提供一些基础框架上的帮助。真正的文学内容创作还是来源于自我思想表达本身,感觉AI还是无法取代,就于我自身来说,我也尝试直接让AI来写这篇博客,不过试来试去还是会觉得要自己写,效果不佳。但是对于内容搬运、加工、套路化输出这些操作来说,这股浪潮已在裤腿。

对于逻辑表达,我觉得一个是极大的降低了技能门槛,二个是极大丰富了工作者的武器库。某种程度上AI模型确实是改变了一些能力的权重,而且被增强的是一个技能属性相对较低的能力:针对模型的精准意图输出,这个在后面会做一些表述。生产力是解放了,但是无情的资本、多劳多得的社会意识摆在这里,加上国内这个人口,真的难说。但是,同样的,就目前来说,我认为复杂逻辑表达的工作者比如程序员要被完全替代还是不太可能的,而对于能够通过自然语言清晰明确地进行逻辑表达的工作(比如一句话就能表达的很清楚,但是实际操作起来很麻烦的情形),AI已经是完爆的情况了。

也要看到好的方面,AI对于创造力、想象力丰富的人来说是个超级强化,毕竟目前AI还是处于被动输出的位置,需要由人类作为主动发起方。数字工作者对这些本身也是挺敏感的。

码农

再具体到码农,记录下我目前的感受。

  1. 提高效率

    • 高效的知识检索:AI提供的知识检索能力明显超出搜索引擎,码农用搜索引擎相对还是很频繁的,按需搜索繁杂零碎的知识点是高频需求,但是目前还是需要使用者拥有判断是否正确的能力。
    • 高效逻辑分析和总结:阅读别人的代码或者回顾自己的代码逻辑是比较痛苦的,这种场景下的目标是对代码逻辑的概括和提炼,不需要过多注意细节,我自己也会有将远古代码用白话的方式记录下来的情况,因为屎山代码杂乱无章,实在是很容易看了这个忘了那个。AI这方面就很强,还能帮你写注释、写文档,甚至对于一些知名的开源组件,你只要告诉AI某个类名它就能给你分析出来这个类它干了什么事情。
    • 高效构建基座:自然语言是很容易表达一个大体上的概念的,寥寥几句话就可以,那对于形式化的代码骨架、基础结构,让AI生成真是又快又好。
    • 辅助编码:包括代码预测、代码修改、语法修正等等,是对现有辅助手段(如传统IDE提供的工具功能)的强力补充。这里多提一嘴,感觉老牌IDE厂商应该很慌,不知道是否、何时会出现破局者,可以体验下这款工具感受感受。
  2. 扩展思路

    这个就比较泛了,其实对所有工种、行业都适用,你可以直接让AI提供给你一些思路、选项,相当于直接多出一个高效的信息源。

  3. 自然语言代码生成

    这是比较让码农担忧的点,AI已经可以很好地将自然语言翻译成可运行的代码,直接将编程的门槛拉低、速率抬高,只是现在应该还做不到完全无监督、无修正。不过话又说回来,将需求转换成针对性的自然语言描述、对AI生成的代码进行校验、修正和调整,还是需要程序员的专业能力,编程开发也不仅仅只是编码,因此要说替代,现在还不现实。另外有一点是在编码上,自然语言表述相对于直接编码、IDE等硬辅助工具不全是优势,把你的任务总结成自然语言让AI输出,不一定比得上键盘鼠标快捷键,得分情况:任务太简单,不如快捷键;任务太复杂,自然语言的效率就偏低,想想如果要把屎山代码准确无误地用文字讲解出来是一件多么恐怖的事情。但可以肯定的是,有那么一部分任务是AI的优势,而且是大优势。

意图传输

根据各种各样的操作反馈来看,现在AI的上限是达到一个新的高度了,只要能够正确表达信息并被AI接收,对于普通的功能性实现,AI就可以利用远超于人类的算力、生成力带来巨幅提升,给予我们想要的结果,帮助我们达成目的。这就将很多人类的技能力转变成了优化意图传输的能力,在当前以自然语言表达为核心的情况下,怎么把我们的意图通过自然语言传递给AI模型,并且减少信息丢失就成了重点。
目前,作为思维的核心载体,自然语言比其他形式化沟通更全面和复杂,但信息在传递过程中依然会有丢失,这在日常沟通交流中就很常见,而且沟通不仅仅是语言,还包括肢体、表情、印象、外界环境等其他要素,这使得自然语言表达在不考虑歧义、上下文的情况下表意依然会有准确度的差别;其次是为达到目的,我们也开始进行适应调整,进行正向强化和反向抵消,这个在文生图的场景下更加明显,确实很像一个个咒语。再者就是思维意识的激发,某些想法可能是个人非常认同或者想做的,但是不一定在日常状态下能想到,其实也就是创造力的局限,语言表达的匮乏。这是Prompt工程如火如荼的开展起来的原因之一,也是我们需要在AI横空出世的情况下需要补强的方面,即针对AI模型的表意能力。此外,Prompt工程也包含了对歧义的纠正和规避,但是我认为这个方面在AI能力的进一步提升后会逐步变得不需要,这属于信息解码的正确性,与信息输入方无关。其实我们也和目前的AI一样,是从自然语言中提取特征进行理解和学习。

对于Prompt可以看看这个网站,然后看看这个项目,很典型,真就是如果你不会说话,那我来帮你说,你说的词不达意,我来帮你说。词穷在此刻被无限放大。

修仙既视感

在这波之前,学术科研人员通过各种各样的算法、数据训练目的是向类人化目标的方向去靠,这其中的向量化、神经网络等等已经脱离了普通的维度以及可视化的范畴,这就导致非专业人员很难去理解这个东西,包括本人,而且不仅仅是外行,对于相对内行的调参工程师,也有不少玄学的观点表达,将之比喻为“炼丹师”十分的形象。而练出来的丹药开始展现巨大威力的时候,大语言模型的磁力也让人类开始主动向模型靠拢,去学习、适应如何向AI表达意图以便更好地激发AI模型的能力,催生出各种各样的prompt工程,甚至prompt也开始有一种学科的感觉、开始作为一门生意,看着那一个个单词和一串串话术,那可不就是“咒术师”。抖机灵来说,于此,炼丹念咒,法力无边,活脱脱一个凡人修仙传。

脑洞

如果类似脑机接口这种技术能够更加完整的对人类的思维意识传输到AI模型,摆脱包括自然语言内的各种现有的方式,再辅以多模态的解码输出能力,那就不需要AR(Augmented Realistic)而直接进入AH(Augmented Human)时代了。再进一步,如果AI出现自主意识,那在此之前的科幻小说、科幻电影对于AI的设想将成为现实,而现在,也许人类才是AI的copilot。

结尾

最后感慨下,其实我表达的这些也没什么太大实质性的用处,对AI的沟通表达还是偏玄学,就现实实操来说,建议在GitHub上或者其他高质量的渠道内多关注下ChatGPT相关的内容,上面的各种实用工具、Prompt魔法都非常不错,目前网上的一些套壳网站大部分都是几个主流开源实现弄的。再就是让自己想法更多一些,思维更发散一些,我就很缺这个。

如今各方势力纷纷下场,变化浪潮之下,也总是伴随很多牛鬼蛇神,也要保持清醒。