大语言生成模型原理

chatgpt的本质,就是文本生成

模型本身,并没有试图去理解对话本身的意义。

chatgpt仅仅是通过文本生成,模拟出对话的效果而已。

深度讲解AI大模型原理,它到底是如何工作的 (qq.com)

万字长文,解读大模型技术原理!! (qq.com)

AI大模型引发三场革命,升级核心竞争力定义

在二十届中央财经委员会第一次会议上,提出“把握人工智能等新科技革命浪潮,增强产业体系完备和配套能力强的优势,高效集聚全球创新要素,推进产业智能化、绿色化、融合化,建设具有完整性、先进性、安全性的现代化产业体系。坚持三次产业融合发展,避免割裂对立;坚持推动传统产业转型升级”。

随着人工智能(AI大模型)相关的技术与发展走向,正在悄然带来的计算范式、人机交互与认知协作革命,对我们社会经济的影响可能是根本性和长期性的。

AI大模型是数字技术体系优化升级实体产业的“基础设施”,ChatGPT(文章)只是美国数字创新森林里的一棵树上的一片叶子,Sora(视频)是另一片叶子。都是在“基础设施”上生长出来的【智能体】。

这篇文章将从AI大模型及算力等基础设施的普及,带来人们应用AI大模型过程中,真正要构建的【智能体】能力是什么,该如何布局和落地进行描述。AI大模型重塑产业,如何布局适用于自身/企业的个性化“智能体

AI大模型重塑产业,如何布局适用于自身/企业的个性化“智能体AI大模型的三场革命,推动产业重塑

如今讨论AI大模型,最重要的议题是AI对于个人/组织相关产品、服务的效能带来的改变,以及对于每个人、企业、组织、区域和国家竞争力的变化。

计算范式革命:随着2017年谷歌发布Transformer模型,成为这一轮AI大模型发展的基础,算力从PC互联网时代的Windows+Inter、移动互联网时代的安卓+ARM,逐步走向如今的AI大模型+GPT。

大模型需要大算力,大算力需要更低的成本完成数字经济底层基础设施(算力)的迁移。这个迁移会从服务器、云计算开始,并逐步拓展到普通人使用的手机、笔记本电脑等等。未来计算的芯片、架构、存储、网络、通信、调度等,以及与之相关的协议和软件开发范式,都会迎来一次巨大的变革。

人机交互革命:几十年前,人类要和机器对话需要掌握汇编语言,然后有了Basic、C、C++,再后来有了图像交互界面,出现了Java、C#.NET。今天,我们可以通过自己的自然语言实现人机交互。从历史上看,每一次人机交互技术的进步,都会加速社会经济下每个产业的重塑。

认知协作革命:AI大模型重新定义了解决问题的路径和方法,它找到了从问题到答案的最短路径,这就是AI大模型的价值。计算范式和人机交互的革命,也将带来协作革命,大模型驱动的智能体会逐步深度嵌入各类组织的需求定义、应用开发、运维管理和资源调度等环节。AI大模型重塑产业,如何布局适用于自身/企业的个性化“智能体

AI大模型重塑产业,如何布局适用于自身/企业的个性化“智能体AI大模型重塑产业的路径:智能体

人工智能体(AI Agent)是基于AI大模型,针对明确的问题,能够自主感知环境,通过独立思考进行信息收集、整理和分析, 并最终做出决策提供执行反馈甚至行动的应用系统。

在Windows软件、互联网网站和移动终端APP的相关应用,都只能执行简单、单一的任务。虽然在交互层面上都在逐步优化,却始终并不友好。

而智能体结合AI大模型和特定的场景需求,可以精确理解用户的意图,并能引发更广且更深入的人机交互乃至人机协作。

这里简单描述一下智能体关键的四个模块:规划(Planning)、记忆(Memory)、工具(Tools)、行动(Action)。

规划:是智能体的“思维模式”。如果用人类来类比,当接到一个任务时,我们的思维模式可能会像下面这样: