XuLaLa.Tech

首页客户端下载Windows 使用V2Ray 教程SSR 教程Clash 教程

中国改革发展研究 | 焦永勤:大模媒体:由ChatGPT引发的智能通讯革命及其社会影响

2024.06.25

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信: 咨询 公众号:Ai

大模传媒:ChatGPT引发的智能沟通革命及其社会影响

焦永勤

(海南大学国际传播学院,海南海口 570228)

DOI: 10.15886/j.cnki.hnus.202307.0067

摘要:ChatGPT作为一种基于海量数据和大规模预训练而产生的具有海量参数的大模型媒介,正在引发全球范围内的新技术创新与传播。大模型媒介以其对人类自然语言习惯的常识性、结构化、会话性文本的强大理解和生成能力,正在引发一场智能通信革命,从而极大地拓展人类信息传播的广度和深度,也将深刻影响人类社会的形态和结构,成为不可或缺的“社会行动者”和决定性的“社会力量”。

关键词:大模型媒体;ChatGPT;智能沟通革命

2022年底,Open AI发布ChatGPT,迅速引起全球广泛关注和讨论。黄仁勋、比尔·盖茨等人视其为一场技术革命,而美国前国务卿亨利·基辛格、谷歌前首席执行官埃里克·施密特和麻省理工学院施瓦茨曼计算机学院院长丹尼尔·哈滕洛赫尔联名撰文称ChatGPT“是自印刷术发明以来从未有过的冲击……它们将重新定义人类知识,加速我们现实世界的改造,重组政治和社会”[1]。2023年3月14日,Open AI发布GPT4。GPT4的内容生成能力远超GPT3.5,应用场景更加丰富,市场反应也更加热烈。微软先是宣布投资100亿美元将其接入自家搜索引擎,推出New Being。随后谷歌、Meta、百度、科大讯飞、阿里巴巴、360等也纷纷发布自己的大模型。 显然,ChatGPT 的成功引发了人工智能发展领域的一场“新基础战争”[2]。

目前,国内传播界对ChatGPT的研究主要集中在应用场景、技术特性、传播特性、媒介特性、传播影响等方面。其中,对ChatGPT媒介特性的探讨无疑是大家关注的焦点。周宝华将其命名为“新知识媒介”:“以ChatGPT为代表的生成智能,被理解为人类最新的新知识媒介,它不仅产生新知识,更重要的是引起人类知识获取和知识寻求模式本身的重大变革”[3]。方兴东等人将其与社交媒体进行对比,将其命名为“智能媒介”,是“以算法为基础,以数据为驱动,作为内容生产和传播核心的媒体形态”[4]。上海大学的高飞等人将其定义为“智能机器人媒介”[5]等。那么,ChatGPT到底是“新知识媒介”、“智能媒介”、“智能机器人媒介”,还是别的什么呢?要理解这个问题,首先要了解ChatGPT的技术核心。

ChatGPT的技术核心

ChatGPT,即Chat Generative Pre-trained Transformer,是一种生成式预训练Transformer模型。李倩等人从技术角度分析了ChatGPT的主要架构和主要组件,指出其语料体系、预训练算法与模型、微调算法与模型构成了其内在的技术核心[6],为我们理解ChatGPT提供了更清晰的思路。

1.海量语料数据是基础

ChatGPT 的语料体系“由预训练语料和微调语料两部分组成”,其中预训练语料“包括 OpenAI 从书籍、杂志、百科、论坛等收集并初步清理的大量无标签文本数据”[6]。其中,仅从 Common Crawl 爬取的数据就达到 45 TB,清理之后仍有 570 GB(见表 1)。

表1 ChatGPT语料数据列表

注:数据来源:哈尔滨工业大学《ChatGPT研究报告》

此外,微调语料库还“包括代码微调语料库和对话微调语料库两部分……包括从开源代码存储库、专家标注、用户提交等收集并处理的高质量标注文本数据……其中,对话微调语料库包括生成、问答、聊天等9种以上的标注数据。通过对对话语料库的微调,ChatGPT可以应对常见的人类聊天场景”[6]。

2. Transformer模型是核心

ChatGPT 的底层架构是 Transformer 模型,该模型为大型模型提供了基础框架:“该领域的一个关键发展是使用 Transformer 架构和底层的注意力机制,这大大提高了语言模型处理自然语言文本中长距离依赖关系的能力。”[7] Transformer 最早由 Vaswani 等人在 2017 年的论文《Attention is all you need》中提出,是一种深度学习自然语言处理(NLP)模型,特别适合处理文本序列数据。Transformer 的创新之处在于使用了自注意力机制算法,该算法可以有效捕捉输入序列中任意两个位置之间的依赖关系。自注意力机制又称为“自我注意力机制”或“内部注意力机制”,是“一种将单个序列的不同位置关联起来以计算该序列的表示的注意力机制”[8]。

自注意力机制不仅考虑当前单词和所有其他单词之间的关系,还考虑所有单词之间的关系。在处理序列数据时,自注意力机制使得模型能够将注意力分布到输入序列中的所有位置,从而捕获序列中的长距离依赖关系。

这种相关性计算是基于词向量(word embedding)机制的。词向量机制可以将单词从其原始的文本形式转换为机器学习模型可以处理的数值向量。在词向量机制中,每个单词被表示为高维空间中的一个向量,这个向量可以捕捉单词的语义、词性、情感等信息。相似或相关的单词在这个高维空间中距离较近,而不相关的单词距离较远。这种表示方法可以将复杂的单词和语义关系映射为数学的几何关系。例如,单词的相似度可以表示为向量的接近程度等,从而使词向量机制可以有效地用于各种自然语言处理任务。

3. 大规模生成式预训练模型保障内容生成的准确性

ChatGPT基于Transformer模型架构,对其从网上爬取的海量数据进行大规模生成式预训练,其目标是让模型学习语言的基本规则和模式。这一过程中采用的策略是一种叫做自回归的训练策略。自回归训练的方式是模型根据序列中前面的元素来预测序列中的下一个元素。在自然语言处理任务中,模型会根据输入的上下文来预测下一个单词或字符。这种算法使得ChatGPT能够生成连贯、有语境的文本,使其在处理各类语言生成任务时表现出色。通过这种大规模的训练,模型可以在无监督的情况下学习到大量的语言知识,从而形成大量的参数,这些参数可以达到数千亿甚至数万亿的级别,从而保证了大模型对人类语言的超强理解和生成能力(见表2)。

表2 各代GPT参数列表

注:数据来源根据网上资料整理

4. 微调预训练,保证人机对话顺畅

ChatGPT 是在生成式预训练大模型 GPT-3.5 的基础上进行微调的。“在 GPT-3.5 的基础上,科学家引入了从人类反馈中获取的强化学习(RLHF)来对模型进行微调……也就是在微调阶段引入指令对齐技术,包括强化学习(RL)、提示调优、思路链等技术手段”[9]。在这个过程中,模型通过学习输入与输出之间的关系来调整自身的参数,使得预测输出能够更接近实际输出。

从以上技术特点来看,基于Transformer模型对海量数据进行大规模生成式预训练所形成的数千亿甚至数万亿级参数的大模型无疑是ChatGPT的技术核心。这个大模型使得其能够更加有效地处理更大规模的文本数据,从而为理解和生成更加符合人类语言习惯、认知习惯和交流习惯的文本奠定了基础。

两个概念解析

1. 算法、模型和大模型

算法是描述如何从输入到输出的一系列详细计算步骤。在人工智能领域,算法通常指用于创建、训练和优化模型的步骤,包括处理和转换数据的预训练步骤、学习模型参数的优化步骤以及提高模型性能的调整步骤。

模型是数学模型,是能够从数据中学习并做出预测或决策的数学结构。模型的设计和训练包括选择合适的算法和数据,并在训练过程中不断调整模型的参数,以优化模型的性能。在人工智能领域,模型是指包含众多参数的系统,它利用计算机算法从输入的数据中学习规则形成系统参数,并利用这些系统参数对新数据进行预测或决策。常见的模型有决策树、逻辑回归、神经网络等。其中,神经网络模型,尤其是深度学习模型,近年来在各种任务中表现出超强的性能,如自然语言处理、图像识别、语音识别等。

大型语言模型(LLM)是指包含大量参数(通常数十亿或更多),能够捕捉和模拟数据中更复杂、更深层次的关系,在处理复杂任务时表现更出色的深度学习模型。其基本类型包括大型语言模型、大型图像模型、大型音频模型、大型多模态模型、大型强化学习模型等。

可以看出算法是模型的基础,是一套数学计算程序或方法,模型是包含很多基于算法训练出来的参数的数学结构,而大模型则采用更高级的算法,比如深度学习算法,通过海量数据的预训练积累海量参数。

2. 智能媒体和智能内容生成媒体

智能媒体又称智慧媒体,是指利用机器学习、自然语言处理、计算机视觉等人工智能技术,以更加智能、自动化的方式处理、生成、分发和理解媒体内容的技术或工具。智能媒体包括智能搜索引擎媒体、智能推荐系统媒体、智能内容生成媒体等。

智能内容生成媒体特指生成人工智能内容(AIGC)的媒体,如人工智能文本生成媒体、人工智能图像生成媒体、人工智能视频生成媒体等,其基本特征是内容生成的自动化、多样化和个性化。

3. 大型模型媒体

从上述技术分析来看,ChatGPT的大模型属性是其根本属性,正是基于大模型自注意力机制、生成式预训练和微调预训练的创新,才使其拥有了处理海量数据的强大计算能力,能够生成高达数千亿甚至数万亿的海量参数,从而在一定程度上复制了我们大脑的神经机制,使其能够在一定程度上理解和复现我们的现实世界。从概念分析来看,智能内容生成媒介是ChatGPT的主要媒介特征,智能内容生成能力是其媒介的基本特征。因此,将ChatGPT命名为大模型智能内容生成媒介或大模型媒介可能更为准确和恰当。

ChatGPT 作为大媒体的代表,充分体现了大媒体的基本特征:首先,能够理解并生成符合人类自然语言习惯的常识性文本。这充分体现在 ChatGPT 对自然语言模式的把握,即语义准确性、连贯性、隐喻性和文化性原则。如图 1 所示,ChatGPT 对“蒹葭”一词的自然性、隐喻性和文化性的把握非常准确:

图 1. ChatGPT Plus 生成的关于“蒹葭”的文本

第二,能够理解并生成符合人类自然语言习惯的结构化文本。结构是人类语言的基本模式,而人类语言的基本模式很大程度上依赖于结构化的思维和表达。这种结构化的思维和表达方式通常以文本结构的形式体现在文本中。目前,ChatGPT至少掌握了时间结构、空间结构、因果结构、分类结构、组织结构、层级结构的原理。下图2生成的诗歌,用时间结构来比喻一棵树的生长过程:

图2 ChatGPT Plus 生成的诗歌文本

第三,能够理解并生成符合人类自然语言习惯的对话文本。对话是人类最常用的自然语言交流方式,因为它允许即时反馈,能够传达大量非语言信息,并能根据不同的身份、地位和对话环境灵活变化,因此对话被认为是最有效的沟通方式之一。ChatGPT本身就是被设计为对话机器人,为此Open AI专门针对对话进行了微调和预训练,“不仅大大提高了对用户意图的准确性和理解力,还支持连续多轮对话,主动承认自己的错误,质疑不正确的问题,甚至承认自己缺乏专业的技术知识,这些特性大大提高了对话交互模式下的用户体验”[4]。目前,ChatGPT至少掌握了对话连贯、反馈、策略、上下文、礼貌和合作等原则。 例如,以下页面ChatGPT中图3的对话就否定了提问者的判断:这种否定回答“给人一种读到柏拉图对话录中呈现的苏格拉底式辩论技巧的感觉”[10]。

图 3 ChatGPT Plus 生成的负面文本

因此,ChatGPT能够理解人类自然语言的常识、结构和会话习惯,并与人进行自然、深入、多轮对话的能力,无疑已经超越了当前绝大多数智能内容生成媒介,是一个“革命性”的大模型媒介,其在内容生成方面的强大智能性必将对我们的传播环境和社会环境产生深远的影响。

三大典范媒体将引发“智能传播革命”

ChatGPT在全球的快速蔓延,预示着一场创新性的扩散正在发生:一方面,从普通大众的角度来看,“ChatGPT呈现阶段性的网络扩散趋势,初期以小范围理性的技术讨论为主,后期市场想象力开始介入,话题迅速升温,引发短期爆炸式的“爆发”;另一方面,从专家的角度来看,“学界普遍认可其作为生成式人工智能产品的突破性和重要价值”[11]。在此基础上,Google、Meta、百度、科大讯飞、阿里巴巴等推出的模型大媒体,以及Midjourney、Diffusion等智能图像生成模型大媒体,也都具备相近或相近的智能内容生成能力,从而引发智能传播的革命。

1.大型媒体将大大拓展信息传播的广度

首先,大媒体将以指数级的传播速度扩大信息传播的内容。大媒体能够生成各种类型的内容,这让任何需要生成内容的场合,无论是新闻出版、社交媒体,还是教育、医疗、法律、商业等领域,都可以利用这一技术提高生产力和效率。其次,大媒体将大大提升信息传播的效率。首先,大媒体自动生成内容的能力将大大减少内容生成的时间和成本;其次,大媒体高效的信息搜索和提取能力可以从海量信息中快速提取有用信息,从而大大提高人们的信息检索效率;最后,大媒体生成个性化内容的能力可以更好地满足用户的需求,从而减少无关信息的干扰,提高用户信息接收的效率和质量。第三,大媒体将大大拓展信息传播的受众范围。 大媒体近乎无所不能的内容生成能力,不仅在日常生活中发挥着巨大的作用,而且在某些专业领域也拥有非凡的能力,比如教育、医学、法律、学术、编程等,很可能成为某些专业领域的基本工具,从而大大增加受众的使用场景和范围。

2.大型媒体将全面提升信息传播深度

首先,大模型媒介的技术特性决定了“大模型能够从原始数据(大型语言模型为文本,大型多模态模型为文本-图像)中学习出更复杂、更高阶的特征/模式,从而表现出更强的数据理解和生成能力”[12],能够发现数据背后更丰富、更复杂、更隐蔽的信息,如不同数据类型之间的潜在关系、需要多步推理的信息以及其他隐含或间接的信息,如天文与经济、地理与艺术的交集等。其次,大模型媒介的智能内容生成能力将极大地丰富我们人类的知识体系。大模型媒介生成的内容是基于大模型的海量参数智能生成的,而不是直接从其训练数据中复制而来,因此,无论这些内容是否具有创新性,都会融入我们的知识体系。第三,大模型媒介的“新知识媒介”特性不仅会影响我们个人的认知体系,还会影响整个社会的认知体系。 一方面,大媒体不仅能够提供事实性信息,还能生成包括观点、观察、建议等主观性内容,使其参与到意见交换、决策讨论等各类对话中。其智能化和高度个性化使得其能够理解用户的需求,提供符合其期望的信息,甚至帮助用户思考问题、做出决策,从而深度影响其个人的知识体系、判断体系、决策体系。对于个人用户而言,它不再仅仅是一个信息查询工具,而有可能成为能够提供深度互动、帮助思考、学习的智能伙伴。另一方面,大媒体也开始参与到整个社会知识体系的运行中,生成各种公开的、被广泛传播的文本,如新闻、报道、演讲、学术论文、图片、视频等。这些内容正在或将成为公共知识或舆论的一部分,从而影响更广泛的人群,影响更深层次的社会观念和形态。 从新闻报道的生成、公共话题的引导到社会问题的分析,大模型媒体的作用越来越广泛和深入,正在成为社会舆情的重要参与者和影响者:“ChatGPT展现了从个人知识到公共知识传播的演进过程……当机器生成的知识成为公共知识,成为公众对话、讨论和社会运作的资源时,必然会对舆情、公众传播、公众生活产生重要影响。”[3]

四大典型媒体将深刻改变人类社会的形态和结构

ChatGPT的创新扩散,本质上是人工智能技术发展的一次集中“涌现”,预示着一场技术革命正在发生。对此,百度CEO李彦宏认为:“这是一个以大模型为核心的人工智能新时代。大模型改变了人工智能,大模型很快就会改变世界。”[13]

1.大型模型媒体将重塑人类社会的“行动者网络”

行动者网络理论是布鲁诺·拉图尔等社会学家在20世纪80年代提出的理论框架,其基本观点是技术与社会密不可分,通过网络相互联系。在这个网络中,“行动者”既可以是人类,也可以是非人类实体,如技术、物体、概念等。每个行动者都会影响和塑造网络:“技术科学的历史很大程度上就是沿着网络出现的所有那些小发明的历史:要么加速数据的流动,要么增强准确性、聚合性和凝聚力,使远程行动成为可能。”[14]

从这个角度看,ChatGPT这样的大媒体,作为革命性的技术,已经成为最具活力的“行动者”,深度介入我们的社会结构,重构我们社会的行动者网络。或者说,以ChatGPT为代表的大媒体,已经成为不可或缺的“社会行动者”。

第一,大模式媒体将成为个人不可或缺的智能助手。目前,以ChatGPT为代表的大模式媒体已经开始帮助用户完成各种任务,如新闻写作、文学创作、教育教学、学术研究等,有些已经展现出卓越的才能。近期对媒体高管(出版商、编辑以及在其组织中担任高级职务的人员)的调查发现,近四分之一(23%)表示经常使用AI进行推荐,5%的人表示这是“我们工作的重要组成部分”[15]。第二,大模式媒体将成为企业不可或缺的智能生产要素。例如微软迅速推出了基于ChatGPT的New Bing。第三,大模式媒体将成为社会不可或缺的智能运营桥梁。ChatGPT等大模式媒体已广泛应用于教育、医疗、商业、法律、新闻、娱乐、学术等领域,正在重塑各行业的运作机制和方式。

2. 大型媒体将成为决定性的“社会力量”

大模媒体不仅会重塑我们人类的社会形态,而且会成为决定性的“社会力量”。第一,大模媒体将成为未来社会的基础设施。大模媒体数千亿甚至数万亿的参数背后,是海量数据大规模训练的结果,而这依赖于NVIDIA A100 GPU组合形成的强大算力。因此,大模媒体将会像电力、互联网一样,成为未来社会运转的基础设施。第二,大模媒体将会成为一个国家综合国力的根本体现。我们刚刚经历了一场信息革命,从计算机的发明到互联网的普及,信息已经成为一个国家最重要的资产。现在我们正在经历一场智能革命,信息技术和信息经济将全面融入智能革命,以数据、算法、算力为基础的大模媒体作为智能革命的“引擎”,将会成为一个国家综合国力的根本体现。第三,大模媒体将会成为国际交流乃至大国竞争的“隐形力量”。 ChatGPT的大媒体能力正在彻底改变我们获取和理解信息的方式,其国际影响力已逐渐显现,在这样的情况下,最先掌握和掌控其技术与应用的国家和组织必然会在国际传播和全球竞争中获得更大的话语权和影响力,它无疑已成为一种“隐性力量”:“以ChatGPT为代表的生成智能,把‘发现’的概率隐藏在后台,而其‘生产’的概率则更加隐蔽,更容易被忽略。ChatGPT知识生产的管控过程……而数据中所蕴含的人类历史知识的一切创造者及其沉淀的社会制度、意识形态、价值观、权力结构和文化观念,使得其知识生产过程和背后的权力实践机制极其复杂,难以辨别。”[3]

当然,我们也应该看到,像ChatGPT这样的大模型媒体由于数据不完整、模型不完善、预训练不完善等原因,还存在着生成错误、偏差、遗漏、幻觉等问题。但这并不影响它在全球的广泛传播和应用,也不影响它作为一种新型、垄断性极强的媒体形态对我们的认知和生活的颠覆。其强大的“内容生产力”一方面给我们人类带来了新的知识形态,但另一方面也可能带来法律、道德、伦理、文化和社会问题。因此,加强对大模型媒体的研究不仅是必要的,而且十分紧迫。

1KISSINGER H, ERIC S, HUTTENLOCHER D. ChatGPT预示着一场知识革命[N]. 华尔街日报, 2023-02-24(12).

哈喽大家好我是站长,美区火箭apple ID 土耳其apple ID 其他apple ID 账号资源,可加微信: 咨询 可扫码下方关注公众号获取账号教程资源

© 2010-2022 XuLaLa 保留所有权利 本站由 WordPress 强力驱动
请求次数:69 次,加载用时:0.665 秒,内存占用:32.19 MB