AIGC智能营销:4A模型驱动的AI营销方法与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.2 主流的基础模型

“基础模型”一词通常与“大语言模型”大致同义使用。这两个术语之间的区别在于,大语言模型专门指专注于语言的系统,而基础模型则试图确立一个基于功能的更广泛概念。

这类模型是使用大规模数据集进行预训练的人工智能模型,主要用于处理和理解自然语言。这些模型不受语言的限制,能够执行多种语言理解和内容生成任务,包括文本摘要、翻译、问答、对话生成等。

大部分大语言模型首先在大量未标记的文本数据上进行预训练,学习语言的特征。这个预训练阶段不针对特定任务,目的是让模型学习到丰富的语言知识,并具备语境(上下文)的联系能力。之后,模型可以通过微调,根据特定任务进行输入内容的优化。

2022年,OpenAI公司发布GPT-3.5,引发的现象级轰动迅速席卷全球科技界。各家科技巨头纷纷投入巨资研发并推出自己的大语言模型,这场竞赛正愈演愈烈。它不仅能够更好地保证自己的数据安全,不受外部供应商的约束,而且能够帮助企业抢占未来流量的入口:大语言模型以及相关的应用,将成为新的“搜索引擎”“社交媒体”和“办公工具”。

当前的大语言模型竞争格局中,美国在基础模型和图像生成模型领域占据了领先地位,而中国紧随其后,在基础理论研究和基础模型开发方面进展迅猛。与此同时,其他国家和地区也在积极参与这场竞赛,推出的大语言模型,虽然在全球竞争中并不占优势,但展现出了积极的发展态势。

接下来,我们将重点介绍几个在全球范围内应用广泛的大语言模型。

1.GPT

GPT由OpenAI公司开发,目前已经推出了多个版本,包括GPT-3.5、GPT-4、GPT-4-turbo、GPT-4o,以及一个多模态版本GPT-4 Vision(或记为GPT-4-V)。

GPT模型的发展可以追溯到2018年,从最初的GPT-1到最新的GPT-4,每一代模型的迭代都在规模和性能上产生了巨大飞跃。根据相关的报道,GPT-4的参数数量估计可能超过10000亿。参数数量通常被用来衡量大语言模型的先进性和潜在能力。更多的参数数量通常表明模型具有更大的容量来学习训练数据中的复杂模式和关系。这反过来又帮助大语言模型在内容生成和任务处理上表现更好。

但是,需要注意的是,参数数量不是影响大语言模型能力的唯一因素,训练数据的质量以及训练方法也起着重要作用。

GPT模型以其强大的知识更新能力和细粒度的输出控制而闻名,能够根据最新信息生成回答,并在回答中精确控制文本的细节和风格,满足多样化的场景和需求。

GPT的应用场景广泛,包括自动写作、机器翻译、语言理解等。GPT提供的通用API,开发者和企业能够轻松集成和使用。微软、Duolingo、Stripe、Descript、Dropbox和Zapier等公司都采用GPT模型来提升用户体验和业务效率。

ChatGPT是基于GPT技术的聊天机器人,免费版使用GPT-3.5,付费版则可以使用GPT-4以及GPT-4o。我们在内容创作、数据分析和策略制定等多个营销领域对ChatGPT(基于GPT-4模型)进行了深入测试,发现其在文本创作、创意支持、信息检索、数据分析以及风格转换等方面显著超越了其他大语言模型。此外,ChatGPT在理解用户意图、遵循指令以及辅助内容生成方面的表现同样卓越。

2.Claude

Claude是由Anthropic公司开发的一种大语言模型。Anthropic公司是由OpenAI团队的两位前成员创立的,他们在开发Claude时强调创建一个“更温和、更可靠”的AI系统。Claude在安全性上更加严格,这极易导致用户被封号。我们可以通过访问poe.com来使用Claude的基本功能。

Claude模型的设计重点之一是提高模型的可靠性和安全性,确保其生成的内容符合道德和安全标准。Anthropic通过在模型训练阶段注入道德规范和安全机制来减少有偏见或有害内容的生成。

Claude现在有Claude 2、Claude 3等多个版本。2024年3月4日发布的Claude 3系列包括Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku多个版本。其中旗舰模型Claude 3 Opus在多项指标上超过了GPT-4和Gemini 1.0 Ultra。

Claude模型特别擅长处理超长的文本序列,这对于理解复杂文档和长篇内容至关重要。我们对Claude 3 Opus进行了长文本处理和测试,发现其在处理长文本、保持文本风格、提高准确性以及增强客观性等方面超越了其他大语言模型。然而,在逻辑推理和创意生成方面,Claude 3 Opus的表现并不如GPT-4。

3.Gemini

Gemini是谷歌推出的一个大语言模型家族,包括多个版本,每个版本针对不同的应用场景进行了优化。Gemini Ultra是该系列的旗舰模型,参数数量为1750亿,擅长处理复杂语言任务和多模态输入。Gemini Pro是一个“轻量级”版本,参数数量为1370亿,适合对速度有要求的应用场景。Gemini还有一个应用于移动端设备的Gemini Nano,参数数量约为400亿。

Gemini的一个显著优势在于能够访问网络,通过谷歌搜索获取并处理实时信息。根据我们的测试结果和使用体验,Gemini在对时事新闻搜索和信息更新上,无论是中文还是英文内容,表现都优于其他大语言模型。

4.通义

阿里巴巴通义大模型是阿里巴巴集团自主研发的大语言模型。通义系列模型涵盖了从5亿到720亿参数的不同规模,以满足不同场景的需求。根据通义千问自己的回答,阿里巴巴已发布全球首个突破100万亿参数的AI大模型。

通义支持多种语言,包括中文、英语、日语和韩语。通义能够处理各种复杂的语言任务,包括文本分类、问答系统、机器翻译、情感分析等。

通义模型在阿里巴巴生态内部得到了广泛的应用,涵盖了电商搜索引擎、个性化推荐系统、客户服务自动化以及高质量内容生成等多个领域。它的集成不仅提升了用户体验,还提高了业务流程的效率,为阿里巴巴的多元化业务场景提供了强大的语言处理支持。

通义模型的文本风格丰富多彩,语言表达生动活泼,这使得它在营销策略和营销文本的创制方面尤为出色。它能够根据不同的场景和需求,灵活调整语言风格,从而更好地吸引目标受众的注意力。然而,在使用通义模型时,我们也应注意到,它在描述事实时可能会展现出一种偏向于电商领域的语言风格。这意味着在生成的文本中,可能会出现较为频繁的形容词使用,以及对事实的某种程度上的夸张。

5.文心

文心是由百度自主研发的大模型,基于百度飞桨深度学习平台构建。百度也是在ChatGPT推出之后,在中国最先推出大语言模型的公司之一。

相关资料显示,文心大模型的某些版本的参数总量达到了1.5万亿。文心4.0版本被报道使用了超过1万个GPU的集群进行训练。

文心大模型以其独特的知识增强特性而著称,这一核心特色使它能够有效地从大规模知识库和海量非结构化数据中提取并融合信息,从而实现更高效、更精准的学习过程。这种能力不仅提高了学习效率和效果,还确保了模型的行为具有良好的可解释性。在智能客服、教育辅导、医疗咨询等多个实际应用场景中,知识增强特性使文心大模型能够提供更加专业和准确的服务,这对于提升用户体验和增强用户信任度起到了关键作用。

当我们向ChatGPT和通义千问询问“知识增强”的含义时,ChatGPT解释称,知识增强并非营销噱头,而是百度文心大模型的一个显著优势,它凸显了模型在处理复杂和知识密集型任务时的高效性和先进性。通义千问则表示,“知识增强”是百度文心大模型基于技术创新和实际应用效果而提出的核心竞争力之一,旨在克服传统语言模型在处理知识密集型任务时遇到的限制,这一特性具有重大的技术和实用价值。

文心一言是一款类似于ChatGPT的聊天机器人,提供两种版本供用户选择:文心3.5(免费版)和文心4.0(付费版)。这两个版本都继承了文心大模型的强大能力,能够以灵活、互动的方式与用户进行交流,提供信息查询、知识分享和创意互动等服务。

6.智谱

智谱大语言模型是由清华大学KEG(知识工程组)实验室和智谱AI公司合作研发的大型语言处理模型。

这款模型专注于中文场景,旨在提供强大且全面的自然语言处理能力,尤其是在中文理解、生成和应用方面。智谱模型特别优化了对中文语言结构、文化背景和语境的理解能力,能够更准确地把握中文表达的微妙之处。智谱大语言模型在生成长篇文章、连续对话以及创意内容方面表现出色。

但是经过我们的测试,智谱大模型在英文理解和生成上的表现也不错,在英文翻译成中文方面的表现更是优于其他模型。

智谱大模型可以让开发者和研究者免费使用,这不仅降低了技术门槛,还极大地促进了创新和学术研究的开展。

智谱清言,作为智谱系列的聊天机器人应用,为用户提供了两种版本:GLM-3版本和GLM-4版本。这两款版本均向用户免费开放,使用户能够无障碍地体验和利用智谱大模型的强大能力,无论是在学术研究、技术开发还是日常交互中,都能享受到这一先进语言处理工具带来的便利。

智谱清言不仅是一款功能强大的聊天机器人应用,它还内置了类似于G P Ts的智能体功能中心。这一创新特性允许用户根据自己的需求创建自定义的智能体,从而进一步扩展了智谱清言的应用范围。

我们依据写作本书时可获取的信息及最新动态整理了一张对照表(见表1-3),对GPT、Claude、Gemini、通义、文心以及智谱等基础模型进行了横向比较。需要提醒的是,随着时间推移,相关信息可能会发生变动。

表1-3 6种基础模型比较

各大基础模型都有其独特之处,但也存在一定的局限性。在实际应用中,可以根据具体需求和场景选择适合的模型。同时,各大模型在不断迭代和优化,而且未来可能还会有更多优秀的大语言模型出现。