Akamai 将收购 LayerX，以便在任何浏览器上实现 AI 使用控制。获取详情

Back 产品 Close

云计算

网络安全

内容交付

查看所有产品

我们的基础设施

全球服务

Back 云计算 Close

人工智能 (AI)

Akamai Inference Cloud

存储

Object Storage

Block Storage

Backups

数据库

Managed Databases

计算

GPU

CPU

Kubernetes

App Platform

Accelerated Compute

无服务器

Akamai Functions

网络

Cloud Firewall

DNS Manager

NodeBalancers

Private Networking

查看云定价

探索适合您需求的方案与定价——从小型项目到全球规模部署。

查看价格

开始使用 Akamai 云

立即注册，解锁专为您的业务打造的云计算、边缘计算和 AI 工具。

注册

查看所有云计算产品

Back 网络安全 Close

应用程序和 API 安全

API Security

App & API Protector

Firewall for AI

Client-Side Protection & Compliance

爬虫程序和智能体控制

Account Protector

Content Protector

Bot Manager

AI Brand Presence

分段

Akamai Guardicore Segmentation

Zero Trust 安全

Secure Internet Access

Enterprise Application Access

Akamai MFA

身份、凭据和访问管理

基础架构安全

Edge DNS

Prolexic

IP Accelerator

DNS Posture Management

Brand Guardian

开始使用安全服务

全方位保护助力业务发展的应用程序— 随时随地，风雨无阻。

联系销售代表

查看所有网络安全产品

Back 内容交付 Close

应用程序性能

Ion

API Acceleration

IP Accelerator

媒体交付

Adaptive Media Delivery

Download Delivery

边缘应用程序

EdgeWorkers

EdgeKV

Image & Video Manager

Media Services Live

Cloudlets

Cloud Wrapper

Global Traffic Management

监控、报告和测试

Data Stream

mPulse

CloudTest

开始使用内容交付服务

依托 Akamai 的敏捷性与超大规模，助力您完美打造非凡的数字体验。

联系销售代表

查看所有内容交付产品

Back 解决方案 Close

云计算

无服务器

媒体

SaaS

出海游戏

查看所有云计算产品

安全性

网络安全合规性

勒索软件防护

保护应用程序和 API

DNS 交付与安全

Zero Trust

DDoS 防护

爬虫程序和智能体控制

身份、凭据和访问管理

查看所有网络安全产品

内容交付

应用程序和 API 性能

媒体交付

查看所有内容交付产品

行业解决方案

媒体和娱乐

零售业、旅游业和酒店业

金融服务

医疗保健与生命科学

公共部门

游戏

服务提供商

查看所有行业解决方案

Back 定价 Close

安全与内容交付

开始使用

联系销售代表

免费试用

云定价

价格总览

定价列表

特定产品价格

GPU

CPU

Kubernetes

查看所有产品价格

云定价

试用 Akamai Cloud，获赠价值 100 美元的抵扣额度*

借助全球云基础架构，加速出海部署——无意外账单、无供应商锁定且所有数据中心均价格透明

立即试用

*详情请见促销兑换规则和条件

Back 开发人员 Close

云开发人员

开发人员中心

Akamai GitHub 代码库

文档和指南

云文档

指南与教程

Cloud Marketplace

开发者应用程序

开始使用 Akamai 云

立即注册，解锁专为您的业务打造的云计算、边缘和 AI 工具。

注册

Back 资源 Close

新鲜资讯

Akamai 博客

活动和研讨会

学习

白皮书，电子书，视频，产品简介

客户案例

培训和认证

网络安全研究

Akamai 安全情报小组 (SIG)

《互联网现状》(SOTI) 报告

合作伙伴

携手 Akamai，推动创新、扩展规模、提升竞争优势

渠道合作伙伴

合作伙伴门户

合作伙伴案例

技术合作伙伴

技术合作伙伴目录

登录

Back 登录 Close

Cloud Manager
管理您的云计算服务

Back 登录 Close

Control Center
管理您的安全和内容交付服务
中文
Back Language Close
- English
- Deutsch
- Español
- Français
- Italiano
- Português
- 中文
- 日本語
- 한국어

创建帐户

正遭受攻击 ?

Akamai Cloud

立即注册，解锁专为您的业务打造的 AI 计算、存储与托管 K8s 服务。

Akamai 安全与内容交付

联系我们的销售团队，共同探讨您的业务需求并获取理想的解决方案。

联系销售代表

什么是大语言模型？

大语言模型 (LLM) 是人工智能 (AI) 领域最具变革性的进步之一。这些强大的工具使机器能够以前所未有的规模和深度处理、理解和生成人类语言。无论是回答问题、翻译文本还是创建 ChatGPT 等对话式 AI，LLM 都是塑造世界的生成式 AI 技术的核心。

大语言模型：定义

大语言模型 (LLM) 是一种旨在理解和生成人类语言的 AI 模型。利用神经网络（特别是具有 Transformer 架构的网络）构建的 LLM 使用海量文本数据集进行训练。它们会学习自然语言的模式、结构和含义，使它们能够执行各种基于语言的任务，例如总结、文本生成和情感分析。一些最知名的 LLM 示例包括 OpenAI 的 GPT-4 和 GPT-5、Google 的 Gemini、Meta 的 Llama 和 Microsoft 的 Copilot。

大语言模型的关键组件

LLM 依赖于几个关键组件和技术。

数据集：LLM 使用广泛的数据集进行训练，这些数据集通常包含来自书籍、网站、文章等的数万亿字词。收集的这些数据可确保广泛涵盖各种主题并理解语言上的细微差别。
神经网络：神经网络是一种机器学习模型，其设计旨在模拟人类大脑的运作方式。神经网络由互联的节点（即人工神经元）组成，用于处理和分析数据。在大语言模型中，神经网络可通过处理海量文本来帮助学习语言的运作方式。
Transformer 架构：作为一种功能强大的神经网络模型，Transformer 架构非常擅长理解和使用文本。Transformer 模型依赖于一种称为自我注意力的方法，根据句子中字词之间的关系来理解哪些字词最为重要。
训练过程：大语言模型需要经过涉及数十亿或数万亿个参数的严格训练过程，这些参数有助于预测序列中的下一个字词并执行其他语言任务。
微调：进行训练后，LLM 通常会针对特定任务或特定于域的数据集进行微调，以提高其在特定应用场景下的性能。

大语言模型的运作方式

大语言模型会执行几个步骤来理解语言、学习模式并产生有意义的响应。

自注意力：此概念是 LLM 理解上下文的关键。当模型读取一个句子或文档时，注意力机制会分析所有字词之间的关系，以确定最重要的字词，而不是对所有字词都一视同仁。这有助于模型理解上下文。
嵌入：LLM 使用称为嵌入的过程将字词转换为数字，而不是像人类那样直接处理字词。这些数字用于捕捉字词的含义以及字词之间的关系。此数字格式使模型能够更轻松地处理和理解语言。
训练：在训练期间，LLM 会通过预测句子中的下一个字词来了解语言的运作方式。这称为下一字词预测。例如，如果模型读取到的输入是“The sun is __”，那么它会学习去预测“shining”或“bright”。通过使用数十亿或数万亿的示例重复此过程，该模型可以学习语言的模式、语法和结构。
优化：在模型训练时，它会调整数百万或数万亿个称为参数的微小设置，以便更好地完成其任务。此步骤称为优化，它使大语言模型能够随着时间的推移变得更加准确和高效，甚至可以培养处理棘手或异常语言场景的能力。
推理：在此阶段中，大语言模型会利用其存储的知识来生成准确的答案或执行有用的操作。它可以编写故事、总结文章，或将句子翻译为另一种语言。

大语言模型的应用场景

大语言模型已经彻底改变了许多任务和技术。

对话式 AI：大语言模型通过为 ChatGPT 和 Bard 等系统提供支持，正在推动对话式 AI 向前发展。这些工具能够为客户支持、虚拟助手和教育应用程序提供自然、具备情境感知能力的交互，从而实现顺畅直观的对话。
编程：在编程领域中，LLM 可通过协助完成代码生成、调试和文档编写等任务来简化工作流程。GitHub Copilot 等工具使用这些模型来节省开发人员的时间并减少错误，同时也降低了初学者学习编程的门槛。
搜索：LLM 通过了解查询中的语义关系来增强搜索引擎，从而提供更准确、更相关的结果。它们使系统能够直接提供答案，而不再只是返回一堆链接，从而提高了信息检索的速度和效率。
翻译：大语言模型改进了语言翻译质量，能够为文本文档和实时交流提供高质量的转换。它们支持多语言内容创作和本地化，可帮助企业与全球受众建立联系。
内容创作：LLM 正在通过生成文章、营销文案和创意写作作业来改变内容创作。它们可帮助作家集思广益并创作引人入胜的内容，从而提高新闻和广告等领域的生产力。
学习：LLM 能够提供个性化学习体验和 AI 导师。这些工具可将复杂的主题化繁为简并提供定制化的支持，让学生和教师都能从中受益。

大语言模型正在如何改变各行各业

LLM 正在重塑几乎各个行业，并提供更智能、更快速且更高效的解决方案来应对复杂的挑战。

医疗保健：大语言模型可以总结医学研究、帮助医生了解最新行业动态以及起草易于患者理解的报告，从而医疗保健行业提供支持。它们还可以在患者与医务人员之间实现更便捷的沟通。
金融：在金融领域，LLM 可自动执行报告生成、欺诈检测和财务分析等流程。它们能够为银行和投资公司提供智能聊天机器人，从而提升客户服务。
零售和电子商务：LLM 正在通过为用于引导客户的虚拟购物助手赋能并实现个性化推荐来改变零售和电子商务行业。它们还可以改进产品描述并优化在线商店的使用体验。
教育：教育系统利用 LLM 来自动完成评分和报告生成等任务，同时还可以为学生提供个性化的学习工具。由 LLM 赋能的 AI 导师使教育变得更加普及并且更具吸引力。
法律：法律行业使用 LLM 起草合同、总结判例法并开展法律研究。这些工具还能够简化复杂的法律文档，使其更容易被客户理解。
营销和广告：在营销和广告行业，LLM 对于创作广告文案、个性化电子邮件和社交媒体帖子至关重要。它们会分析受众数据，以帮助有效定制营销活动。
媒体和娱乐：在媒体和娱乐行业，LLM 能够生成剧本、歌词和其他创意内容。它们还可以通过实现个性化推荐和总结内容来提升观众体验。
客户服务：LLM 赋能的聊天机器人可以高效处理常见查询并进行故障排除，从而能够改善客户服务。这些工具可缩短等待时间并提供拟人化交互。
旅游和酒店：LLM 能够简化行程规划、预订和客户支持等任务。它们还能通过在多种语言之间翻译文档和对话来实现无障碍沟通。

大语言模型的好处

大语言模型 (LLM) 带来了一系列好处，因此其在各个领域和行业中都有着极高的价值。

多功能性：LLM 最显著的优势之一是能够处理各种任务。无论是医学研究或法律文件分析等特定领域的专用应用，还是对话式 AI 等更具通用性的应用，它们几乎可以适应任何涉及理解和生成人类语言的场景。例如，它们可以帮助翻译语言、创作营销内容或协助编程工作，而所有这些都几乎不需要进行定制化处理。
可扩展性：LLM 易于扩展，这意味着它们可以部署在各种平台上，并通过 API 集成到现有系统中。开发人员可以使用 GPT 或 PaLM 等模型为从客户服务聊天机器人到高级分析工具等各种应用提供支持。这种可扩展性使得 LLM 非常适合那些希望实现流程自动化、进行创新和提高效率，但又不想从头开始构建 AI 系统的企业。
可及性：许多大语言模型（例如 Llama 和 BERT）都是开源的，因此研究人员和开发人员能够免费或低成本地采用这些技术。这种开放可用性使用户能够在不需要大量资源的情况下修改模型、发现新的应用场景并增强现有功能，从而为创新提供支持。它可以实现前沿 AI 技术的普及，并能够为小型企业或个人研究人员提供公平的竞争环境。
实现功能增强：LLM 特别擅长“零样本”学习，这意味着它们在无需额外训练数据的情况下可以处理全新的任务。例如，它们可以按照从未经过明确训练的方式总结文本。这种灵活性减少了针对新问题或小众问题开发 AI 解决方案所需的时间和精力。

大语言模型的局限性和挑战

尽管具有令人印象深刻的能力，但大语言模型仍面临着几项重大挑战。为了能够负责任且有效地使用这项技术，我们必须解决这些挑战。

偏见：LLM 使用海量数据集进行训练，而这些数据集往往包含人类的偏见，包括刻板印象、错误信息或代表性失衡。因此，这些模型可能会无意中生成存在偏见甚至有害的输出。例如，它们可能会反映出训练数据中存在的性别或种族偏见，因此必须监控并优化它们的回答。
占用大量资源：训练 GPT 等大语言模型需要大量的计算能力、电力和存储空间。这不仅会导致这些模型的开发成本高昂，而且引起了人们对其环境影响的担忧，因为训练此类模型需要消耗大量能源。
准确性：尽管 LLM 可以生成令人印象深刻的结果，但它们并不总是准确的。它们可能会产生“幻觉”，即生成不正确、荒谬或误导性的信息，尤其是在设计模棱两可或微妙的问题时。这种局限性使得它们在缺乏严格监督的情况下，无法可靠地用于高风险应用（例如法律或医疗咨询）。
伦理问题：对生成式 AI（包括 LLM）的滥用带来了道德挑战。这些模型可能会被用于创建有害内容、传播错误信息或侵犯隐私。例如，它们可能会生成虚假新闻文章或逼真的网络钓鱼电子邮件，因此必须实施防范此类滥用的保护措施。

常见问题

大语言模型 (LLM) 是一种利用深度学习来处理和生成人类语言的 AI。深度学习是一种更广泛的技术，它通过训练神经网络识别数据中的模式来为 LLM 提供支持。生成式 AI 是指任何能够创建新内容（例如，文本、图像或代码）的 AI，而 LLM 是一个专注于基于文本内容生成的具体示例。

自然语言处理 (NLP) 是专注于理解和处理人类语言（包括翻译、总结和情感分析等任务）的 AI 领域。大语言模型是 NLP 技术的一个分支，它们利用 Transformer 等先进技术，能够以高准确度和流畅度来执行各种语言任务。

LLM 之所以会产生幻觉，是因为它们根据训练数据中的模式生成回答，而不会去验证事实。这种概率方法意味着，它们可能会创建听起来合理但错误的信息，尤其是在面对不完整或模棱两可的输入时。

基础模型是一种使用各种数据集进行训练的大型通用 AI 模型，可用作对许多特定应用进行微调的基础。基于 Transformer 的双向编码器表示 (BERT) 和 GPT 等模型是基础模型的示例，能够提供广泛的语言理解和生成功能，这些功能可根据翻译或问题回答等任务进行定制。

GPT 代表生成式预训练 Transformer，它描述该模型的关键特征：它会生成文本（生成式），在经过微调（预训练）之前使用大型数据集进行了训练，并使用 Transformer 架构来处理和理解语言。‌

客户为什么选择 Akamai

Akamai 是一家致力于支持并保护在线商业活动的网络安全和云计算公司。我们卓越的安全解决方案、出色的威胁情报和全球运营团队可提供深度防御，保护各地的企业数据和应用程序。Akamai 的全栈云计算解决方案可在海外分布广泛的平台上提供高性能且经济实惠的服务。众多全球企业信赖 Akamai，凭借我们卓越的可靠性、扩展性和专业技术，企业能够从容拓展业务。

查看云定价

开始使用 Akamai 云

开始使用安全服务

开始使用内容交付服务

安全与内容交付

云定价

云定价

试用 Akamai Cloud，获赠价值 100 美元的抵扣额度*

开始使用 Akamai 云

合作伙伴

Akamai Cloud

Akamai 安全与内容交付

什么是大语言模型？

大语言模型：定义

大语言模型的关键组件

大语言模型的运作方式

大语言模型的应用场景

大语言模型正在如何改变各行各业

大语言模型的好处

大语言模型的局限性和挑战

常见问题

大语言模型、深度学习与生成式 AI 之间有何区别？

自然语言处理与大语言模型有何区别？

为什么 LLM 有时会产生幻觉？

什么是基础模型？

GPT 代表什么意思？

客户为什么选择 Akamai

了解更多

Akamai 云计算

边缘云计算

其他资源

分布式云：新一代技术

可移植性的力量：采用云原生的 5 大业务优势

相关页面

相关博文

准备好开始了吗？有疑问吗？