Jeffrey Erickson | 高级撰稿人 | 2025 年 9 月 22 日
正如科幻作品长久以来所预见的,我们人类正逐渐习惯与计算机对话。今天的大语言模型 (LLM) 与 AI agent 正是朝着这一方向迈出的巨大一步,而它们流畅的表达能力都要归功于自然语言处理 (NLP) 这一领域。每当您向手机口述信息、输入一段随意的搜索提问,或是让 AI 总结一份文档时,NLP 技术和方法都会开始运作。它们理解您的话语,并以您和邻居隔着栅栏聊天时会使用的那种语言生成回复。这一发展,值得我们深入探究。
NLP 是人工智能的一个分支,它使计算机能够理解、生成和处理人类语言。NLP 适用于语音和书面文本,可用于所有人类语言。一些已存在数十年的 NLP 技术和方法近年来取得了显著进步,在过去几年中,依托 NLP 技术的主流 LLM 更是推动其得到更广泛的应用。此外,通过 AI agent 的形式将 LLM 融入更复杂的工作流程中,将进一步提升 NLP 在日常生活中的应用程度。
如今的 LLM 源自计算语言学 (CL) 这一科学领域,该学科研究人类语言的计算建模;而 NLP 则是一门工程学科,专注于构建能帮助计算机理解、生成和处理人类语言的计算方法。过去十年间的重大突破得益于机器学习(AI 的一个分支,旨在开发能通过示例进行学习的系统)技术发展。近几年的技术发展,让机器学习能够理解大数据集中极其复杂的模式,使其非常适合学习语言的复杂细节。
将 NLP 集成到应用中的开发者主要利用 NLP 的两大分支:一个专注于语言理解,另一个专注于针对查询生成全新回应。自然语言理解 (NLU) 适用于情感分析、实体识别和关键短语提取等任务。这类任务要求 NLP 应用对文本或语音进行解析,以理解其表达内容;而自然语言生成 (NLG) 则在理解人类语言所包含的情感和细节的基础上,生成答案、翻译和摘要。如今,云技术服务供应商或开源平台(如 Hugging Face)提供的越来越多的 LLM 在运行过程中同时集成了 NLU 和 NLG 技术。
不断进步的 LLM,已将原本只能识别问题含义并匹配预设固定答案的基础 NLP 技术,转变为借助复杂神经网络、基于千万亿字节级通用数据训练而成的灵活交互对象。如今,计算机能够理解人类语言的结构和含义,让开发人员和应用用户可以与之进行更细腻的交流。这在商业、数据分析、人际关系、客户服务、医疗卫生等诸多领域都产生了深远影响 — 数据和文档变得易于检索和总结,其价值也前所未有地凸显。以下是 NLP 的部分应用实例。
NLP 是人工智能和计算语言学的一个分支,专注于让计算机理解和解读人类语言,因此拥有极为广泛的应用场景。凡是能从机器读取、解析文本数据并从中提取含义(模拟人类交流方式)中获益的应用场景,都适用于 NLP。考虑以下具体场景:
NLP 模型最常使用神经网络从文本训练数据中学习语言模式和特征表示。NLP 模型可在大规模数据集上进行训练,以完成情感分析、命名实体识别、机器翻译和文本摘要等任务。在 NLP 领域中,大语言模型通过从输入数据中提取的模式和特征,学习进行预测或生成文本。
NLP 的目标是弥合人类交流与计算机理解之间的鸿沟,使机器能够执行需要自然语言理解的任务。以下是需要考虑的一些具体方面。
实施 NLP 的常规步骤包括:
1. 收集和准备文本数据:从社交媒体、文档或网页内容等多种来源采集文本数据,再将其预处理为适合机器分析的格式。NLP 利用 AI 实现机器与人之间的语音交互,为此会运用一系列相关技术和任务。
NLP 可以简化并自动化大量业务流程,尤其是涉及电子邮件、调查问卷、社交媒体对话等大量非结构化文本的流程。借助 NLP,企业能够更好地分析数据,从而辅助做出正确决策。以下是 NLP 的一些真实应用示例。
NLP 领域已取得巨大进步,但同时也面临诸多挑战,我们将在下文展开讨论。科技企业和研究人员每天都在努力提升 NLP 系统的稳定性和适应性,使其更擅长理解和生成类人语言。这些努力将在机器翻译、虚拟助手、文本分析等领域带来重大突破。下面我们来看看具体的挑战和发展机遇。
处理人类语言的复杂性和歧义性(包括理解不同语言、方言中的语境、反讽和细微差别)并非易事。NLP 模型通常需要海量标注数据进行训练,而这类数据的制作非常耗时,获取成本高昂。
研究人员还面临着哪些其他挑战?
NLP 的未来发展重点,是在提升语言理解和生成能力的同时,让这项技术更易普及,并在各种应用中发挥更大价值。研究人员正致力于开发更高效的算法,增强多语言处理能力,打造仅需更少标注数据即可学习的模型。
NLP 领域的观察者可以关注以下趋势:
您是否知道,Oracle Cloud Infrastructure (OCI) 能为您提供升级和优化前沿 NLP 应用所需的一切?例如,OCI 生成式 AI 服务可轻松集成通用性强的 LLM(如 Cohere 的 Command 模型或 Meta 的开源 Llama 系列)并以简易易用的服务形式提供。您可以利用它对模型进行微调,以适配各种 NLP 场景,包括写作辅助、文本摘要、数据分析和智能对话。
为了让企业更便捷地使用前沿 NLP 技术,Oracle SaaS 应用可在任意需要的场景中即时提供 AI 能力,无需离开您日常支撑业务运行的软件环境。
随着 NLP 技术的持续发展,它将拥有巨大潜力,彻底改变我们与技术交互的方式,以及我们处理海量文本信息的模式。
从简单指令到复杂对话,自然语言处理是人机交互的关键密钥。它也为当下一些具有变革性的前沿 AI 创新提供了核心支撑。
NLP 如何改善客户服务?
NLP 可通过多种方式改善客户服务。它能够持续处理客户的语音和文字咨询,更快地解决问题。这得益于前沿 LLM 能够理解客户交互中的语境和细微含义。同样,它还能在通话结束后生成通话摘要和待办事项,帮助人工客服更高效地服务客户。
NLP 在业务分析中有哪些优势?
NLP 为更多用户开启了富有洞察力的业务分析。它让业务人员无需通过 SQL 等编程语言来探索数据,而是通过与 AI agent 进行自然语言对话即可实现 — 这类 AI agent 能够访问、整理并呈现企业数据库中的数据。
NLP 如何助力业务流程自动化?
NLP 通过理解和生成语言来实现业务流程自动化。例如,一款 NLP 应用可以接收发票,并自动启动开票和履约流程,员工只需对相关操作进行审核和批准即可。每处理一张发票,都能节省时间和精力。
NLP 和 AI 如何共同提升企业决策水平?
NLP 依赖机器学习,且通常需要借助前沿 AI 基础模型。这些 AI 能力能够为数据分析带来更高的灵活性和易用性,从而助力企业决策。例如,搭载 NLP 技术的分析平台可提供 agentic 界面,让业务人员使用自然语言向企业数据库提问。这使业务人员摆脱了预先设定好的仪表盘,能够在数据探索中发挥更强的创造力。
注:为免疑义,本网页所用以下术语专指以下含义: