🧠

大型语言模型的上下文工程

Jul 11, 2025

概述

本讲座探讨了大型语言模型（LLMs）上下文工程的概念，对比了确定性上下文和概率性上下文，并提出了实现更有效、更安全、更准确的代理结果的原则。

什么是上下文工程？

上下文工程扩展了提示工程，考虑所有模型输入，而不仅仅是提示。
LLMs 处理提示、系统指令、规则和上传的文档作为上下文。
目标是确保所有提供的上下文都能带来期望的模型结果。

确定性上下文与概率性上下文

确定性上下文包括静态提示、文档和直接控制的数据。
目前大多数建议侧重于优化确定性上下文以提高效率和降低成本（例如，令牌使用）。
概率性上下文包括外部动态来源，如网络数据或大型内部数据库。
当模型访问网络时，概率性上下文可能因数量庞大而压倒确定性数据。

概率性上下文的挑战与风险

用户提示仅部分塑造访问的大量外部信息。
很难确保模型响应使用高质量、可靠的来源。
概率性上下文增加了安全风险，如潜在的 LLM 注入攻击。
传统评估指标（准确率和召回率）对概率性上下文效果较差。

上下文工程原则

预期并设计上下文中的信息发现，而不仅仅是静态输入。
监控和审计模型使用的信息来源的质量和可靠性。
在开放或半开放环境中采取防范注入攻击的安全措施。
使用来源的相关性评分更好地评估决策准确性。
系统地版本控制和测试提示以保持性能。

未来方向

评估方法必须适应，考虑概率性上下文的影响。
工程师应专注于塑造代理探索的上下文，而不仅仅是最小化令牌。

关键术语与定义

提示工程 — 为 LLM 设计有效输入（提示）。
上下文工程 — 形塑 LLM 输入的所有方面，包括提示、系统规则和外部数据。
确定性上下文 — 提供给 LLM 的静态、受控输入数据。
概率性上下文 — LLM 可访问的动态、外部或基于网络的信息。
令牌 — LLM 处理的最小文本单位。
LLM 注入攻击 — 一种安全风险，恶意输入改变 LLM 行为。

行动项 / 下一步

审查并记录您的 LLM 代理在研究任务中使用的来源。
实施提示和上下文策略的版本控制。
调查相关性评分和审计方法以提高决策准确性。
学习概率性上下文环境的安全最佳实践。

Full transcript