🧠

大型语言模型的上下文工程

Jul 11, 2025

概述

本讲座探讨了大型语言模型(LLMs)上下文工程的概念,对比了确定性上下文和概率性上下文,并提出了实现更有效、更安全、更准确的代理结果的原则。

什么是上下文工程?

  • 上下文工程扩展了提示工程,考虑所有模型输入,而不仅仅是提示。
  • LLMs 处理提示、系统指令、规则和上传的文档作为上下文。
  • 目标是确保所有提供的上下文都能带来期望的模型结果。

确定性上下文与概率性上下文

  • 确定性上下文包括静态提示、文档和直接控制的数据。
  • 目前大多数建议侧重于优化确定性上下文以提高效率和降低成本(例如,令牌使用)。
  • 概率性上下文包括外部动态来源,如网络数据或大型内部数据库。
  • 当模型访问网络时,概率性上下文可能因数量庞大而压倒确定性数据。

概率性上下文的挑战与风险

  • 用户提示仅部分塑造访问的大量外部信息。
  • 很难确保模型响应使用高质量、可靠的来源。
  • 概率性上下文增加了安全风险,如潜在的 LLM 注入攻击。
  • 传统评估指标(准确率和召回率)对概率性上下文效果较差。

上下文工程原则

  • 预期并设计上下文中的信息发现,而不仅仅是静态输入。
  • 监控和审计模型使用的信息来源的质量和可靠性。
  • 在开放或半开放环境中采取防范注入攻击的安全措施。
  • 使用来源的相关性评分更好地评估决策准确性。
  • 系统地版本控制和测试提示以保持性能。

未来方向

  • 评估方法必须适应,考虑概率性上下文的影响。
  • 工程师应专注于塑造代理探索的上下文,而不仅仅是最小化令牌。

关键术语与定义

  • 提示工程 — 为 LLM 设计有效输入(提示)。
  • 上下文工程 — 形塑 LLM 输入的所有方面,包括提示、系统规则和外部数据。
  • 确定性上下文 — 提供给 LLM 的静态、受控输入数据。
  • 概率性上下文 — LLM 可访问的动态、外部或基于网络的信息。
  • 令牌 — LLM 处理的最小文本单位。
  • LLM 注入攻击 — 一种安全风险,恶意输入改变 LLM 行为。

行动项 / 下一步

  • 审查并记录您的 LLM 代理在研究任务中使用的来源。
  • 实施提示和上下文策略的版本控制。
  • 调查相关性评分和审计方法以提高决策准确性。
  • 学习概率性上下文环境的安全最佳实践。