概述
本讲座探讨了大型语言模型(LLMs)上下文工程的概念,对比了确定性上下文和概率性上下文,并提出了实现更有效、更安全、更准确的代理结果的原则。
什么是上下文工程?
- 上下文工程扩展了提示工程,考虑所有模型输入,而不仅仅是提示。
- LLMs 处理提示、系统指令、规则和上传的文档作为上下文。
- 目标是确保所有提供的上下文都能带来期望的模型结果。
确定性上下文与概率性上下文
- 确定性上下文包括静态提示、文档和直接控制的数据。
- 目前大多数建议侧重于优化确定性上下文以提高效率和降低成本(例如,令牌使用)。
- 概率性上下文包括外部动态来源,如网络数据或大型内部数据库。
- 当模型访问网络时,概率性上下文可能因数量庞大而压倒确定性数据。
概率性上下文的挑战与风险
- 用户提示仅部分塑造访问的大量外部信息。
- 很难确保模型响应使用高质量、可靠的来源。
- 概率性上下文增加了安全风险,如潜在的 LLM 注入攻击。
- 传统评估指标(准确率和召回率)对概率性上下文效果较差。
上下文工程原则
- 预期并设计上下文中的信息发现,而不仅仅是静态输入。
- 监控和审计模型使用的信息来源的质量和可靠性。
- 在开放或半开放环境中采取防范注入攻击的安全措施。
- 使用来源的相关性评分更好地评估决策准确性。
- 系统地版本控制和测试提示以保持性能。
未来方向
- 评估方法必须适应,考虑概率性上下文的影响。
- 工程师应专注于塑造代理探索的上下文,而不仅仅是最小化令牌。
关键术语与定义
- 提示工程 — 为 LLM 设计有效输入(提示)。
- 上下文工程 — 形塑 LLM 输入的所有方面,包括提示、系统规则和外部数据。
- 确定性上下文 — 提供给 LLM 的静态、受控输入数据。
- 概率性上下文 — LLM 可访问的动态、外部或基于网络的信息。
- 令牌 — LLM 处理的最小文本单位。
- LLM 注入攻击 — 一种安全风险,恶意输入改变 LLM 行为。
行动项 / 下一步
- 审查并记录您的 LLM 代理在研究任务中使用的来源。
- 实施提示和上下文策略的版本控制。
- 调查相关性评分和审计方法以提高决策准确性。
- 学习概率性上下文环境的安全最佳实践。