跟随编程之 Foundation Models 框架篇 - Meet with Apple - 视频 - Apple Developer

跟随编程之 Foundation Models 框架篇

获得使用 Foundation Models 框架访问 Apple 设备端 LLM 的实际操作体验。在这个在线讲座中，我们将在 Xcode 中实时演示如何将生成式 AI 功能融入示例 App 中，你可以跟随我们一起进行编程。我们将引导你实现基本文本生成等核心功能，并探讨一些进阶主题，包括结构化数据输出的引导式生成、动态 UI 更新的流式响应，以及用于检索数据或执行操作的工具调用。

欢迎大家参加讲座。如要跟随编程，你需要一台搭载 Apple 芯片的 Mac，它应该支持 Apple 智能，并且运行最新版本的 macOS Tahoe 26 和 Xcode 26。

活动语言为英语。

章节
- 0:00:00 - 简介
- 0:03:33 - 资源和系统要求
- 0:05:04 - 先决条件和设置
- 0:06:30 - 初学者项目导览
- 0:10:32 - 第 1 章：Foundation Models 框架基础知识
- 0:11:51 - 第 1.1 章：提出你的第一个生成请求
- 0:15:50 - 第 1.2 章：使用指令引导模型
- 0:18:46 - 第 1.3 章：处理模型可用性
- 0:20:50 - 第 1.4 章：在视图中处理可用性
- 0:24:07 - 第 1.5 章：创建行程生成器
- 0:27:07 - 第 1.6 章：更新视图以显示文本输出
- 0:32:43 - 第 2 章：生成结构化输出
- 0:34:36 - 第 2.1 章：生成简单的结构化输出
- 0:37:52 - 第 2.2 章：生成嵌套的结构化输出
- 0:41:58 - 第 2.3 章：重构行程生成器
- 0:44:48 - 第 2.4 章：更新视图以显示结构化数据
- 0:49:22 - 第 3 章：提示词技巧
- 0:50:25 - 第 3.1 章：使用 PromptBuilder 构建提示词
- 0:53:23 - 第 3.2 章：一步到位的提示词
- 0:55:31 - 第 3.3 章：使用示例更新行程生成器
- 0:59:11 - 第 4 章：流式传输响应
- 0:59:51 - 第 4.1 章：更新行程生成器以进行流式传输
- 1:02:52 - 第 4.2 章：更新视图以呈现流式传输内容
- 1:08:16 - 第 5 章：工具调用
- 1:11:12 - 第 5.1 章：构建 FindPointsOfInterestTool
- 1:16:32 - 第 5.2 章：允许模型访问 FindPointsOfInterestTool
- 1:23:07 - 第 5.3 章：更新行程生成器以使用工具
- 1:27:39 - 第 6 章：性能和优化
- 1:34:20 - 第 6.1 章：预热模型
- 1:36:56 - 第 6.2 章：优化提示词
- 1:41:16 - 总结和后续步骤
资源
大家好欢迎参加 Foundation Models 框架跟随编程我叫 Shashank 我是 Apple 的技术布道师今天很高兴能引导大家将设备端生成式 AI 功能直接集成到 App 中我们将介绍从基本提示词到生成结构化输出、流式传输响应等各个方面的内容在 Slido 上有我们专业的专家团队如果你在任何时候有任何问题请在那里提问我们先快速概述一下确保大家的理解是一致的在 WWDC24 上我们推出了 Apple 智能它由内建于我们操作系统核心的大型基础模型提供支持这带来了写作工具和智绘表情等系统级功能你们中的许多人都请求访问底层模型为此我们在 WWDC25 上推出了 Foundation Models 框架它让你能够直接访问为 Apple 智能提供支持的设备端大语言模型这通过强大的 Swift API 来实现对于开发者来说这种设备端方法具有显著优势用户数据能够保持私密因为所有内容都在本地运行你的功能在离线时完全能正常工作而不需要设置账户或管理 API 密钥对于你或使用 App 的用户来说这类请求不会产生任何费用由于它是操作系统的一部分因此不会影响 App 大小
今天我们将一起构建一款 App 我们首先构建一个简单的静态 App 来列出地标然后将它转换为动态旅行规划器你将了解如何生成丰富的结构化行程以用于自定义 UI 并在创建结果的同时实时流式传输结果你还将了解如何允许模型访问自定义工具以查找真正的兴趣点最后还将了解如何优化 App 性能
让我们快速了解一下将构建的最终 App
这是在我的 Mac 上运行的一个已完成的 App 也是今天的讲座结束时你将获得的成果我们将首先来查看使用 SwiftUI 构建的简洁且清晰的著名地标列表让我们选择一个地标 Serengeti 怎么样？
当我们点按进入详情视图时你会看到页眉图像和描述底部是“Generate Itinerary”按钮当我点按这个按钮时 App 将调用设备端模型生成一个完整的三日旅行计划请密切关注屏幕看看发生了什么
UI 正在实时自行构建首先是标题接着是描述然后是每日计划这就是我们将在第四章中引入的流式传输 API 它将打造出色的动态用户体验这里不仅仅是一个代码块它是丰富的结构化响应我们将在第二章中了解相关知识我们将在不同部分中显示每天的安排每一部分都有标题、副标题和地图请注意这里的 Hotel 1 和 Restaurant 1 等名称这些不是随机生成的 App 使用工具调用来获取这些名称我们将在第五章中介绍相关知识借助 Foundation Models 框架你可以打造丰富的结构化智能体验将这种体验无缝融入自己的 App 中这就是我们今天要一起构建的内容要充分从今天的跟随编程讲座中获益你可以使用三个关键资源首先是 Xcode 初学者项目在其中所有样板 UI 和资源都已准备就绪如果正在 developer.apple.com/cn 或 Developer App 上观看这个视频你会在页面底部的 “资源”下找到这个项目如果你正在 YouTube 上观看项目已链接在视频描述中第二个是网页上的分步指南这是可信来源其中包含所有说明和代码片段你可以直接拷贝粘贴这些内容以免输错最后一个资源是直播中的我幕后还有专家团队为你解答疑问在这里我将与你一起构建这个项目说明每项更改背后的原因在我们进入设置并设置项目之前让我们快速了解一下今天讲座的系统要求欢迎大家观看并跟着操作但是如果你打算和我一起实时编程则需要一台搭载 Apple 芯片且运行 macOS Tahoe 和 Xcode 26 的 Mac 你还需要确保在“设置”下打开了 Apple 智能今天我将直接在 Mac 上构建并运行这个 App 但你也可以使用 Xcode 26 并将运行 iOS 26 的最新 iPhone 作为目标设备
接下来让我们按照跟随编程指南中的 “先决条件”部分操作下载和配置我们的初学者项目
在我们的指南中你将看到“先决条件”部分首先请点按链接下载项目文件
下载后你将在这里找到一个 zip 文件 macOS 可能会自动解压缩这个文件在其中你会找到一个名为 FoundationModelsCodeAlong 的文件夹这是我们今天将使用的初学者项目它包含所需的所有视图、模型和占位符代码让我们能够顺利开始我已经打开了项目可以开始了
我们首先要做的是设置开发者团队在项目导航器中选择项目文件
然后选择“Targets”
点按“Signing & Capabilities” 在“Team”下选择下拉菜单并选择你的团队
为了确保一切都能正常工作请在 Xcode 工具栏中选择“My Mac”作为运行目标设备
然后点按运行按钮这将构建并运行项目或者可以使用 Command + R
这里显示的是我们将构建并在其中添加生成式 AI 功能的 App 这是我们的着手点在整个讲座中我们将添加强大的功能现在让我们快速了解一下初学者项目
首先有一个 Playground.swift 文件它包含在 Playgrounds 文件夹下在这里我们将对提示词进行迭代并单独测试 Foundation Models API 而无需构建并运行整个 App 对提示词感到满意后我们将这段代码移到我们的 App 中
接下来是 ViewModels 文件夹其中对我们最重要的文件是 ItineraryGenerator.swift 这个文件中包含用于创建和管理基础模型会话、调用框架 API 和处理结果的所有核心逻辑最后还有一个 Views 文件夹
我们的所有 SwiftUI 代码都在这里在这个跟随编程讲座中 UI 大多是预先构建好的以便我们能专注于 Foundation Models 框架你会注意到这里有几个文件为了方便大家跟随编程将编辑的关键文件都有编号
我们的任务是获取行程生成器的输出并将输出连接到这些视图以打造丰富的交互式 UI 在 App 中呈现
当浏览这些文件时你会注意到有一些特殊注释格式如下 Mark Code-Along Chapter 后跟编号这里的每个编号都直接对应于跟随编程指南中具有相同编号的章节你可以使用 Xcode 查找导航器来搜索章节编号查看所有未完成的代码更改
在这里输入章节编号你将看到所有代码更改每完成一个步骤我们便会删除相关注释这样我们就能跟踪跟随编程的进展情况
总之我们将完成三个简单步骤首先在 Playground 中试验其次在视图模型中实现核心逻辑最后在视图中显示结果让我们详细了解一下每种视图
第一个屏幕是我们的着手点显示地标主列表它由 LandmarksView.swift 提供支持今天我们不会修改这个文件它已经设置好了让我们可以浏览并选择目的地当你轻点一个地标时将进入详情屏幕这个视图由 LandmarkDetailView.swift 文件控制它的作用是检查 Foundation Models 框架在设备上是否可用并根据这一信息决定要显示的 UI
接下来是 LandmarkTripView 它的作用是显示 “Generate Itinerary”按钮这也是一开始显示从模型获取的原始非结构化文本的地方
最后是 ItineraryView 这是我们的目标视图这个视图呈现在跟随编程结束时我们将拥有的丰富结构化行程数据
现在我们可以深入探讨议程了我们将跟随编程分为六章我们将首先探讨最基础的内容你将了解如何开始向模型发送提示词以生成文本然后我们突破简单文本的局限看看如何从模型获取结构化的 Swift 类型从而轻松地将模型输出映射到你的自定义视图然后我们将深入探讨提示词技巧这让你能够在提示词中直接提供高质量的示例以提高模型的准确性接下来我们将了解如何流式传输模型的响应以实时更新 UI 从而提供出色的用户体验然后我们将探讨工具调用工具是有效的方式让模型能够访问你自己的自定义函数和数据以扩展自身功能最后我们将介绍性能优化以使生成式功能运行速度更快响应更迅速接下来让我们深入探讨 Foundation Models 框架的基础知识你可以使用 Foundation Models 框架向简称 LLM 的设备端大语言模型发送提示词然后 LLM 可以根据提示词进行推理并生成文本例如你可以让它生成一份巴黎三日游行程模型会提供一个详细的计划作为回应
要开始向模型发送提示词你需要创建一个会话这个框架围绕有状态的语言模型会话这一概念构建它会保留所有提示词和响应的历史记录在本章中我们将熟悉基础模型提示词和会话首先我们将在 Playground 中熟悉一下这个 API 我们将创建一个语言模型会话并从模型获取第一个响应然后我们将添加简明指令以细化调整语气和内容接下来我们了解一下可用性 API 以妥善处理不同状态熟悉这些操作后我们将切换到 App 在视图模型中更新行程生成器并在视图中显示原始文本输出让我们前往跟随编程指南
在第一章中我们的目标是向设备端语言模型发出我们的第一个请求我们将使用 Xcode Playground 发送简单的文本提示词看看会发生什么这有助于我们了解模型的基本行为
直接将这个代码块拷贝并粘贴到 Xcode Playground.swift 文件中可以使用右上角的快捷按钮“Copy” 我将逐步添加这些代码行并讲解各项操作让我们前往 Xcode 打开 Playground.swift 文件要向模型发送提示词需要完成三个简单步骤第一步是导入 Foundation Models 框架我们已完成这一步下一步是创建 Playground
使用 Playground 宏创建 Playground 后你会看到右侧显示了一个画布如果没有看到你可以随时点按编辑器选项确保“Canvas”旁边有一个勾号你可以点按刷新按钮它的作用是运行包含在 Playground 代码块中的所有代码现在你看不到任何输出因为我们还没有添加任何代码向模型发送提示词的第二步是创建会话
在这里我们定义了 let 变量 session = LanguageModelSession 你会看到 Playground 画布中自动显示 session 变量中的内容你会看到有一些工具我们将在后面的章节中讨论然后还有会话记录其中包含你与模型的所有对话
第三步是向模型发送提示词
我们定义 let response = try await session.respond to 并提供提示词 Generate a 3-day itinerary to Paris 这是一个异步请求因此我们要等待才能收到响应
完成这一步后在右侧的画布上你会看到有一个 response 变量其中包含一些属性第一个是 prompt prompt 显示 Generate a 3-day itinerary to Paris 然后还有一个名为 content 的属性类型为字符串让我们点按这个属性你会看到有一份详细的畅游巴黎三日行程这里有一份三天的巴黎探索计划包含城市里最经典的景点和体验你可以看到每日计划其中包含第一天、上午、下午的安排等信息
好极了让我们返回指南并讨论一个关键主题当你第一次调用 session.respond 时你可能会注意到存在轻微的延迟这是因为在设备端语言模型处理你的请求之前需要先载入到内存中我们的第一个请求会触发系统载入模型操作这会导致产生初始延迟我们将在后面的章节中了解如何解决这个问题我们还看到输出是非结构化的自然语言文本这易于我们阅读但难以在自定义 Swift UI 中使用在下一章中我们将了解如何使用 Swift 类型而不是原始文本生成结构化输出最后务必注意生成整个行程的过程中没有任何数据离开你的设备数据是完全私密的并且可以离线使用恭喜你你使用 Foundation Models 框架成功向设备端基础模型发送了提示词
哦最后还有一点让我返回 Playground
我们一直致力于改进模型如果你想要提供反馈可以随时使用画布中的这些按钮与我们分享你的反馈让我们前往跟随编程指南的 1.2 节即“使用指令引导模型”
现在我们的目标是获得更一致、更高质量的结果我们可以通过向模型提供指令来实现这一点可以将指令视为单个会话中适用于整个对话的永久规则或自影像再次直接将这段代码拷贝到 Playground 中并运行我将添加这些指令
返回 Playground.swift 文件
我将添加一个新变量命名为 instructions 我输入“你的任务是为用户创建一份行程每天都需要包含一个活动、一家酒店和一家餐厅并且一定要包含标题、简短说明以及按日列出的行程规划” 我们可以使用 instructions 参数将这些指令传递给 LanguageModelSession
传递时画布会自动检测到代码更改并更新结果现在我们看到在 response 下有 content 属性其中包含我们提出的请求这包括活动、酒店和餐厅你可以在这里看到 Activity、Hotel 和 Restaurant 你可能有疑问这些指令和提示词有什么区别？下面我们来看一看
指令可用于定义自影像、设置规则和指定所需的响应格式这应该由开发者提供另一方面提示词可能由使用 App 的用户提供模型经过训练会优先遵循指令而不是提示词这有助于防范提示词注入攻击在这类攻击中用户可能会让模型忽略在提示词中提供的指导说明一般来说指令应该是静态的以免在其中插入用户输入
另请注意指令在整个会话期间都会保留每次交互都记录在会话记录中并且初始指令始终是第一个条目
太好了我们可以成功向模型发送提示词并获得响应但务必要考虑的一点是我们的 App 可能会在 Apple 智能不可用的设备上运行显示一项功能但功能却无法正常使用可能会带来糟糕的用户体验例如设备可能不支持 Apple 智能或者设备可能支持 Apple 智能但用户没有启用或者模型资源仍在下载中尚不可用让我们详细了解一下如何处理这些用例接下来我们返回跟随编程指南现在我们进行到了跟随编程指南的第 1.3 节即“处理模型可用性”
这个模型提供了可用性 API
让我们前往 Xcode 详细了解这个 switch 代码块中的每个用例以及它们对 App 来说意味着什么
返回 Playground.swift 文件 Playground 有一项便捷功能就是可以在同一个 Swift 文件中添加多个这样的代码块
我在这里添加了一个新的 #Playground 块其中包含可用性代码好了
我们来看看这些 API 你还可以查看多个 Playground 的输出第二个 Playground 在画布上显示为另一个标签页你会看到我的 Mac 支持 Apple 智能系统提示 Foundation Models 可用且处于就绪状态现在让我们详细了解一下这些用例
第一个用例是可用这意味着一切就绪模型已载入你可以发出生成请求
如果提示不可用且设备不符合条件则表示这个模型不支持 Apple 智能你应该妥善隐藏生成式 UI 并显示备用体验
不可用且 Apple 智能并未启用这意味着设备符合条件但 Apple 智能在“设置”中已关闭你应该借此机会提示用户启用它
不可用且模型处于未就绪状态这是一种临时状态可能是因为模型资源仍在下载中最佳做法是告诉用户重试现在我们可以将这些功能添加到 App 中让我们前往跟随编程指南
现在我们进行到了第一章的 App 部分在本节中我们将更新 LandmarkDetailView.swift 以检查模型可用性并在模型不可用时显示一条信息直接拷贝这些代码块你可以搜索这些标记的注释以确切知道这些代码更改的插入位置我将与大家实时进行操作让我们前往 Xcode 项目
然后点按 Views 文件夹中的 LandmarkDetailView.swift 再次提醒一下你可以随时使用查找导航器来查找需要在本章中进行的所有代码更改好了首先要做的是添加模型实例
我们定义 private let model = SystemLanguageModel.default 这与我们在 Playground 中使用的代码行完全相同因此你应该会觉得很熟悉由于我已添加这行代码我将删除这条注释这样它就不会出现在我们的查找导航器中了我们需要进行的下一项代码更改是删除这里的这些占位符可用性代码这些代码只是方便演示用的所以我要删除一旦删除 Xcode 会立即提醒我还没有定义可用性但这个问题很容易解决因为我们现在有了模型直接使用 model.availability 即可
我要将这行代码也删掉好了完成这项代码更改后对这个特定文件的所有更改便完成了
现在我们已经添加了这些可用性检查你应该很熟悉因为我们在 Playground 中使用过相同的可用性检查方法但如何测试它们呢？你可能没有多台测试设备可用值得庆幸的是有一个简单的方法在项目的方案设置中有一个选项用于模拟不可用状态下面我们来看一看点按 FoundationModelsCodeAlong 点按“Edit Scheme” 向下滚动你会看到一个名为“Simulated Foundation Models Availability”的选项
如果你点按这里会显示几个不同的选项这些选项你应该很熟悉因为这些是我们在 Playground 中介绍过的用例我将点按“Apple Intelligence Not Enabled” 点按“Close”
然后构建并运行 App
这里显示了我们的 App 我将选择“Sahara Desert” 啊哈我在这里看到以下信息 “行程规划器无法使用因为 Apple 智能尚未开启。”
这与我们在不可用状态视图中指定的信息相同
好极了让我切换回来以便我们可以在跟随编程过程中继续添加其他功能
好了让我们前往跟随编程指南的第 1.5 节
现在我们已准备好更新 App 的行程生成器以初始化语言模型会话并定义名为 generateItinerary 的函数以便从视图中调用模型这些代码你应该同样觉得很熟悉因为我们已经在跟随编程过程中实现了这些代码现在我们将这些代码迁移到 App 中让我们前往 Xcode 并打开 ItineraryGenerator.swift 文件这个文件位于 ViewModels 文件夹中
我们将再次使用查找导航器来查找需要进行和跟踪进展的各项代码更改好了在 ItineraryGenerator.swift 文件中我们需要进行的第一项更改是添加一个 session 属性我先完成这一步我们定义了名为 session 的变量来保存 LanguageModelSession
接下来 Xcode 将提醒我们会话尚未初始化我们将在这里的 init 函数中初始化这个会话
好了这就是我们添加的内容
我们添加了一个 instructions 变量我们使用了与 Playground 中相同的指令： “你的任务是为用户创建一份行程每天都需要包含一个活动、一家酒店和一家餐厅并且一定要包含标题、简短说明以及按日列出的行程规划” 我定义了 session 变量来保存 LanguageModelSession 并传入了指令好了我们需要进行的第三项也是最后一项更改是更新 generateItinerary 函数这是为了发送提示词并获取响应我们将从视图中调用的函数我们来进行这项代码更改
好了这是我们添加的内容首先我们定义 let prompt =
generate a dayCount-day itinerary to landmark.name 这里的 dayCount 默认为 3 landmark.name 是用户打开 App 后点按的地标名称我们收集此名称并将它传递给提示词我们可以为这个特定地标生成响应接下来我们定义 let Response = try await session.respond 并传入提示词最后 response 变量包含属性 content 你可能还记得我们在 Playground 画布中观察过这个属性其中包含所有非结构化自然语言文本它为字符串类型我们将它赋值给 itineraryContent
它包含我们对视图模型进行的所有代码更改现在可以从视图中调用视图模型了让我们返回跟随编程指南的第 1.6 节这是我们第一章的最后一节现在我们将更新 LandmarkTripView 以获取行程生成器的输出并在 App 中显示同样直接按照这些注释进行这些代码更改我将前往 Xcode
点按“Views”
然后点按 LandmarkTripView 好了
好了我们需要进行的第一项代码更改是为视图模型中的 ItineraryGenerator 类添加一个局部变量
好了 ItineraryGenerator 类型的 itineraryGenerator 已添加完成我将删除这条注释
接下来我们需要进行的代码更改是在视图载入时创建这个类的实例
这是我们在 .task 修饰符下引入的更改我们定义 let generator = ItineraryGenerator 其中 ItineraryGenerator 是视图模型类我们传入 landmark 这样它就能获得有关用户点按了哪个地标的信息如果你还记得我们将这一信息传递给了提示词然后我们在这里保留 itineraryGenerator 我将删除我们刚刚所做代码更改的相关注释
我们需要进行的下一项代码更改是更新视图本身让我们详细了解一下视图默认情况下这里有一个布尔变量名为 requestedItinerary 它设置为 false 由于它设置为 false 因此我们载入上方的第一个视图这是一个文本字段显示地标名称我们获取 landmark.name 并使用 landmark.shortDescription 获取简短描述这是当用户没有生成行程或者没有要求模型生成行程时显示的内容当 requestedItinerary 设置为 false 时我们需要载入一个新视图我们可以在其中填充模型的输出这正是我们现在要实现的功能在这里我将删除 else 用例
并引入一个新的 else 用例在其中我定义 if let content = itineraryGenerator.itineraryContent 如果你还记得 itineraryContent 是一个字符串变量用于保存模型的输出然后我们只需获取 content 并更新到文本视图由于完成了这项更改我要将这条注释也删掉
我们就快完成了在这个视图中我们还要进行最后一项更改如果你向下滚动到这里
就会看到我们定义了一个按钮它将显示在屏幕底部这个按钮目前处于隐藏状态在这里我们需要进行两项微小的代码更改第一我们希望显示这个按钮所以可以注释掉这行代码或者像我一样直接删除然后我们需要在这里插入代码以便在用户轻点按钮时生成行程让我们在这里添加相应代码
好了我们定义了 await itineraryGenerator 并调用了 generateItinerary 函数如果你还记得这个函数的作用是接收提示词然后传递给模型并获取输出本章中的所有代码更改任务到这里就全部完成了好了我们现在可以构建并运行 App 了好了点按这里的运行按钮这样将构建并运行 App
这是我们的 App
我将点按这里的 “Sahara Desert” 可以看到显示有 “Generate Itinerary”按钮当我点按这个 “Generate Itinerary”按钮时提示词和指令将发送到设备上的 LLM LLM 将逐个词元生成响应这些都在设备上进行
如果你像我一样看到了这个行程恭喜你你使用 Foundation Models 框架构建了第一个功能完备的设备端生成式 AI 功能只需几行 Swift 代码你就能利用 Apple 智能的强大功能
这很棒在这里我们看到的是一大段文字如果我想提取酒店名称并在地图上显示该怎么做这不是我们想要的丰富体验我们将在第二章中通过引导式生成来解决这个问题我们将讨论如何使用 Swift 结构体直接从模型获取输出现在让我们快速回顾一下第一章
在本章中我们了解了如何创建会话并向模型发送提示词以获取基本文本响应我们了解了如何提供指令来引导模型生成输出并探讨了如何使用可用性 API 处理不同的可用性状态最后我们通过更新视图模型和视图将这些功能整合到了我们的 App 中
第一章到此结束
现在我们可以生成原始文本了接下来让我们看看如何从模型获取结构化数据以构建更丰富的 UI
首先谈谈使用 LLM 时面临的一个基本挑战它们默认会为我们提供非结构化文本就像我们刚刚生成的行程一样虽然人类可以阅读但对于 App 开发者来说处理起来却颇具挑战例如如何可靠地提取第一天的酒店信息以在地图上标注出来？你不得不编写复杂的字符串解析代码一旦模型输出发生变化运行可能会中断我们真正想要的是能够直接映射到 App 逻辑的结构化数据
我们需要可以通过 Swift 结构体实现的更高级嵌套结构这个行程对象应该包含一个对象数组而这些对象又应该包含一个活动对象数组依此类推这时候就需要用到引导式生成 Foundation Models 框架提供的 API 让你能够明确指定输出格式如果你有一个 Swift 结构体可以直接对结构体应用 @Generable 这样模型就能使用原生 Swift 类型生成结构化数据
我们将在 Playground 中开始本章的学习我们将定义一个简单的结构体以及应用于结构体的 Generable 宏然后我们将在此基础上创建更复杂的嵌套数据结构供模型生成最后我们将返回 App 重构行程生成器以输出新的结构化行程类型并更新视图以在丰富的 UI 中显示输出
让我们返回跟随编程指南
我们现在进入第二章即“生成结构化输出” 我们的目标是突破简单字符串的局限直接从模型获取结构化类型的安全 Swift 数据这让我们能够构建丰富的自定义 UI 而无需进行任何容易出现问题的字符串解析
再次直接将这段代码拷贝到 Playground 中并查看输出我将在引入这个名为 SimpleItinerary 的新结构体时讲解各项操作让我们前往 Xcode Playground 文件并完成代码更改
我将删除我们刚刚添加的第二个 Playground
在这里我将引入这个名为 SimpleItinerary 的新结构体我来逐步讲解一下这个结构体的定义以及如何将结构体包含在基础模型代码中以生成所展示的输出首先这个结构体有几个不同的属性一个字符串类型的 title 一个字符串类型的 description 还有一个字符串数组 days
我们希望模型生成这些字段并且我们可以通过 Guide 来提供额外的信息这个 Guide 有一个 description 参数参数值为 “这趟旅程的一个有趣标题” 这告诉模型必须为这个变量生成对应的标题同样还有一个 description 参数参数值为 “旅程的简短、有吸引力的说明” 同样还有表示天数的参数我们现在可以将这个结构体提供给模型我们可以使用 generating 参数来实现这一点之前我们定义了 session.respond 并提供了提示词我将添加名为 generating 的新参数
并提供 SimpleItinerary.self
然后我们可以刷新画布这将运行代码我们可以查看输出
好了这里显示了 response 让我们详细了解一下这里的 content 属性之前 content 为字符串类型如果你仔细查看这里会发现已标明它是 SimpleItinerary 结构体让我们打开这个属性你会注意到输出与我们刚刚在这里定义的结构体一一对应有标题即“Parisian Bliss” 它对应此处的 title 属性还有描述它对应这里的属性还有字符串数组你会看到 days 它是一个包含每日活动计划的字符串数组
太棒了让我们返回跟随编程指南的第 2.2 节行程并非只能是字符串或字符串数组它也可以包含嵌套结构体现在让我们看看我们将在 App 中构建的完整 Itinerary 结构体我们将在这里进行一项微小的代码更改你要做的就是将 SimpleItinerary 替换为 Itinerary.self 我们将进行这项代码更改我将说明这个 Itinerary 结构体的定义返回 Xcode
我将删除这个 SimpleItinerary
并将 SimpleItinerary 替换为 Itinerary 好了那么 Itinerary 的定义是怎样的呢？你可以按住 Command 键点按它来打开定义或者前往 Models 文件夹点按 Itinerary.swift 文件在这里你会看到一个名为 Itinerary 的新结构体它包含的字段与在 SimpleItinerary 中我们看到的类似但数量更多让我们详细了解一下它也有一个字符串类型的 title 还有 description 和 rationale 如果你仔细查看 days 就会发现它不再是字符串数组它实际上是一个 DayPlan 数组而 DayPlan 本身也是结构体它有自己的 title、subtitle、 destination 和 activities activities 是一个数组由另一个名为 Activity 的结构体组成 Activity 有 type、title、description 在这里 type 为枚举也是可生成的枚举是让模型生成预定义的特定用例的绝佳方法例如在这里 type 只能是 sightseeing、 foodAndDining、 shopping、hotelAndLodging 如果一直滚动到顶部你会看到还能通过另一种方法来约束模型可以生成的内容我们可以使用枚举或者对于 destinationName 我们在这里定义了 Guide： anyOf ModelData.landMark 这告诉模型它必须生成目的地名称而目的地名称是我们在打开 App 时看到的地标之一这包括 Serengeti、Grand Canyon、 Sahara Desert 等输出必须是这些地标之一这就是 Itinerary 结构体的定义这就是我们在 App 中实际使用的代码让我们返回 Swift Playground 如果你还记得我们说过目的地名称应该是列表中的名称之一 Paris 不在列表中所以我要将它改成实际存在于列表中的名称 Grand Canyon 怎么样？
画布将检测到这项代码更改我们来看一下输出
这里显示了 response 它包含 content 同样如果你仔细看一下就会发现它是 Itinerary 结构体而不是 SimpleItinerary 结构体因为我们进行了更新让我们打开这个属性你会看到它有 title、 destinationName、 description、rationale 和 days days 是一个 DayPlan 结构体数组打开这个数组你会发现它包含多天的信息 activities 为 activity 结构体类型等等
在这里值得注意的要点是当应用 @Generable 时可任意组合框架知道如何自上而下构建整个复杂对象同时保证结构的正确性现在让我们将它整合到 App 中让我们前往跟随编程指南现在我们进行到了第二章的 App 部分在这一部分中我们将更新行程生成器以使用刚刚在 Playground 中测试过的可生成型 Itinerary 结构体
再次直接拷贝这些代码我将与大家一起完成这些代码更改让我们前往 ViewModels 文件夹
下的 ItineraryGenerator
调出查找导航器并设置为第 2 章这样我就可以查看将在本章中进行的所有代码更改
我们需要进行的第一项代码更改是我们必须更新顶部的 itineraryContent 使其不再是字符串而是 Itinerary 类型让我们首先将这个变量的名称更改为 itinerary 并将 String 更新为 Itinerary
我们可以删除这条注释因为我们已完成这项代码更改
我们需要进行的下一项代码更改是如果向下滚动至 generateItinerary 函数你将看到 Xcode 会及时提醒我们 itineraryContent 已不存在我们可以将 itineraryContent 更新为 itinerary 因为我们刚刚已添加它之所以报错是因为当前从 session.respond 输出的 content 为字符串
与上次在 Playground 中一样我们将添加 generating 参数并提供 Itinerary.self
模型现在可以输出 Itinerary 类型的值由于我们已完成这项代码更改我删除这里的这条注释
好了我们需要进行的最后一项更改是移除我们在 instructions 中提供的其他结构性指导说明请注意我们如何定义以下内容： “每天都需要包含一个活动、一家酒店和一家餐厅并且一定要包含标题、简短说明以及按日列出的行程规划” 但所有这些信息均已包含在可生成型 Itinerary 结构体中我们无需在 instructions 中再次提供所以使用 Generable 的另一个好处是可以让提示词更简洁这也有助于提高性能我将删除这条注释
本节中的所有代码更改任务到这里就全部完成了我们更新了行程生成器视图模型以便能够生成可生成型结构让我们前往第 2.4 节即“更新视图以显示结构化数据” 在本节中我们将更新 LandmarkTripView 以生成行程视图而不是我们在上一节中看到的原始文本这是一项非常简单的代码更改让我们前往 LandmarkTripView
你可以在 Views 文件夹中找到它它是第二个文件
我们需要在此处进行代码更改
如果你还记得我们之前在生成模型输出时载入了这个视图但我们不再生成字符串因此我们不能再使用文本视图了首先我们必须更新这里然后我们还需要将这里更新为另一个视图而不是文本视图以便我们可以真正从 itinerary 中提取字段并填入丰富的 UI 中让我将这个视图替换为更新的视图我将说明效果是怎样的
好了这就是我修改后的代码你也可以从我们的指南中拷贝并粘贴这段代码让我们详细了解一下我定义了 itinerary= itineraryGenerator.itinerary 我们将文本视图替换成了 ItineraryView 它接收地标和生成的行程现在 ItineraryView 已存在于 Views 文件夹中但我们尚未查看因此让我们仔细查看一下这应该是第三个文件当然你也可以通过按住 Command 键点按来打开这个文件好了在本章中我们不会对这个文件进行任何代码更改但你会在这里看到注释这意味着我们可能会进行更改或者说我们肯定会在后面的章节中进行更改这个视图的作用是它接收模型生成的 Itinerary 结构体、提取字段并创建我们在初始演示中看到的丰富 UI 如果仔细查看 body 部分我们会看到它可以提取行程的 title、 description 并填入界面中如果向下滚动你会看到当它提取每日活动时会使用名为 DayView 的专用视图来显示我们使用 ForEach 来遍历这些项、提取各项属性并设置布局请注意这比解析字符串并更新界面简单得多
好了让我们前往幻灯片引导式生成的主要好处是它能从根本上保证结构的正确性它使用名为约束解码的技术来实现这一点它的作用是让你能够控制模型应该生成的输出无论是字符串、数字、数组还是你定义的自定义数据结构
这也意味着提示词可以更简洁进一步聚焦理想效果而不是通过向模型发送提示词来指定具体的输出格式这往往也能提高模型准确性以实现优化来加快推理速度回顾一下在本章中我们探讨了如何通过模型获取结构化数据我们使用 Generable 自行定义了 Swift 类型并了解了如何通过嵌套它们来创建复杂的数据结构
然后我们更新了 App 以便在丰富的用户界面中生成和呈现这些结构化数据
让我们构建这个模型看看我们做出的所有更改
这是我们的 App 让我们点按“Sahara Desert” 然后点按“Generate Itinerary” 与之前一样它将接收提示词和指令并发送到模型现在它不再生成一大段文字而是生成 Itinerary 类型我们提取所有字段然后使用新视图即 ItineraryView 填入我们的 App 中
好了这一章到此结束
现在我们能够获取结构化数据作为模型输出现在我们可以换个话题重点探讨如何通过其他提示词技巧来提高输出的质量和一致性虽然恰当的提示词能告诉模型怎么做但有时示范更有效我们可以直接在提示词中包含高质量的示例作为可生成型实例
这种方法很好因为它让模型能够更好地了解我希望生成的响应类型在本章中我们将重点探讨如何改进生成内容的质量我们首先在 Playground 中使用 Prompt Builder API 创建具备更强动态调整特性的提示词然后我们将探索一步到位的提示词为此我们会在提示词中提供高质量的示例来提高模型的准确性最后我们将所学知识运用于 App 的行程生成器
让我们前往跟随编程指南
我们现在进行到了第三章即“提示词技巧” 现在我们的目标是提高模型输出的质量和可靠性首先我们将探索如何使用 Prompt Builder API 引入能够动态调整的提示词
让我们前往 Playground 看看如何实现再次直接将这个代码块拷贝到 Playground.swift 文件中
我们已打开 Xcode 前往 Playground.swift
好了在这里我们将完成的关键代码更改是使用 Prompt Builder API 引入提示词如果你还记得之前我们在 session.respond 下提供了两个参数其中一个是字符串格式的 “Generate a 3-day itinerary to Grand Canyon” 但我们可以不将提示词定义为字符串而是使用 Prompt Builder API 并将值传递给闭包这样做的主要好处是它现在可以包含 Swift 条件语句之类的内容在顶部这里有一个名为 kidFriendly 的布尔变量它当前设置为 true 然后在 Prompt Builder API 中我使用这个布尔变量来有条件地更新提示词若 kid-friendly 布尔变量为 true 那么我们会将这一额外信息注入到提示词中即行程必须适合儿童我们可以更新 session.respond 调用以包含这个新提示词
并刷新画布
我们来看看具体输出
这里显示了 response 变量的 content 让我打开这里的 rationale 看一看它指出：“这份行程为孩子们提供了一个安全、富有趣味且具有教育意义的体验确保他们在欣赏大峡谷自然之美的同时也能获得符合年龄的活动与住宿安排” 你会看到模型满足了我们的请求这是作为一个条件出现的同样这样做的好处是可以让提示词能够实现快速、动态调整用户在 App 中选择了某些内容或者你作为开发者从用户偏好中了解到了某些信息并相应地更新了提示这些都可以归为这一情况
太棒了让我们返回跟随编程指南的第 3.2 节现在我们的目标是使用更高级的提示词技巧即一步到位的提示词向模型准确展示高质量的响应是什么样的让我们前往 CodeAlong
在这里的 Prompt Builder API 中我将在闭包内添加另一行代码这里已写明：“这是我们预期的格式示例但不要直接复制其中的内容” 我引入了一个示例让我们详细了解一下这个示例为 Itinerary.exampleTripToJapan 它的定义是怎样的？你可以按住 Command 键点按它或者前往 Models 文件夹点按 Itinerary 并向下滚动你将看到 exampleTripToJapan 在此处定义你首先会注意到这不是包含示例的一长串字符串这实际上是 Itinerary 的可生成型实例所有属性都已填充你会看到这里有 title、 destinationName、description、 rationale、days 所有属性都已手动填充我们可以返回 Playground 你会看到这里有一项输出输出包含我们为了给响应的语气和质量定好基调以一步到位的示例形式提供的额外信息
最重要的是我们直接将 itinerary.exampleTripToJapan 嵌入到了提示词中这是一个范例我们还明确告诉模型不要拷贝示例的内容我们希望模型学习示例的风格和结构而不是直接照搬数据让我们返回指南
现在我们进行到了第三章的 App 部分我们现在将这个一步到位的提示词方法集成到 App 中
我们需要进行的代码更改如下在 ViewModels 文件夹的 ItineraryGenerator 中更新 prompt 并将我们的示例包含在其中我们来进行这项代码更改我们返回了 Xcode 我将依次点按 ViewModels 和 ItineraryGenerator 我将打开查找导航器并点按 Chapter 3 在这里你可以看到我们需要进行的代码更改
在 generateItinerary 函数中显然我们在这里定义了 prompt 我们将替换这个 prompt
我将删除之前的 prompt
同样与我们在 Playground 中采用的做法一样我们定义 let prompt =、指定使用 Prompt Builder API 并传递此闭包它不仅包含我们之前使用的字符串还包含这些额外的信息从而引入 Itinerary 类型的 Itinerary.exampleTripToJapan 所以它不仅仅包含所有指导说明现在架构也包含在这个 prompt 中
由于完成了这项更改我们可以删除这条注释你会注意到第 3 章中的所有代码更改都已完成这意味着我们可以构建并运行这个 App 了我们来看一下构建好的 App
我们可以选择这里的“Serenity” 点按“Generate Itinerary” 我们可以确保它接收提示词、指令和额外的示例、将这些传递给模型并生成最终输出搞定
好了我们的 App 运行良好让我们关闭 App 并前往幻灯片在本章中我们重点探讨了提示词技巧我们了解了如何使用提示词构建器来动态构建提示词还了解了如何使用一步到位的提示词提高模型输出的质量和一致性然后我们运用了这些知识来更新 App 将一个详细示例包含在了提示词中 @Generable 强制生成定义的结构而一步到位的示例可以告诉模型结构内部的关系和风格模型还使用提供的示例来获知应该采用的语气确保生成的文本与你希望 App 采用的语气一致
虽然输出之间并非总是存在显著差异但这是一种重要方法能够显著提高生成内容的质量有关提示词技巧的章节就讲到这里
正好我们可以暂停一下短暂休息 10 分钟大家可以趁这段时间补一补代码、冲杯咖啡或者起身活动一下腿脚回来后我们接着探讨一些精彩的主题我们将通过流式传输实时更新 UI、通过工具调用来扩展模型的功能最后优化一下性能我们 10 分钟后回来一会见
欢迎大家回来希望大家得到了充分的放松让我们继续我们已经有了高质量的提示词接下来让我们通过实时流式传输响应来改善用户体验在本章中我们将重点探讨如何重构行程生成器以使用流式传输 API 通过流式传输模型响应来改善用户体验我们将了解如何在模型生成响应时处理 PartiallyGenerated 内容然后我们将更新视图以便在生成行程的同时实时呈现让用户获得响应迅速的体验让我们前往指南现在我们进行到了第四章即“流式传输响应” 本章的目标是流式传输响应并在生成行程的同时实时显示从而显著改善用户体验我们首先来更新 ItineraryGenerator 文件本节不涉及 Playground 组件因为直接在 App 中感受响应的流式传输非常简单让我们前往 Xcode 并打开 ItineraryGenerator
我们将再次使用查找导航器切换至第四章然后看一下我们需要进行的所有代码更改让我们从 itinerary 开始我们需要进行的第一项代码更改是将 itinerary 变量更新为 Itinerary.PartiallyGenerated 类型
那么什么是 PartiallyGenerated？可以将它想象成结构体的镜像版本其中每个属性都是可选的它由 @Generable 自动定义它非常适合呈现随时间推移接收的数据这是第一项代码更改我将移除这里的注释
我们需要在这里进行下一项代码更改回想一下 generateItinerary 函数包含对 session.respond 的异步调用我们传递了提示词然后传递了可生成型对象然后获得了输出而我们希望实现的效果是模型生成响应并将响应流式传输给我们我们要做的是将这段代码替换为名为 session.streamResponse 的新 API 下面我们来看一看
我们将 session.respond 替换成了 session.streamResponse 其余参数保持不变你仍要传入 prompt 仍要提供 generating 参数以及 Itinerary 但这里没有 await 这里使用的是名为 stream 的异步序列这意味着我们可以循环遍历它并将所有输出赋值给包含各种选项的 itinerary 我们定义“在流式处理中 try await partialResponse” 我们可以使用 partialResponse.content 提取响应这样每次都能得到特定时间点所生成内容的快照由于完成了这项代码更改我要将这条注释也移除
好了这就是我们需要对行程生成器进行的所有代码更改让我们前往跟随编程指南的第 4.2 节现在我们可以更新视图了由于 PartiallyGenerated 字段是可选的因此我们可以使用 if let 语句安全地解包这些选项这就是我们在本节中要完成的操作我们将更新 ItineraryView 我们之前在前面的章节中预览过这个视图现在我们实际上要对这个视图进行代码更改让我们前往 Xcode
点按 Views 文件夹
然后点按 ItineraryView
好了你会注意到最顶部有 itinerary 所以我们也应该使用在视图模型中定义的 PartiallyGenerated 类型来更新这个变量我们需要对这里的所有可生成型对象进行这项代码更改所以不仅要更改 itinerary 还要更改所有嵌套的可生成型对象一直向下滚动如果你还记得这里定义了 DayView 它包含 DayPlan DayPlan 也应该为 PartiallyGenerated 类型每次进行这项代码更改后我都会移除这些注释再往下如果你还记得这里有 activity 数组我们将对这个数组进行同样的更改
好了这就是对可生成型对象进行的主要代码更改让我们返回顶部你会看到 Xcode 显示了另外几项报错接下来我们需要进行另一项代码更改如果你还记得我说过这些字段是可选的所以我们必须解包它们我们来解包吧
这就是我修改后的代码我定义了 if let title = itinerary.title if let 是处理这些可选字段的绝佳方法由于这里已有 title 因此无需从 itinerary 中提取所以我要移除这个前缀 title 处理完成现在我需要重复同一步骤来处理 description
我使用了 if let 并更新了文本视图以包含 description
然后我需要再次重复这一步骤来处理 rationale
我需要再次重复这一步骤来处理其他字段即 days
好了你应该已经明白了我们必须继续对我们要访问的所有 itinerary 字段即属性采取这一步骤以安全地解包它们现在我要做的是拷贝代码我一直在让大家拷贝代码让我们返回跟随编程指南拷贝完全更新后的文件并粘贴到这里因为我们必须对每个属性都采取这一步骤如果你滚动到这里则会看到第三步要求对所有这些属性重复这一步骤我们已经更改了 title、description、rationale 但你必须对所有 DayPlan 和 Activity 视图也采取这一步骤因此在这次跟随编程中我现在要做的是点按“Show the Updated Views” 其中包含所有代码更改我要做的是点按右上角的 “Copy”按钮、返回 Xcode ItineraryView.swift 文件然后使用更新后的代码替换所有代码在查找导航器中你可以看到没有其他注释了因此我们已完成所有代码更改我展示了我们需要进行的几项不同代码更改但你必须对每个属性采取相同的操作第 4 章的所有代码更改任务到这里就全部完成了快速回顾一下我们讨论了需要对视图模型进行的更改即使用 PartiallyGenerated 并更新了视图以解包这些选项我们现在可以运行 App 了点按运行按钮这样将构建并运行这个 App 这里显示了我们的 App 我将点按这里的“Sahara Desert” 然后点按“Generate Itinerary”
与之前的异步调用不同现在我们可以在生成响应的同时实时流式传输响应这带来了卓越的用户体验因为使用 App 的用户在所有行程载入完毕之前即可开始使用这些内容
太棒了在这一章中我们让用户体验有了显著提升我们重构了 App 以使用流式传输 API 并了解了如何在视图模型中处理 PartiallyGenerated 内容最后我们更新了视图以在生成行程时实时显示行程
有关流式传输响应的第四章就讲到这里现在我们的 App 已经非常出色了但让我们通过工具调用为模型提供新功能以使 App 更加智能
首先让我介绍一下工具调用的概念除了你提供给提示词的信息模型还自带来自训练数据的核心知识但请记住模型内建于操作系统中它不会随时间推移而积累更多知识例如如果你询问它现在库比提诺的天气它没有办法知道这一信息为了应对需要实时或动态数据的用例这个框架支持工具调用它的工作原理是这样的它自带会话记录如果你为会话提供了工具则会话会将工具定义连同指令一起提供给模型在我们的示例中提示词会告诉模型我们想要前往哪个目的地
现在如果模型确定调用工具可以改进响应它将生成一个或多个工具调用在本例中模型生成了两个工具调用分别查询餐厅和酒店在此阶段 Foundation Models 框架会自动调用你为这些工具编写的代码然后框架会自动将工具输出插入到会话记录
最后模型会整合工具输出和会话记录中的所有信息生成最终响应
正如我们目前所看到的模型可能具有很强的创造性每次我们提出请求时生成的行程往往略有不同这种随机性对发挥创造性很有帮助当我们需确保可预测性时则面临挑战对于工具调用等高级功能特别是在测试和调试时我们需要确保模型行为一致我们需要保证它按照我们的预期调用工具为了实现这一点我们将使用 GenerationOptions API 对我们的请求进行另一项微小的更改以使用贪婪采样贪婪采样告诉模型停止发挥创造性并始终选择最明显的下一个词元这使得模型输出具有确定性对于我们的 App 而言这确保模型每次都能可靠地调用我们的工具
在本章中我们将探讨一个工具它可用于查找兴趣点然后我们将这个工具提供给语言模型会话并告知模型如何使用它返回 App 我们将这个工具集成到行程生成器中以将现实世界的数据引入行程中让我们前往跟随编程指南现在我们进行到了第五章即“工具调用”
我们的行程包含模型生成的酒店和餐厅名称这些可能不是最新的我们的目标是为模型提供一个工具这个工具可用于调用 Swift 代码并获取我们提供的酒店和餐厅名称
让我们完成这些代码更改以便首先构建工具然后在 App 中使用这个工具我将前往 Xcode 然后点按 ViewModels 文件夹在这里你会看到一个新文件名为 FindPointsOfInterestTool
点按这个文件这里有一个名为 FindPointsOfInterestTool 的类它遵从工具协议这意味着必须在这里定义一些属性下面逐步讲解让我们开始进行这些代码更改我将说明各项操作我们需要进行的第一项代码更改是为工具添加名称和描述我将在这里完成
我们为工具提供了名称即 findPointsOfInterestTool 还提供了说明 “为一个地标寻找兴趣点” 这对于模型判断何时调用工具至关重要它将使用名称和描述来确定何时调用这个工具我们需要在这里进行下一项代码更改让我打开查找导航器这样我们就能看到需要进行的所有代码更改
我们需要在这里进行的下一项代码更改是定义工具可以搜索的兴趣点类别
为此我们将引入这个可生成型枚举
在这里 Category 是一个枚举它包括酒店和餐馆当然它还可以包括其他用例如博物馆或露营地等在下一项代码更改中更新参数时我们会用到这个枚举
这里有一个 Arguments 结构体让我们更新这个结构体我会讲解它的作用
在这里 Arguments 结构体有一个属性它定义为 let pointofInterest 它的类型为我们刚刚定义的 Category 所以 pointofInterest 可以是酒店或餐厅我们还提供了 Guide Guide 的 description 为 “这是要查询的目的地类型” 这个 Arguments 是工具与模型之间达成的约定当模型想要调用工具时它会将 Arguments 传递给工具这样工具就能根据它希望从工具获取的响应是酒店还是餐厅即它想要从工具获取的响应类别来访问相应数据
我们已经更新了 Arguments 现在我们将更新这里的 call 函数
这个函数是我们工具的核心它接收参数、执行操作并返回输出输出会被添加到会话记录以供模型查看和使用让我们进行这项更改
好了我将逐步讲解各项操作
首先我定义 let results = await getSuggestions 我们还没有定义 getSuggestions 我们稍后会进行定义本质上可以将它视为为了获得这些特定的兴趣点 call 方法可以调用的函数然后 results 是输出的一部分正如你在 return 语句中看到的我们可以将 results 以字符串输出的形式插入以返回给模型然后模型使用这些信息以及提示词和指令来生成最终响应我们需要进行的最后一项代码更改当然是定义这个函数这里有一个占位符函数名为 getSuggestions 让我们来更新这个函数
好了在 getSuggestions 中我定义了一个 switch 块它接收 category 如果 category 为餐厅它可以返回 Restaurant 1、 Restaurant 2 或 Restaurant 3 同样如果 category 为酒店它可以返回 Hotel 1、Hotel 2 或 Hotel 3 在这个演示中我们使用了硬编码数据在实际 App 中你会在这里调用 MapKit 或服务器端 API 等 API 来获取真实的实时数据
好了我们对工具进行了所有代码更改这意味着我们已全面定义我们的工具让我们返回跟随编程指南并前往第 5.2 节
我们现在要做的是测试这个工具我们将前往 Playground 并将这个工具提供给模型看看结果如何与之前一样再次直接拷贝粘贴这段代码我将逐步讲解每一行代码并说明各项操作返回 Xcode 我将切换到 Playground.swift 文件在本节中让我清理一下之前的代码并从头开始
好了我们有了空白 Playground
首先我要添加指令
在这里 Playground 有一项便捷功能就是可以访问 Xcode 项目中的所有数据结构而无需构建 App 在这里我要做的是创建一个 landmark 变量它可以访问在 Models 文件夹下的 ModelData.swift 中定义的模型数据我指定了 ModelData.landmark 0 这意味着我将前往你可以看到的地标之一具体而言我们将前往第一个地标如果你还记得第一个是“Sahara Desert” 在这里使用的地标列表与运行 App 时看到的地标列表一样我们获取地标信息并且我们已经在 ViewModels 文件夹中定义了 FindPointsOfInterestTool 我们将创建这个工具的实例我们可以将 landmark 传递给它因为它会用到这一信息最后与之前一样我们定义了指令如果你仔细观察会发现有两项微小的代码更改第一它不再是字符串而是类似于提示词构建器的指令构建器在其中我们传入一个闭包并提供我们的指令第二项关键更改对工具调用非常重要你会注意到我们指定了 “始终使用 findPointsOfInterest 工具来查找该地标附近的酒店和餐厅” 现在这条指令告诉模型它必须调用这个工具才能获得兴趣点并生成响应现在我们将创建 LanguageModelSession 与之前的代码更改类似我们定义了 LanguageModelSession 并传递了指令但我们引入了一个名为 tools 的新参数 tools 可以是一个工具数组在这里只有一个工具就是 pointOfInterestTool 由于它是一个数组你可以提供多个工具以便模型可以根据你的提示词和指令进行推理确定何时调用哪个工具并返回响应我们已经将工具包含在了会话中接下来我们定义提示词
在这里提示词本身没有变化最后我们将调用模型
在这里代码基本没有变化只是我们引入了之前在幻灯片中简要讨论过的 options 这个 GenerationOptions 的 sampling 设置为 greedy 鉴于其余提示词和指令是一致的因此这将确保我们始终获得一致、可重复且确定性的输出好了我们来看一下这里的画布并了解一下输出好了 response 已生成这里还显示了 content
其中有 title、 description、rationale、days 让我选择其中一天例如第 0 天 Arrival 让我看看其中的 activities
我将打开第 0 项、第 1 项和第 2 项活动现在如果你仔细观察就会看到第 1 项活动下的 description 为 “在 Restaurant 1 享用传统摩洛哥晚餐” 你还会看到 title 为 “在 Restaurant 1 用餐” 同样地你会看到第 2 项活动的 title 为 “在 Hotel 1 住宿”、 description 为“在 Hotel 1 放松休息” 这是要插入到模型输出中的工具输出模型接收提示词、指令和地标名称调用工具返回酒店和餐厅名称将这一信息插入会话记录然后生成响应让我们来看看会话记录本身
在这里我要做的是为会话本身创建一个临时变量并将其捕获到 inspectSession 中我这样做的原因是为了仔细查看会话和会话记录我们可以看到发生的工具调用好了我们刚刚创建了 inspectSession 现在我们来看看这些属性你可以看到 tools 有一个我们提供的工具如果看一下 transcript 你可以看到 entries 中有 6 个元素这里是 instructions 它始终是 transcript 中的第一个条目然后是 prompt 也就是我们的初始请求然后是 toolCalls 模型自主决定是否需要调用我们的工具然后是 toolOutput 框架执行我们的工具并将工具输出插入到会话记录中最后是 response 模型提炼原始提示词工具输出数据以生成最终响应这里有两个工具调用因为我们同时针对餐厅和酒店提出了请求你会在 toolCalls 下看到这一点请求是同时针对餐厅和酒店提出的
太棒了让我们返回跟随编程指南
现在我们知道了工具的工作原理我们定义了工具我们在 Playground 中测试工具现在我们可以更新 ItineraryGenerator.swift 文件将我们的工具整合到 App 中这就是在第 5.3 节中我们要完成的事项
我们对 ItineraryGenerator.swift 进行代码更改直接将这段代码拷贝并粘贴到你的文件中如你所见我们将进行的关键更改是更新我们的指令创建工具实例并将其传递给 LanguageModelSession 让我们前往 Xcode 并打开 ItineraryGenerator.swift 我还会调出查找导航器设置为第 5 章然后开始进行代码更改
我们需要进行的第一项更改当然是更新指令
我将删除之前的指令因为我有了新的指令其中包含我们定义的 pointOfInterestTool 以及附加文本要求模型调用这个工具来获取兴趣点当然我们还需要使用 tools 参数更新 LanguageModelSession
它是一个数组因为它可以接受多个工具我们将传入工具
好了这就是我们需要在构造器中进行的两项代码更改更改完成后我将删除这些注释以便我们可以跟踪更改好了我们需要在 generateItinerary 方法中进行最后一项更改
回想一下我们提到过如果要获得确定性输出我们可以使用贪婪采样默认进行的是随机采样所以在这里在 session.streamResponse 后面在传递 prompt 之后在传递 generating 参数之后我们可以传递 options 我来整理一下这样大家都能轻松阅读
好了这里有 session.streamResponse、有 prompt、有 generating 参数最后还有 options options 中包含 GenerationOptions 我们将 sampling 设置为 greedy 好了我们需要进行的所有代码更改到这里就全部完成了让我们确保删除这条注释
搞定如果你在查找导航器中没有看到第 5 章的任何相关内容则意味着我们完成了所有代码更改可以构建并运行这个 App 了
点按运行按钮这样将构建并运行 App
这就是我们的 App 让我们来了解一下标准用户流即点按“Sahara Desert” 我可以看到 “Generate Itinerary”按钮我点按这个按钮现在既有流式传输 API 还有我们的工具它接收我们的指令、提示词并将这些连同工具定义一起发送给模型如你所见你可以看到 “在 Hotel 1 住宿”和 “在 Restaurant 1 用餐” 这些是来自工具的响应这些响应会被插入到会话记录中模型使用了来自指令、提示词、工具调用和工具响应的所有信息它将所有这些信息进行整合并加以提炼能够以可生成型 Itinerary 格式生成输出
太棒了！好了让我们回到幻灯片并简单总结一下在本章中我们通过工具调用提升模型的处理能力我们讨论了一个自定义工具它有自己的参数和调用函数我们了解了如何将工具提供给 LanguageModelSession 重要的是如何就工具的使用时机和方式向模型发送指令最后我们将工具集成到了 App 中以获取兴趣点并将其包含在生成的行程中有关工具调用的第五章就讲到这里
在结束这个跟随编程讲座之前我们来了解一些用于优化性能和让生成式功能响应更迅速的关键技巧
让我们前往跟随编程指南的第 6 章即“性能和优化” 我们的 App 现在功能完备但为了让 App 具备卓越性能我们首先需要了解瓶颈在哪里无法衡量便无法优化为此我们将使用一个强大的开发者工具即 Instruments
让我们前往 Xcode
这次的操作略有不同如果长按这里的运行按钮你会看到几个不同的选项你可以看到 Run、Test、Profile 和 Analyze 我将点按 Profile 这样做会构建 App 然后启动 Xcode Instruments
让我们等待 App 构建完成好了这是 Xcode Instruments 我们将选择空白模板
打开 Instruments 后我将点按这里的加号并搜索 Foundation Models
好了现在可以对 App 进行性能分析了
我将点按录制按钮这将启动我们的 App 我们将像往常一样使用这个 App 作为用户 “Sahara Desert”值得期待我看了标题和描述觉得不错我点按“Generate Itinerary” 看到生成了精心安排的行程结果正在以流式传输的方式发送给我我可以阅读显示的内容浏览规划的所有不同活动
好了我将停止录制
现在让我们详细了解一下 Instruments 提供的洞察
好了这里有几个不同的跟踪轨道我将说明每个跟踪轨道提供的洞察以确定我们可以消除的任何潜在瓶颈第一个跟踪轨道是 Response 这里的蓝条代表整个会话这是用户点按 “Generate Itinerary”、开始创建会话、模型接收指令和提示词并生成输出的整个过程所有这些活动都由这个蓝条表示
第二行是“Asset Loading” 如果你仔细观察就会发现会话开始后有短暂的延迟然后模型也就是模型资源开始载入这意味着从会话开始一直到模型载入结束的这段时间模型不会生成任何响应这段时间大约持续了 700 毫秒差不多整整一秒钟对吗？如果看一下第三个跟踪轨道你会看到生成第一个词元的时间点这意味着要等到所有模型载入完毕然后才会开始词元生成过程这个过程从第一个词元开始持续到生成所有响应这里有提升性能的机会如果我们能提前载入这些资源也许就能在会话开始后立即开始生成过程这是我们可以尝试解决的一个瓶颈第二个瓶颈看一下底部的这个位置我将选择“Inference”部分如果你仔细观察就会发现这里显示了最大词元数我们可以看到目前这个数字是 1044 这个词元数包含了我们添加到会话中的所有内容这包括指令、提示词和工具还包括可生成型对象以及行程等由于它包含的内容繁杂我们可以看看是否有机会减少数量因为词元数会对模型的性能产生影响这是第二个瓶颈我们可以看看能否尝试解决一下好了如果你还记得当我们调用 session.respond 时如果模型不在内存中操作系统会载入模型预热可以在提出请求之前载入模型从而让会话提前做好准备在我们的 App 中当有人轻点地标时他们很可能很快就会提出请求我们可以在他们按下 “Generate Itinerary”按钮之前进行预热以主动载入模型当他们读完描述时我们的模型便可以使用了
我们再来了解一下另一项优化它可以减少请求延迟回想一下提供给模型的可生成型结构体有助于生成结构化输出但这样做的代价是词元数增加这会影响初始处理时间同样回想一下在第 3 章中我们传递了一个示例行程名为 exampleTripToJapan 由于指令包含可生成型架构的这个完整示例因此通常可以排除前面的定义本身这样可以节省空间并加快模型响应速度
借助 Xcode Instruments 我们找出了 App 中的瓶颈现在我们将直接在 App 中实现一些优化首先当用户轻点地标时我们将通过调用 prewarm 方法来预热会话这使框架在用户请求提供行程之前就开始载入模型其次由于一步到位的示例非常详细因此提示词中的完整架构定义是多余的我们可以将 includeSchemaInPrompt 设置为 false 来移除架构定义我们将在 streamResponse 调用中进行这项更改这将大幅减少输入词元数
让我们前往跟随编程指南了解一下我们将进行的代码更改现在我们进行到了第 6 章的 App 部分第一部分是“预热模型” 代码更改将反映在 ItineraryGenerator 中我们将在其中添加一个函数来预热在视图中也要进行同样的更改这样我们就可以在载入视图时调用 prewarm 方法让我们在 ItineraryGenerator 和 LandmarkTripView 中进行这些更改让我们前往 Xcode 我会让 Instruments 保持打开状态因为我想检查这些优化的效果我将前往 Xcode 然后点按 ItineraryGenerator 它已经打开我将使用查找导航器打开第 6 章
好了
为了实现预热我们要进行的第一项更改是在这里添加预热代码我们定义了这个名为 prewarmModel 的占位符函数在这里我要做的是在会话中调用 prewarm 方法
就是这么简单
现在我们定义了一个函数我们可以从视图中调用它来对模型进行预热如果你提前知道提示词是什么也可以使用 promptPrefix 来更新 prewarm 方法
在 session.prewarm 函数中有一个可选参数名为 promptPrefix 你可以在其中提供提示词这样模型就能知道用户可能提供的提示词并使用提示词进行预热在这里我们将使用闭包传递提示词 “生成一个三天的行程目的地为 landmark.name” 这可以进一步提升性能好的我们需要进行的下一项代码更改应在 LandmarkTripView 中完成在 Views 文件夹中有一个 LandmarkTripView 文件在这里我们需要更新 task 以便在实际载入模型时调用 prewarm 方法让我们在这里进行更改
同样这非常简单只需调用我们刚刚定义的 generator.prewarmModel 函数即可这就是为了预热模型需要进行的所有代码更改让我们返回跟随编程指南了解一下我们讨论过的第二项优化即减少最大词元数我们现在进行到了第 6.2 节我们将优化提示词
同样需要在 ItineraryGenerator 中进行这项代码更改我们将添加这个额外的参数参数名为 includeSchemaInPrompt 并且应设置为 false 让我们进行这项更改同样我会简要说明各项操作
返回 ItineraryGenerator
这里显示了 session.streamResponse 我们在其中传入了 prompt、 generating 和 options 我们还将添加新参数
参数名为 includeSchemaInPrompt 并且应设置为 false 这告诉模型可以排除我们传递的 Itinerary 的架构因为我们已在指令中传递 exampleTripToJapan 其中包含范例以及结构我们可以跳过添加架构操作这有助于减少最大词元数
由于完成了这项更改我要将这条注释也删掉好了第 6 章中的所有代码更改任务到这里就全部完成了这意味着我们现在可以再次对 App 进行性能分析好的让我们再进行一次性能分析我将再次点按“Profile”选项同样这将构建 App 并立即启动我们的性能分析器
你会看到 Xcode 正在构建性能分析器再次启动现在当我录制时 App 将重新启动我们将再次完成相同的 App 使用流程
点按录制按钮
我的 App 在这里我将完成完全相同的步骤我点按“Sahara Desert” 我阅读标题描述在我看来也不错我希望生成行程我看到行程正在生成看起来规划周密有每日计划、吃饭的餐厅还有入住的酒店等让它执行完毕我将停止性能分析
让我们按照之前的操作流程来查看输出看看优化对 App 产生了什么影响你首先应该会注意到得益于 prewarm 函数资源载入在会话开始之前便已顺利进行所以当用户点按详情视图时资源便已载入我们在 task 添加了 prewarm 函数来调用 prewarm 方法这意味着当用户按照习惯阅读标题和描述时模型已经载入完毕并准备就绪如果你仔细查看会话开始时的数据会发现输出几乎在会话开始后立即开始生成会话开始时由于模型已经载入它会立即开始准备词汇表、开始生成词元响应速度也会大幅提升我们再来看看我们进行的第二项优化以及产生的影响在“Inference”下你会看到最大词元数已降至 700 之前是 1000 也就是说我们通过从提示词中排除架构将最大词元数降至了 700 这也意味着模型能够更快地处理初始词元并开始更快地生成响应
太棒了在最后一章中我们了解了性能我们了解了如何预热模型以使 App 响应更迅速以及如何通过排除不需要的架构来优化提示词这是提升生成式功能性能的两种简单而有效的方法
最后我们再看一下我们共同构建的这款 App
让我们返回 Xcode 然后构建并运行
好了这对你而言应该很熟悉因为这是在你的电脑上运行的 App 启动时首先会显示这个简单的 Swift 地标列表选择“Serengeti”时会显示这个详情视图让我们最后一次轻点“Generate Itinerary”
UI 会实时自行构建这是在第四章中使用 session.streamResponse 和 PartiallyGenerated 内容实现的流式传输 API 在第二章中我们通过添加可生成型对象获得了丰富的结构化响应在第五章中我们使用工具调用来查找兴趣点模型会智能地决定是否要调用工具来获取这些数据
好了今天我们讲解的内容很多包括基本文本生成、引导式生成、流式传输、工具调用和性能优化但还有更多内容等着我们去探索我们没有时间讲解某些进阶主题例如训练自定义模型适配器、动态运行时架构或深入研究防护机制和错误处理如需进一步了解这些主题强烈建议大家观看有关 Foundation Models 框架的 WWDC25 视频
看看 Slido 大家提出了很多很棒的问题如果我们没有回答到你的问题你可以前往 developer.apple.com/forums 在开发者论坛上提问在那里我们可以继续讨论今天完成的示例项目包括一些附加功能可以在 Foundation Models 框架文档中下载最后今天晚些时候你会收到一份调查问卷希望你们喜欢这次讲座也欢迎你们提供反馈就到这里吧感谢大家跟随我一起编程我们很快就会再见再见！