
248
第
14
章
从移动应用程序访问基于云的模型
纵观全书,你一直在创建模型并将它们转换为 TensorFlow Lite 格式,以便它们可以在你
的移动应用程序中使用。考虑到第 1 章中讨论的原因,例如延迟和隐私,这对于你想在
移动设备上使用的模型非常有效。但是,有时你不想将模型部署到移动设备上
—
可能
它对于移动设备来说太大、太复杂,可能你想经常更新它,或者你不想冒着被逆向工程
的风险让其他人使用你的 IP。
在这些情况下,你需要将模型部署到服务器,在那里执行推理,然后让某种形式的服务
器来管理来自客户端的请求,调用模型进行推理,并对结果进行响应。图 14-1 显示了这
种情况的高级视图。
请求
响应
输入层
输出层
隐藏层
图
14-1
:模型服务器架构的高级视图
这种架构的另一个好处是管理多个模型。当你将模型部署到设备时,如果人们没有或不
能更新应用程序以获取最新模型,你最终可能会遇到多个模型的情况。考虑你想要多
个模型的场景,也许拥有更高级硬件的人可以拥有更大、更准确的模型版本,而其他人
可以获得更小且准确度稍低的版本。管理这可能很困难!但是,如果模型托管在服务器
上,你就不必担心这一点,因为你可以控制模型运行的硬件平台。服务器端模型推理的
另一个优点是你可以轻松地测试不同受众的不同模型版本,如图 14-2 所示。
正文.indd 248正文.indd 248 2023-4-30 9:10:282023-4-30 9:10:28