电子说
据谷歌表示,Gemini Pro 是他们最好的模型,具备广泛的文本和图像推理能力。Gemini Pro 运行在谷歌的数据中心,可通过 Gemini API 访问。谷歌称,使用 Gemini 最简单的方法是使用 Google AI Studio,这是一个基于 Web 的工具,可用于在浏览器中进行原型设计和输入提示词。等你获得满意的结果,可以将模型导出并在你首选的语言(例如 Python)中使用,在后端运行。
对于 Android 应用程序,Google 提供了 Google AI Client SDK for Android,它将 Gemini REST API 封装为惯用的 Kotlin API。开发者无需直接使用 REST API,也无需为在 Android 应用程序中访问 Gemini 模型实现服务器端服务。
下面的代码片段演示了如何使用 Google AI SDK 基于文本提示词生成文本。
val generativeModel = GenerativeModel(
modelName = "gemini-pro",
apiKey = BuildConfig.apiKey
)
val prompt = "Write a story about a magic backpack."
val response = generativeModel.generateContent(prompt)
print(response.text)
除了纯文本模型,Gemini 还提供了一个多模态模型,能够基于文本和图像输入生成文本(gemini-pro-vision),并支持流式传输,实现更快速的交互。在这种情况下,你应该使用 generateContentStream 而不是 generateContent,如下所示:
var fullResponse = ""
generativeModel.generateContentStream(inputContent).collect { chunk ->
print(chunk.text)
fullResponse += chunk.text
}
为了进一步简化开发者的工作流程,最新版本的 Android Studio 预览版引入了一个新的项目模板,该模板将引导开发人员完成使用 Gemini Pro 所需的步骤,从在 Google AI Studio 生成 API 密钥开始。
除了 Gemini Pro,谷歌还提供了一个更小的模型,Gemini Nano,可以在设备上运行。这使得应用程序可以确保数据永远不离开设备,并确保可预测的延迟,即使在网络不可用的情况下。Gemini Nano 可通过 AICore 在特定的设备上提供,AICore 是一项针对 Android 14 的新系统服务,旨在通过处理模型管理、运行时、安全性等来简化 AI 与 Android 应用程序的集成。
全部0条评论
快来发表一下你的评论吧 !