死 双子座 API 升级:文件大小限制大幅提高,新增了文件集成方式,处理更大的数据集和复杂的结构变得更加容易。 工作流程它明显更易于使用。开发人员可以利用它来创建多模态解决方案。 KI- 使应用程序更加灵活、快速,并更贴近其数据环境的实际情况。
更灵活:内联文件大小现在最大可达 100 MB
或许最重要的变化是将允许的在线文件上传数量扩大到最多…… 100 MB此前,对使用的限制要严格得多。 双子座 对于较大的资产,API 的使用受到限制。
新的上限允许将大量的媒体和商业数据直接嵌入到查询中:
- 高分辨率图像和长图像序列
- 详细的PDF文件和演示文稿
- 复杂的日志文件或结构化的 JSON 和 CSV 文件
- 组合多模态输入,例如文本加大型图像文件
文件大小限制的扩展使得 双子座 API 更适用于现实世界的商业数据和大型媒体库。
对于开发者而言,这意味着:更少的预处理,更少的拆分策略工作量,以及在 API 中直接更自然地处理原始数据。
文件输入新方式:GCS 和 HTTP
除了简单地调整文件大小之外,Gemini API 现在还新增了一个文件输入通道。现在,用户不仅可以直接发送内容,还可以首次从外部源导入文件。
直接集成自 Google Cloud Storage
对于云原生应用而言,尤其重要的是对以下方面的支持: 谷歌云存储 (GCS)存储桶作为数据源。现在可以直接访问文件,无需事先通过客户端手动传输。
- 使用现有的 GCS 存储桶作为中央文件存储库
- 处理数据湖中已存在的大量资产
- 改进数据存储和推理逻辑的分离
这使得 Gemini API 与现有云架构的兼容性显著提高,尤其是在 GCS 通常作为数据基础设施核心的公司中。
通过HTTP和签名URL访问
此外,API 现在支持通过文件输入。 HTTP 和签名 URL这样就可以从任何公开或安全可访问的来源(例如内容分发网络、内部系统或合作伙伴平台)引用文件。
- 集成来自外部存储系统的文件
- 通过签名链接临时发布的内容
- 灵活集成到分布式和混合基础设施中
人工智能应用的新机遇
更大的文件大小限制和更灵活的输入路径相结合,开辟了新的可能性,尤其是在专业领域。例如,媒体分析和文档自动化等应用场景。
创意媒体和内容工作流程
对于媒体公司而言, 市场营销 或者电子商务将催生新的、动态的使用模式:
- 例如,直接从 GCS 分析大型图像集,用于自动标记。
- 基于丰富的图像和元数据生成产品描述
- 例如,通过使用模型进行视觉检查来保证媒体内容的质量。
通过 URL 访问资源可以简化内容管道:无需在系统之间多次移动文件,只需引用原始来源即可。
企业环境中的文档处理
即使在公司内部也是如此。 自动化 该扩展程序展现了其优势。典型应用领域包括:
- 对大量报告和合同(以大型 PDF 文件形式)进行评估
- 从档案文件中提取和构建信息
- 分析日志和监控数据,以进行故障排除和优化
黄万华 KI 任何想要将其应用于真实、异构企业数据的人都依赖于大文件大小和灵活的文件路径——这正是 Gemini API 更新的意义所在。
对开发商和建筑师的启示
借助这些新功能,Gemini API 的角色从单纯的模型访问转变为构建完整端到端工作流程的基石。这会对架构、安全性和成本产生影响。
- 架构: 数据流可以更加集中化,例如通过 GCS 作为单一数据源。
- Sicherheit: 签名 URL 可以实现精细的访问控制,而无需广泛开放实际的存储位置。
- 成本与性能: 减少冗余数据传输和上传可以降低延迟并节省资源。
对于开发人员来说,值得回顾一下现有的集成:以前需要通过变通方法来处理文件大小或复杂的上传过程,而新功能可以简化许多步骤。
结论:对多模态人工智能更具实际意义
Gemini API 的增强功能不仅仅是一项便捷功能。它们带来了多模态…… KI 更接近生产系统的要求,在生产系统中,大文件、分布式存储和复杂的数据流是常态。
Gemini API 支持 100 MB 的内联文件,并可从 GCS 或 HTTP 输入,它正发展成为现代应用程序更加灵活的工具。 KI-应用程序。
已经在使用 Gemini 或计划开展类似项目的用户将获得新的自由——无论是在技术架构设计方面,还是在创造性地使用方面。 KI 数据来源广泛。