morrem Gemini Atualizações da API: Com um limite de tamanho de arquivo significativamente maior e novas maneiras de integrar arquivos, trabalhar com conjuntos de dados maiores e estruturas complexas torna-se mais fácil. Fluxo de trabalhoÉ visivelmente mais fácil. Os desenvolvedores podem usá-lo para criar soluções multimodais. KI-Para tornar as aplicações mais flexíveis, rápidas e mais próximas da realidade do seu panorama de dados.
Mais flexibilidade: agora é possível inserir arquivos em linha com até 100 MB.
Talvez a mudança mais importante seja a expansão do número de arquivos permitidos para upload direto, que agora pode chegar a... 100 MBAnteriormente, havia limites significativamente mais rigorosos em relação ao uso de Gemini A API foi limitada para ativos maiores.
O novo limite máximo permite agora, entre outras coisas, que dados extensos de mídia e negócios sejam incorporados diretamente nas consultas:
- Imagens de alta resolução e longas sequências de imagens
- PDFs e apresentações detalhadas
- arquivos de log complexos ou arquivos estruturados JSON e CSV
- entradas multimodais combinadas, como texto e arquivos de imagem grandes
O limite de tamanho de arquivo estendido torna o Gemini APIs mais práticas para dados empresariais do mundo real e grandes coleções de mídia.
Para os desenvolvedores, isso significa: menos pré-processamento, menos esforço para dividir as estratégias e um tratamento significativamente mais natural dos dados brutos diretamente na API.
Novas formas de inserir arquivos: GCS e HTTP
Além de simplesmente redimensionar arquivos, a API Gemini agora também oferece um canal de entrada para arquivos. Em vez de apenas enviar conteúdo diretamente, agora é possível incluir arquivos de fontes externas pela primeira vez.
Integração direta do Google Cloud Storage
Particularmente relevante para aplicações nativas da nuvem é o suporte a Armazenamento em nuvem do Google (GCS)Buckets como origem. Agora é possível acessar arquivos diretamente, sem precisar transferi-los manualmente pelo cliente previamente.
- Utilizando buckets GCS existentes como repositório central de arquivos
- Processamento de grandes ativos já presentes no data lake
- Melhoria na separação do armazenamento de dados e da lógica de inferência.
Isso torna a API Gemini significativamente mais compatível com as arquiteturas de nuvem existentes em empresas onde o GCS geralmente serve como núcleo da infraestrutura de dados.
Acesso via HTTP e URLs assinadas
Além disso, a API agora suporta entrada de arquivos via HTTP e URLs assinadasIsso permite que os arquivos sejam referenciados a partir de qualquer fonte acessível publicamente ou de forma segura – como redes de distribuição de conteúdo, sistemas internos ou plataformas de parceiros.
- Integração de arquivos de sistemas de armazenamento externos
- Conteúdo liberado temporariamente por meio de links assinados.
- Integração flexível em infraestruturas distribuídas e híbridas
Com o GCS e as fontes HTTP, a API Gemini torna-se a interface entre diferentes locais de armazenamento e sistemas modernos. KI-Fluxo de trabalhos.
Novas oportunidades para aplicações de IA
A combinação de um limite de tamanho de arquivo maior e caminhos de entrada mais flexíveis abre novas possibilidades, especialmente em ambientes profissionais. Os exemplos variam desde a análise de mídia até a automação de documentos.
Fluxos de trabalho de mídia e conteúdo criativos
Para empresas de mídia, Marketing ou o comércio eletrônico possibilitará novos padrões de uso dinâmicos:
- Análise de grandes coleções de imagens diretamente do GCS, por exemplo, para marcação automática.
- Geração de descrições de produtos com base em extensas imagens e metadados.
- Garantia de qualidade do conteúdo de mídia, por exemplo, por meio de inspeções visuais utilizando modelos.
O acesso a recursos via URL permite otimizar os fluxos de conteúdo: em vez de mover arquivos várias vezes entre sistemas, basta fazer referência às fontes originais.
Processamento de documentos em ambientes empresariais
Mesmo dentro da empresa Automação do processo A extensão demonstra seus pontos fortes. As áreas típicas de aplicação incluem:
- Avaliação de relatórios e contratos extensos em formato PDF.
- Extração e estruturação de informações de documentos de arquivo.
- Análise de dados de log e monitoramento para solução de problemas e otimização.
Quem KI Quem deseja aplicar essa solução a dados empresariais reais e heterogêneos depende de arquivos grandes e caminhos de arquivo flexíveis – e é exatamente aí que entra a atualização da API Gemini.
Implicações para desenvolvedores e arquitetos
Com os novos recursos, o papel da API Gemini passa de mero acesso a modelos para um componente fundamental em fluxos de trabalho completos de ponta a ponta. Isso tem implicações para arquitetura, segurança e custos.
- arquitetura: Os fluxos de dados podem ser mais centralizados, por exemplo, através do GCS como uma única fonte de verdade.
- segurança: URLs assinadas permitem um controle de acesso extremamente preciso sem expor amplamente os locais de armazenamento reais.
- Custo e desempenho: Menos transferências e uploads de dados redundantes podem reduzir a latência e conservar recursos.
Para os desenvolvedores, vale a pena revisar as integrações existentes: onde antes eram necessárias soluções alternativas para tamanhos de arquivo ou processos de upload complexos, a nova funcionalidade pode simplificar muitas etapas.
Conclusão: Maior relevância prática para IA multimodal
Os recursos aprimorados da API Gemini são mais do que apenas uma funcionalidade conveniente. Eles trazem multimodalidade... KI um passo mais perto dos requisitos de sistemas produtivos, onde arquivos grandes, armazenamento distribuído e fluxos de dados complexos são a norma.
Com suporte para arquivos embutidos de até 100 MB e entrada via GCS ou HTTP, a API Gemini está se tornando uma ferramenta significativamente mais flexível para aplicações modernas. KI-Candidaturas.
Quem já utiliza o Gemini ou está planejando projetos relacionados ganhará novas liberdades – tanto no projeto da arquitetura técnica quanto no uso criativo de KI em uma ampla variedade de fontes de dados.