A Gemini Live API agora está disponível de forma geral no Vertex AI, permitindo que organizações criem IA conversacional multimodal que integra voz, visão e texto. Esta API possibilita interações de baixa latência, melhorando a experiência do usuário com capacidades de compreensão e resposta em tempo real, cruciais para fluxos de trabalho exigentes.
- •• A Gemini Live API agora está disponível de forma geral no Vertex AI.
- •• Permite a criação de IA conversacional multimodal que combina voz, visão e texto.
- •• A API suporta agentes de voz e vídeo de baixa latência para fluxos de trabalho exigentes.
Por que importa: Esta API representa um avanço significativo em IA conversacional, permitindo que empresas melhorem as interações com clientes e otimizem fluxos de trabalho com respostas em tempo real e contextualizadas.
O GPT-5.2 da OpenAI foi lançado, apresentando avanços significativos em raciocínio profundo e codificação, especialmente para tarefas empresariais. Testes iniciais mostram que o modelo é mais eficaz em resolver problemas complexos, com melhorias notáveis em velocidade e precisão em comparação com versões anteriores.
- •GPT-5.2 é um avanço significativo em raciocínio e codificação.
- •O modelo se destaca em resolver problemas complexos com maior profundidade.
- •Empresas como a Box relataram melhorias de desempenho de 7 pontos em testes.
Por que importa: Essa atualização é crucial para empresas que dependem de IA para otimizar processos e resolver problemas complexos, aumentando a eficiência e a produtividade no ambiente de trabalho.
O Google anunciou o Disco, uma nova experiência de navegação com IA generativa, que transforma abas abertas em aplicativos web interativos através do GenTabs. Embora ainda em fase experimental, essa ferramenta promete adaptar a web às necessidades dos usuários, permitindo a criação de aplicações personalizadas a partir de descrições em linguagem natural, o que pode revolucionar a forma como interagimos com a internet.
- •• Google lança Disco, uma nova experiência de navegação com IA generativa.
- •• GenTabs transforma abas abertas em aplicativos web interativos.
- •• Usuários podem descrever ferramentas desejadas em linguagem natural.
Por que importa: Essa inovação pode transformar a forma como os profissionais interagem com a web, aumentando a eficiência e personalização nas tarefas diárias. A capacidade de criar aplicativos sob demanda pode abrir novas oportunidades de negócios e melhorar a produtividade.
A OpenAI anunciou o lançamento do GPT-5.2, seu modelo de linguagem mais avançado, projetado para melhorar o trabalho profissional com ganhos significativos em raciocínio, codificação e fluxos de trabalho. Com uma janela de contexto de 400.000 tokens, o modelo permite a ingestão de documentos extensos e geração de relatórios completos, destacando a competitividade no mercado de IA.
- •• A OpenAI lançou o GPT-5.2, seu modelo de linguagem mais avançado até agora.
- •• O modelo possui uma janela de contexto de 400.000 tokens, permitindo ingestão de grandes volumes de dados.
- •• Melhora em raciocínio, codificação e criação de apresentações e planilhas.
Por que importa: O GPT-5.2 representa um avanço significativo na capacidade de modelos de linguagem, impactando diretamente a eficiência e produtividade em ambientes profissionais. Sua introdução é crucial para manter a competitividade da OpenAI no mercado de IA.
Grok, um chatbot de IA da xAI, foi criticado por espalhar desinformação sobre o tiroteio em Bondi Beach. Ele identificou erroneamente Ahmed al Ahmed, que desarmou um atirador, e afirmou falsamente que um vídeo verificado de suas ações era um clipe viral não relacionado. Este incidente destaca os desafios contínuos da IA em processar e transmitir informações com precisão em situações críticas.
- •• Grok identificou erroneamente um herói do tiroteio em Bondi Beach.
- •• A IA afirmou que um vídeo verificado era um clipe viral não relacionado.
- •• A desinformação proveniente da IA pode minar a confiança pública.
Por que importa: Este incidente ressalta os perigos potenciais de confiar na IA para informações precisas, especialmente em situações de crise. A desinformação pode ter consequências sérias, afetando a percepção e a resposta pública.
A Adobe integrou o Photoshop, Express e Acrobat ao ChatGPT, permitindo edição de imagens e PDFs diretamente na conversa. O recurso, disponível no desktop, web e iOS, oferece funcionalidades como extração de texto, conversão e organização de páginas, facilitando o trabalho com documentos e a criação de layouts.
- •• Adobe Acrobat agora pode ser usado dentro do ChatGPT para editar PDFs.
- •• Recursos incluem extração de texto, conversão e organização de páginas.
- •• Disponível gratuitamente no desktop, web e iOS, com lançamento gradual no Android.
Por que importa: Essa integração entre Adobe e ChatGPT facilita o trabalho com documentos, aumentando a produtividade e permitindo edições rápidas e precisas. Profissionais podem economizar tempo e melhorar a qualidade de suas apresentações e relatórios.
A nova funcionalidade 'Ask this Book' do Kindle permite que leitores façam perguntas sobre a trama e personagens sem revelar spoilers. Disponível em milhares de títulos, a ferramenta utiliza IA para fornecer respostas contextualizadas, embora tenha gerado controvérsias com autores e editores sobre direitos autorais.
- •A funcionalidade 'Ask this Book' oferece respostas sobre livros sem spoilers.
- •Disponível em milhares de títulos best-sellers em inglês no app Kindle iOS.
- •Permite perguntas sobre enredos, personagens e detalhes cruciais da trama.
Por que importa: Essa inovação pode transformar a experiência de leitura, mas também levanta questões éticas e legais sobre o uso de IA em obras protegidas por direitos autorais, impactando o mercado editorial.