Releases
Gemini 3.5 Flash
GoogleIO was this week, where they released dozens of new (mostly AI) products and features, with the highlight being Gemini 3.5 Flash.
Previous Gemini models have also benchmarked very well, but flopped in the real world
Google’s previous models have struggled in the real world, with the most recent Gemini 3.1 Pro model not even being that much better than its predecessor.
This pattern looks like it is continueing for Gemini 3.5 Flash as well.
Despite the strong benchmark scores, there are a plethora of people online who are unhappy with how this model performs for real world tasks. People have reported it struggling with basic math problems (does 300 + 140 = 360?), producing large amounts of slop code that doesn’t work, and performing worse with additional guidelines that are meant to help it perform better, which may be due to the fact that it seems scared of its own system prompt.
This could be forgivable, as the Gemini Flash models are meant to be the budget option that don’t necessarily give you the best performance, but are a reasonable price.
The issue is that despite being built from Gemini 3 Flash, Google has decided to increase the price by 3x, costing $9 per million output tokens.
For reference when GPT 5 was released, it was only $1 more expensive (GPT 5.5 is now $30 per million output).
Not only does the model cost more, but it uses more tokens to answer questions as well.
Due to these two factors it costs 2x more than Gemini 3.1 Pro to run the Artificial Analysis benchmark suite.
Artificial Analysis benchmark costs
Cost wise this puts the model around the same price as GPT 5.5 with medium reasoning, and to add insult to injury, despite Gemini Flash 3.5 being a benchmaxxed model, it still performs worse that GPT 5.5 medium and is slower due to generating so many more tokens.
The budget model is not cheap, its speed is being used to go nowhere very quickly, and it smarts are on paper only.
Stay away from Gemini 3.5 Flash.
Quick Hits
Gemini Omni
Unlike the LLM team, the image and video generation teams at Google are doing much better, as seen by their new Gemini Omni model.
It is meant as a video editing model primarily, and is the first step of Google’s foray into a truely Omni-modal model that can make anything.
There’s no 3rd party benchmarks for it yet (we dont have any good video to video leaderboards in general), but based on their strong Veo 3.1 model, I expect this model to also be very strong as well.
Finish
I hope you enjoyed the news this week. If you want to get the news every week, be sure to join our mailing list below.
From Tatiana Tsiguleva on Twitter Nota: Este artigo foi traduzido automaticamente com OpenAI GPT-5.5 por meio do Codex CLI; a qualidade pode estar reduzida, especialmente na terminologia técnica.
Lançamentos
Gemini 3.5 Flash
O GoogleIO foi nesta semana, quando eles lançaram dezenas de novos produtos e recursos (principalmente de IA), com o destaque sendo o Gemini 3.5 Flash.
Modelos Gemini anteriores também tiveram resultados muito bons em benchmarks, mas fracassaram no mundo real
Os modelos anteriores do Google tiveram dificuldades no mundo real, com o modelo mais recente Gemini 3.1 Pro nem sendo tão melhor assim que seu antecessor.
Esse padrão parece estar continuando também com o Gemini 3.5 Flash.
Apesar das fortes pontuações em benchmarks, há uma infinidade de pessoas online insatisfeitas com o desempenho deste modelo em tarefas do mundo real. As pessoas relataram que ele tem dificuldade com problemas básicos de matemática (300 + 140 = 360?), produz grandes quantidades de código lixo que não funciona e tem desempenho pior com diretrizes adicionais que deveriam ajudá-lo a performar melhor, o que pode se dever ao fato de que ele parece ter medo do próprio prompt de sistema.
Isso poderia ser perdoável, já que os modelos Gemini Flash devem ser a opção econômica, que não necessariamente oferece o melhor desempenho, mas tem um preço razoável.
O problema é que, apesar de ser construído a partir do Gemini 3 Flash, o Google decidiu aumentar o preço em 3x, custando US$ 9 por milhão de tokens de saída.
Para referência, quando o GPT 5 foi lançado, ele era apenas US$ 1 mais caro (o GPT 5.5 agora custa US$ 30 por milhão de tokens de saída).
O modelo não apenas custa mais, como também usa mais tokens para responder a perguntas.
Devido a esses dois fatores, ele custa 2x mais que o Gemini 3.1 Pro para executar o conjunto de benchmarks da Artificial Analysis.
Custos do benchmark da Artificial Analysis
Em termos de custo, isso coloca o modelo por volta do mesmo preço do GPT 5.5 com raciocínio médio e, para piorar, apesar de o Gemini Flash 3.5 ser um modelo otimizado para benchmarks, ele ainda tem desempenho pior que o GPT 5.5 medium e é mais lento por gerar muitos mais tokens.
O modelo econômico não é barato, sua velocidade está sendo usada para não chegar a lugar nenhum muito rapidamente, e sua inteligência só existe no papel.
Fique longe do Gemini 3.5 Flash.
Notas rápidas
Gemini Omni
Ao contrário da equipe de LLMs, as equipes de geração de imagens e vídeos do Google estão se saindo muito melhor, como visto em seu novo modelo Gemini Omni.
Ele foi pensado principalmente como um modelo de edição de vídeo, e é o primeiro passo da incursão do Google em um modelo verdadeiramente omnimodal capaz de criar qualquer coisa.
Ainda não há benchmarks de terceiros para ele (em geral, não temos bons rankings de vídeo para vídeo), mas, com base no forte modelo Veo 3.1 deles, espero que este modelo também seja muito forte.
Final
Espero que você tenha gostado das notícias desta semana. Se quiser receber as notícias toda semana, não deixe de entrar na nossa lista de e-mails abaixo.
De Tatiana Tsiguleva no Twitter Nota: Este artículo fue traducido automáticamente con OpenAI GPT-5.5 mediante Codex CLI; la calidad puede verse degradada, especialmente en la terminología técnica.
en resumen
- ¿Es Gemini 3.5 Flash el mejor modelo económico?
- Gemini Omni, modelo de edición de video
Lanzamientos
Gemini 3.5 Flash
GoogleIO fue esta semana, donde lanzaron decenas de nuevos productos y funciones (en su mayoría de IA), con Gemini 3.5 Flash como punto destacado.
Los modelos anteriores de Gemini también han obtenido muy buenos resultados en benchmarks, pero han fracasado en el mundo real
Los modelos anteriores de Google han tenido problemas en el mundo real, y el modelo más reciente, Gemini 3.1 Pro, ni siquiera fue mucho mejor que su predecesor.
Este patrón parece seguir ocurriendo también con Gemini 3.5 Flash.
A pesar de las sólidas puntuaciones en benchmarks, hay una gran cantidad de personas en línea descontentas con el rendimiento de este modelo en tareas del mundo real. La gente ha reportado que tiene dificultades con problemas básicos de matemáticas (¿300 + 140 = 360?), que produce grandes cantidades de código basura que no funciona, y que rinde peor con directrices adicionales que supuestamente deberían ayudarlo a desempeñarse mejor, lo cual puede deberse a que parece estar asustado de su propio prompt de sistema.
Esto podría ser perdonable, ya que los modelos Gemini Flash están pensados como la opción económica que no necesariamente te da el mejor rendimiento, pero sí un precio razonable.
El problema es que, pese a estar construido a partir de Gemini 3 Flash, Google ha decidido aumentar el precio 3 veces, con un coste de $9 por millón de tokens de salida.
Como referencia, cuando se lanzó GPT 5, solo era $1 más caro (GPT 5.5 ahora cuesta $30 por millón de tokens de salida).
El modelo no solo cuesta más, sino que también usa más tokens para responder preguntas.
Debido a estos dos factores, ejecutar la suite de benchmarks de Artificial Analysis cuesta el doble que con Gemini 3.1 Pro.
Costes del benchmark de Artificial Analysis
En términos de coste, esto coloca al modelo alrededor del mismo precio que GPT 5.5 con razonamiento medio y, para colmo, a pesar de que Gemini Flash 3.5 es un modelo optimizado para benchmarks, aun así rinde peor que GPT 5.5 medium y es más lento porque genera muchos más tokens.
El modelo económico no es barato, su velocidad se está usando para no llegar a ninguna parte muy rápidamente, y su inteligencia solo existe sobre el papel.
Evita Gemini 3.5 Flash.
Noticias rápidas
Gemini Omni
A diferencia del equipo de LLM, los equipos de generación de imágenes y video de Google lo están haciendo mucho mejor, como se ve con su nuevo modelo Gemini Omni.
Está pensado principalmente como un modelo de edición de video, y es el primer paso de Google en su incursión hacia un modelo verdaderamente omnimodal que pueda crear cualquier cosa.
Todavía no hay benchmarks de terceros para él (en general no tenemos buenos rankings de video a video), pero basándome en su sólido modelo Veo 3.1, espero que este modelo también sea muy fuerte.
Cierre
Espero que hayas disfrutado las noticias de esta semana. Si quieres recibir las noticias cada semana, asegúrate de unirte a nuestra lista de correo abajo.
De Tatiana Tsiguleva en Twitter