
Google tiene un nuevo método para que la IA consuma mucha menos memoria. Malísimas noticias para Micron y SK Hynix
Google Research presenta TurboQuant, una técnica que comprime hasta 6x la memoria KV cache de modelos de IA; malas noticias para fabricantes como Micron y SK Hynix, pero una gran oportunidad de eficiencia.







