Tenstorrent permite la IA a escala con rendimiento líder en la industria con novedosa arquitectura en la red

Tenstorrent Galaxy™ Blackhole ofrece IA de propósito general con escalado nativo para un rendimiento superior en generación de vídeo con IA y LLMs — prefill y decode

4 minutos

Tenstorrent permite la IA a escala con rendimiento líder en la industria con novedosa arquitectura en la red

Tenstorrent permite la IA a escala con rendimiento líder en la industria con novedosa arquitectura en la red

Comenta

Publicado

4 minutos

Más leídas

Tenstorrent Galaxy™ Blackhole ofrece IA de propósito general con escalado nativo para un rendimiento superior en generación de vídeo con IA y LLMs — prefill y decode


Tenstorrent, la empresa de computación de IA liderada por su CEO Jim Keller, anuncia hoy la disponibilidad general de Tenstorrent Galaxy Blackhole desplegado a escala, ofreciendo un rendimiento de IA de propósito general líder en la industria. Otras soluciones requieren ensamblar aceleradores separados sobre infraestructuras fragmentadas. La IA en red de Tenstorrent los ofrece de forma nativa: computación, memoria y redes unificadas en un único sistema optimizado para cargas de trabajo de IA del mundo real.

Rendimiento líder en la industria, precios asequibles
Propósito general significa rendimiento líder en cada carga de trabajo que define la IA moderna, no especializarse en una sola. Tenstorrent Galaxy lidera la generación de vídeo, la inferencia de LLM de gran contexto tanto en prefill como en decode, y toda la gama de arquitecturas de modelos disponibles actualmente.

Será posible comprobarlo el viernes 1 de mayo a las 13:30 PT en el evento de lanzamiento de Tenstorrent, TT-Deploy. Para ver la retransmisión en directo, visitar https://tenstorrent.com/deploy

Generación de vídeo de IA en tiempo real y alta calidad 10 veces más rápida
La generación de vídeo con IA en Tenstorrent Galaxy es 10 veces más rápida que en los sistemas GPU líderes. En colaboración con Prodia, la generación de vídeo más rápida del sector es ahora 10 veces más rápida ejecutándose en un supercluster Tenstorrent Galaxy y generando vídeo de 720p y 81 fotogramas en tan solo 2,4 segundos.

"Ya liderábamos el ranking de Artificial Analysis, y trabajar con Tenstorrent nos permitió lograr otra mejora de 10 veces en la velocidad de generación de vídeo. La integración fue fluida y las mejoras de rendimiento fueron inmediatas", afirmaron Mikhail Avady y Monty Anderson, cofundadores de Prodia Labs.

Modo Blitz: inferencia de LLM más rápida y con mayor contexto
El Modo Blitz en Tenstorrent Galaxy, optimizado para cargas de trabajo de IA prémium sensibles a la latencia, permite más de 350 t/s/u y menos de 4 segundos hasta el primer token en Deepseek-R1-0528 671B, superando a los sistemas GPU comparables líderes. Los superclusters Tenstorrent Galaxy ejecutan casos de uso de IA de alto margen, incluidos flujos de trabajo agénticos, sistemas en tiempo real y razonamiento de contexto largo.

Benchmarks de rendimiento de Tenstorrent Galaxy

  • Decode: DeepSeek-R1-0528 671B hasta más de 350 tokens/segundo/usuario — más rápido que los sistemas de inferencia más rápidos de Groq y Cerebras en rendimiento y capacidad, soportando tamaños de lote de 8 a 64 y hasta 128k de contexto.
  • Prefill: DeepSeek-R1-0528 671B con menos de 4 segundos hasta el primer token en contexto de 100K — ejecutándose en los mismos superclusters de IA de propósito general Tenstorrent Galaxy.

IA de pila completa, lista para producción
Tenstorrent proporciona una solución completa de IA — desde hardware hasta software y despliegue. Tenstorrent Galaxy se integra con frameworks de código abierto a través de TT-Forge™ y TT-Lang, y soporta la rápida puesta en marcha de modelos, permitiendo a los clientes desplegar sistemas de IA en producción sin dependencia de proveedores ni stacks propietarios. El 90 % de los modelos de HuggingFace funcionan directamente en el hardware de Tenstorrent.

IA en red
Estos resultados están habilitados por una arquitectura construida en torno a una restricción diferente. La mayoría de los aceleradores de IA tratan la computación como el principal problema de diseño. Tenstorrent, en cambio, resolvió primero la ubicación y el flujo de datos, lo que permite el rendimiento mediante el escalado.

"Cada empresa de la industria está combinando aceleradores para construir aceleradores de aceleradores de aceleradores. Las CPUs ejecutan código. Las GPUs aceleran las CPUs. Las TPUs aceleran las GPUs. Las LPUs aceleran las TPUs. Y así sucesivamente. Esto conduce a soluciones complejas que probablemente no serán compatibles con los cambios en los modelos y usos de IA. En Tenstorrent pensamos que algo más general y más simple funcionaría", afirmó Jim Keller, CEO de Tenstorrent.

El resultado es lo que Tenstorrent denomina IA en red: un nuevo modelo de infraestructura de IA donde computación, memoria y redes se unifican en un único sistema optimizado para cargas reales de IA. Al combinar una ubicación y flujo de datos eficientes, memoria en chip de alto ancho de banda y escalado basado en Ethernet, la arquitectura escala desde un solo núcleo hasta miles de servidores bajo un único modelo de software, sin interconexiones propietarias, sin reconfiguración y sin las rígidas definiciones de carga de trabajo que hacen frágiles a los sistemas competidores a medida que evolucionan los modelos.

Despliegues
Los superclusters Tenstorrent Galaxy son una de las nuevas bases del Distributed AI Hub™ de Equinix, una plataforma de orquestación de IA de pila completa para cargas de trabajo agéntico, lanzada hoy con los socios BetterBrain y OrionVM. El Distributed AI Hub de Equinix ayuda a clientes y socios a cubrir todas las capas, desde la infraestructura hasta la aplicación, y se integra con sistemas empresariales heredados.

  • Equinix: empresa global de infraestructura digital que proporciona servicios de colocación e interconexión, permitiendo a empresas y socios desplegar y escalar IA — junto con otras cargas críticas — de forma segura y eficiente y cerca de usuarios, nubes y datos.
  • OrionVM: socio de plataforma cloud heterogénea de nueva generación que impulsa la capa de orquestación e infraestructura para servicios de IA basados en Tenstorrent.
  • BetterBrain: plataforma de IA de pila completa y socio de despliegue que ofrece aplicaciones de IA seguras, personalizables y listas para producción, así como flujos de trabajo agéntico sobre infraestructura Tenstorrent.

Sobre Tenstorrent
Tenstorrent es una empresa de computación de IA liderada por su CEO Jim Keller — arquitecto de Apple A4/A5, AMD Zen y el chip Full Self-Driving de Tesla. La compañía desarrolla procesadores y sistemas de IA basados en RISC-V para desarrolladores, empresas e infraestructuras soberanas en todo el mundo. Además de servidores y estaciones de trabajo, Tenstorrent licencia su CPU Ascalon RISC-V y núcleos de IA Tensix a diseñadores de chips como Samsung y LG. Respaldada por Bezos Expeditions, Samsung, LG Electronics, Hyundai Motor Group, Fidelity y otros, Tenstorrent ha recaudado más de 1.000 millones de dólares. Más información en tenstorrent.com