Amazon (NASDAQ:AMZN) Web Services (AWS) ha anunciado la introducción de nuevos servidores de centros de datos equipados con sus chips de inteligencia artificial (IA) propietarios, desafiando así el dominio de Nvidia (NASDAQ:NVDA) en el sector. Se ha confirmado que Apple Inc (NASDAQ:AAPL). es cliente y planea utilizar estos nuevos chips Trainium2. La unidad de nube de AWS reveló que estos servidores formarán parte de una supercomputadora masiva que incorporará cientos de miles de chips. Este anuncio se realizó el martes.
La startup de IA Anthropic será la primera empresa en utilizar esta supercomputadora impulsada por los chips Trainium2 de AWS. Conocida por crear sistemas de IA confiables e interpretables, Anthropic aprovechará este poder computacional para mejorar las capacidades de sus modelos de IA.
Benoit Dupin, ejecutivo de Apple, también confirmó que el gigante tecnológico está empleando chips Trainium2, lo que supone una adopción significativa de la nueva oferta de AWS.
Matt Garman, Director Ejecutivo de AWS, reveló además que la empresa ya está trabajando en Trainium3, la próxima evolución de su chip de IA, cuyo debut está previsto para el próximo año.
Las nuevas instancias de Amazon Elastic Compute Cloud (Amazon EC2), impulsadas por AWS Trainium2, están ahora disponibles e introducen los Trn2 UltraServers. Estos UltraServers están diseñados para ofrecer un rendimiento y eficiencia de costos excepcionales en el entrenamiento e implementación de modelos de IA modernos, incluyendo modelos de lenguaje grande (LLM) y modelos de base (FM).
Las instancias Trn2 prometen una mejora del 30-40% en el rendimiento por precio sobre las instancias EC2 basadas en GPU actuales y cuentan con 16 chips Trainium2, proporcionando 20,8 petaflops de cálculo pico. Esto las hace ideales para manejar cargas de trabajo de IA con miles de millones de parámetros.
Para tareas de IA aún más exigentes, los Trn2 UltraServers ofrecen un nuevo servicio EC2, con 64 chips Trainium2 interconectados para hasta 83,2 petaflops de cálculo pico. Esta configuración cuadruplica las capacidades de cómputo, memoria y red de una sola instancia, permitiendo el entrenamiento e implementación de los modelos de IA más grandes del mundo.
El proyecto colaborativo entre AWS y Anthropic, denominado Project Rainier, tiene como objetivo construir un EC2 UltraCluster de Trn2 UltraServers, que se convertirá en el clúster de cómputo de IA más grande del mundo una vez completado.
AWS también destacó el próximo chip Trainium3, que se fabricará utilizando un proceso de 3 nanómetros, prometiendo cuadruplicar el rendimiento de los actuales Trn2 UltraServers.
El kit de desarrollo de software (SDK) AWS Neuron facilita la optimización de modelos de IA para ejecutarse en chips Trainium, soportando marcos populares como JAX y PyTorch, y está integrado con el hub de modelos Hugging Face, que aloja más de 100.000 modelos.
Las instancias Trn2 están actualmente disponibles en la región AWS US East (Ohio), con planes de expandir la disponibilidad a regiones adicionales próximamente. Mientras tanto, los Trn2 UltraServers se están ofreciendo en una fase de vista previa.
Este artículo ha sido generado y traducido con el apoyo de AI y revisado por un editor. Para más información, consulte nuestros T&C.