Sohu é o nome do novo chipset que promete transformar como modelos de IA, como o ChatGPT, funcionam.
Desenvolvido por uma startup chamada Etched, fundada por dois ex-alunos de Harvard, o Sohu pretende ser 20 vezes mais rápido que o principal chip da Nvidia, o H100.

Atualmente, os modelos de IA que impulsionam chatbots como o ChatGPT são executados em GPUs da Nvidia, como os modelos H100 e B200.
A Nvidia lidera o mercado de hardware para IA, com um valor de mercado que recentemente ultrapassou 3 trilhões de dólares. No entanto, a Etched visa desafiar esse domínio com seu novo chip especializado.
Tecnologia e Inovação
O Sohu é um ASIC (Application Specific Integrated Circuit), projetado especificamente para executar modelos de IA transformadores, como o ChatGPT e o Sora da OpenAI.
Diferente das GPUs, que realizam múltiplas tarefas computacionalmente pesadas, o Sohu é especializado e, portanto, mais eficiente para sua função específica.
- Desempenho: O Sohu é supostamente 20 vezes mais rápido que o H100 e 10 vezes mais rápido que o B200.
- Especialização: O chip é projetado apenas para modelos transformadores, não podendo executar outras formas de IA como Redes Neurais Convolucionais.
- Aplicações Futuras: A especialização do Sohu abre portas para novas possibilidades, como tradutores em tempo real e modelos multimodais que compreendem texto e imagens simultaneamente.

Desenvolvimento e Financiamento
A Etched arrecadou 120 milhões de dólares em 25 de junho para desenvolver o Sohu.
A empresa também tem um acordo com a TSMC (Taiwan Semiconductor Manufacturing Company) para fabricar o chip de 4 nanômetros.
Embora a data de lançamento ainda seja incerta, a empresa afirma ter “dezenas de milhões de dólares” em pré-encomendas de hardware.
O Sohu da Etched pode ser um divisor de águas no campo da IA, ultrapassando potencialmente as GPUs da Nvidia em eficiência e velocidade para modelos transformadores.
Se o chip cumprir suas promessas, poderá abrir novas possibilidades e impulsionar a criação de produtos de IA até então limitados pela capacidade das GPUs.