Sohu afirma ser 20 vezes mais rápido na execução de transformadores como o ChatGPT do que o principal produto da Nvidia, o H100.
A razão pela qual você pode perguntar ao ChatGPT “como comer uma manga sem derramá-la” e muito mais é devido às Unidades de Processamento Gráfico (GPUs) H100 e B200 da Nvidia. Esses chipsets mágicos que alimentam os chatbots de IA impulsionaram a Nvidia a se tornar a líder da indústria de hardware de IA, com uma capitalização de mercado atingindo a marca de 3 trilhões de dólares – mais do que a Microsoft e a Apple no mês passado.
Mas agora, uma startup relativamente jovem, fundada por dois ex-alunos de Harvard, está de olho em sua parte do mercado de hardware de IA. A Etched, uma startup baseada na Califórnia, busca revolucionar o mercado de chipsets de IA com seu chip ASIC (Circuitos Integrados de Aplicação Específica) chamado Sohu.
O Sohu afirma ser 20 vezes mais rápido na execução de transformadores como o ChatGPT do que o principal produto da Nvidia, o H100. O B200, que é a oferta mais poderosa da Nvidia em comparação ao H100, é supostamente 10 vezes mais lento que o Sohu, segundo as alegações feitas pela empresa com base em testes de emulação.
A startup Etched está adotando uma abordagem totalmente diferente para fornecer alta potência computacional para executar bilhões de parâmetros (variáveis usadas no treinamento de um modelo de IA) para modelos de transformadores. Ao contrário das GPUs que podem realizar várias tarefas computacionalmente pesadas (como renderização gráfica em tempo real), a Etched está optando por criar um chip especializado que atende apenas a modelos de IA de transformadores – aqueles que executam o ChatGPT, o Sora (modelo de texto para vídeo da OpenAI) e o Gemini do Google.
Isso significa que ele não pode executar outros modelos de IA, como Redes Neurais Convolucionais (usadas para reconhecimento de imagem). Isso abre a possibilidade de explorar novos produtos de IA pelos desenvolvedores que até agora não eram possíveis devido ao poder limitado das GPUs.
Por exemplo, o Sohu pode potencialmente levar a um tradutor em tempo real que possa ouvir e ler Hindi, Gujarati ou Tamil e responder em francês, inglês e alemão. Claro, uma tradução multimodal e multilíngue dessas precisa de mais do que apenas poder computacional, mas, em teoria, isso abre a possibilidade.
Outra aplicação multimodal de transformadores que o chipset pode explorar é integrar áreas visuais e de linguagem. Isso essencialmente significa que um modelo assim entenderá texto e imagens simultaneamente, abrindo a possibilidade de perguntas e respostas visuais – como em uma entrevista.
Mas tudo isso permanece uma teoria. A Etched levantou 120 milhões de dólares em 25 de junho para tornar isso uma realidade, mas um cronograma real para o lançamento do ASIC Sohu ainda é incerto.