Bits, Stocks & Blocks
Posts
Nvidia: a pedra fundamental da Inteligência Artificial

Nvidia: a pedra fundamental da Inteligência Artificial

Empoderando uma revolução – #1 da Série de IA

Eduardo Vasconcellos
23 de maio de 2023

Oi pessoal, esta semana iniciamos nossa série sobre Inteligência Artificial (IA). O ponto de partida é a Nvidia, a sexta maior empresa do mundo, avaliada em US$770bi. A Nvidia está para a IA da mesma forma que a Apple está para Smartphones.

Por que? Porque quando os computadores aprenderam a aprender, eles aprenderam nos chips da Nvidia! Atualmente a maioria absoluta dos programas de IA rodam no hardware e software desenhado pela companhia. Seus clientes incluem Google, Meta, Amazon, Microsoft, OpenAI dentre centenas de outras.

Se isso não te deixou animado, vamos falar de seu fundador e CEO: ele usa jaqueta de couro, é bombado, salvou a sua empresa da morte várias vezes. Seu lema é “A minha vontade de sobreviver é maior que a vontade das outras pessoas de querer me matar”. Elon Musk? Não, ele é Jensen Huang – o CEO mais casca grossa do setor de tecnologia. Não acredita? Veja a foto abaixo com sua tatuagem do logo da empresa e aperte os cintos, pois a história de hoje é uma montanha russa!

Jensen Huang

Importante: caso queira ouvir a versão em áudio, clique aqui

Se você tem apenas um minuto, isto é o que você precisa saber:

Contra tudo e todos, a Nvidia venceu mais de 80 empresas para se tornar a pioneira em chips gráficos, os Graphic Processing Units (GPUs)
O processamento em paralelo dos GPUs permitem que eles processem múltiplos cálculos com grandes quantidades de dados. Isso é altamente eficiente não apenas para gráficos, mas para todos os tipos de cálculos computacionalmente pesados, como Inteligência Artificial
De uma fornecedora de chips gráficos para a indústria de games em PC, a Nvidia evoluiu para ser um ser o viabilizador da IA em múltiplas indústrias, de data centers a carros autônomos, passando por robótica, descoberta de medicamentos dentre outras

Jensen Huang

Jensen nasceu em 1963 em Taiwan. Seus pais decidiram emigrar para os Estados Unidos, mas devido à falta de recursos, eles enviaram os filhos primeiro. Com 9 anos, Jensen chega em Kentucky. Seus pais escolheram uma escola chamada Oneida Baptist Institute, para “alunos especiais”. Eles pensavam que “especiais” queria dizer “acima da média”, o que encaixaria com Jensen, que era um excelente aluno. Na verdade, era uma escola para alunos problemáticos. O colega de quarto de Jensen era um aluno de 17 anos que tinha acabado de sair da prisão e estava se recuperando de uma briga em que levou 7 facadas. Daí surgiu uma grande amizade. Ele ajudou seu colega com matemática, em contrapartida aprendeu sobre musculação intensa, um hábito que pratica até hoje. O período na Oneida fez com que Jensen desenvolvesse uma resiliência e postura de “durão” que será essencial na trajetória da Nvidia.

Depois da Universidade, Jensen se mudou para o Vale do Silício. Primeiro trabalhou na AMD, uma empresa que desenha chips e depois na LSI, que também desenha chips, mas estes para propósitos específicos (ex: um chip para um sistema de Defesa do exército). Ele foi um engenheiro brilhante em ambas as empresas.

Na LSI ele conheceu dois engenheiros, Chris Malachowsky e Curtis Priem, que trabalham na Sun Microsystems, seu cliente. Em 1993 eles propõem a Jensen a ideia de criar uma nova empresa, que desenvolveria chips específicos para acelerar o processamento de gráficos. Estes chips são úteis especialmente para games 3D em PC, que eram uma novidade na época. No mesmo ano havia sido lançado Doom, um game que foi um tremendo sucesso. Um game 3D é superior a um game 2D não apenas na imagem, mas também porque dá ao jogador muito mais liberdade. Ele passa a ter um mundo para explorar e criar novas narrativas, diferente do game 2D em que você só anda para a direita. O problema era que os computadores da época não conseguiam processar imagens 3D na velocidade necessária. O caso do Doom foi uma exceção pois seu criador foi genial e conseguiu montar um game 3D que funcionasse nos PCs da época.

A aposta era que a indústria de games em PC iria crescer. A ideia de fazer um chip específico para um propósito não era nova, dado que a LSI já fazia isso e existiam empresas fazendo chips para outros propósitos, como sistemas de som. Como negócio, fazia mais sentido ser um fornecedor de tecnologia para games do que investir num estúdio, pois é mais difícil prever qual deles vai produzir um sucesso.

Competição Feroz

Eles decidiram então fundar a nova empresa como uma fabless chip designer, ou seja, uma empresa que projetaria os chips, mas que utilizaria empresas como a TSMC para fazer a fabricação final. Jensen, através do CEO da LSI, consegue uma reunião com a Sequoia Capital, que investe na empresa. US$2mi por 33% de participação. Lembre-se que estou falando da sexta empresa mais valiosa do mundo. Ela começou com um valor de US$6mi. O nome: Nvidia. As iniciais NV são porque a empresa está sempre pensando na “Next Version” dos seus produtos. A preocupação em sempre melhorar e nunca ser complacente faz parte da cultura da empresa, como veremos.

A oportunidade que os fundadores viam foi identificada por muitas outras pessoas. Dois meses depois da fundação da Nvidia, existem 89 outras empresas que captaram dinheiro com fundos de venture capital para ir atrás da mesma oportunidade.

Um dos desafios da Nvidia é que a indústria de games 3D era muito jovem e sem padrões técnicos estabelecidos (ex: framework de desenvolvimento). Quem conseguisse defini-los, teria uma vantagem estratégica. Os padrões que a Nvidia passou 18 meses desenvolvendo infelizmente não tiveram aceitação do mercado. A empresa se viu sem produto e com caixa para apenas 9 meses. Jensen chamou seu time e mudou toda a estratégia. A Nvidia iria abandonar o chip que estavam desenvolvendo e iriam começar um novo, do zero utilizando os padrões que a indústria estava adotando. A única vantagem que poderiam ter seria desenhar mais rápido e melhor que a competição. O problema é que um chip demora cerca de dois anos para ficar pronto. Eles demitem 70% da empresa e ficam com 35 pessoas

A Nvidia vai pro tudo ou nada. Normalmente uma empresa manda os desenhos dos chips para a fábrica, que produz alguns protótipos, que são testados pelo cliente antes de entrar em produção em massa. A Nvidia decide pular essa etapa e testar seus desenhos utilizando um software de teste, sem fabricar antes. O detalhe é que este software ainda estava em desenvolvimento, era lento e criado por uma startup recém fundada. Jensen viu que eles não tinham opção, era isso ou quebrar. Os engenheiros da Nvidia conseguem hackear e melhorar este software de teste, aumentando a sua velocidade. Eles terminam o processo em seis meses e mandam o desenho do chip para produção. Lançar um chip não testado apropriadamente era muito arriscado.

O RIVA128 é muito mais poderoso que qualquer coisa que o mercado tinha visto, mais poderoso até do que o que os próprios clientes precisavam.

O problema era que uma parte do chip não funcionava e saiu quebrada de fábrica, mas mesmo assim ainda era melhor que qualquer outro. A Nvidia conseguiu em seis meses criar o chip de melhor performance gráfica do mundo e os consumidores e desenvolvedores querem o melhor.

A Nvidia tinha então: 1) O melhor chip gráfico do mercado; 2) Um sucesso de vendas; 3) Uma equipe que sabia produzir chips em um tempo mais curto; 4) Um time que passou por um teste enorme e venceu. Era hora de atacar!

A empresa entra num período de forte crescimento com o sucesso do RIVA128 e os chips que vem depois. A empresa fez seu IPO em 1999, valendo US$600mi (retorno de 100x para a Sequoia). Nessa época a Nvidia também fechou um grande contrato com a Microsoft para fazer os chips do Xbox e consegue que a TSMC se torne sua principal fabricante de chips. A melhor forma de entender como os chips da Nvidia estão evoluindo é comparando a qualidade dos gráficos de games durante os anos:

A diferença entre um CPU vs um GPU

Antes de continuarmos vale uma (muito) breve explicação técnica. Os dois principais tipos de chips que existem são o CPU (Central Processing Unit) e o GPU (Graphic Processing Unit). O CPU é o cérebro do computador, processando diversas funções complexas de forma rápida e sequencial, ou seja, um comando de cada vez. O objetivo do CPU é fazer as tarefas de forma rápida. Já o GPU é um “músculo extra”, que ajuda o CPU ao assumir algumas tarefas e deixá-lo focando nas principais tarefas (ex: rodar o Windows). A grande diferença entre eles é que o GPU é muito mais eficiente em rodar tarefas em paralelo, ou seja, várias ao mesmo tempo. O gráfico de um game é na verdade milhões de pixels que são processados ao mesmo tempo. Para que a imagem fique boa, todos precisam rodar ao mesmo tempo.

Em resumo: o CPU é generalista e processa as mais importantes funções de um computador, fazendo uma grande tarefa de cada vez. O GPU é especializado e melhor para fazer muitas tarefas menores ao mesmo tempo, de forma paralela. A Nvidia faz GPUs. Na verdade ela mesma cunhou esse termo.

Expandindo a missão da Nvidia

No início dos anos 2000, o grande risco para a Nvidia é o fato que ela produz um acelerador computacional, algo que é adicional ao CPU. Para instalar seu chip, o consumidor precisa comprá-lo e instála-lo na placa do CPU, que na maioria dos casos era da Intel. Sendo a maior empresa de CPUs, a Intel poderia simplesmente criar um GPU próprio e foi o que ela fez.

A inércia do consumidor é grande e este poderia simplesmente usar o chip que já vem instalado na placa do CPU. A alternativa é ir na loja de PCs, comprar o chip da Nvidia e instalar. À medida que a Nvidia crescia, ela precisava expandir o seu mercado potencial. O gamer “raiz” sempre vai querer o GPU da Nvidia, mas qual o tamanho desse mercado no longo prazo? (PS: hoje sabemos que esse mercado é enorme, mas na época a empresa não sabia disso).

Jensen se preocupava que ao endereçar um mercado menor que o dos concorrentes, ele sempre teria menos dinheiro para investir em pesquisa. Eventualmente mesmos aqueles que não eram focados em GPU, iriam alcançá-lo. A Nvidia precisava expandir sua missão, seus produtos e atacar novos mercados. Ela precisaria então ser mais generalista, oferecendo produtos para outras indústrias além de games, mas continuando a desenvolver um produto que é, em sua essência, especializado. Esse seria um balanço que ela teria que considerar e ser inteligente para navegar nos anos seguintes.

A missão da empresa expandiu para ser a pioneira em computação acelerada para ajudar a resolver grandes desafios da sociedade que os computadores tradicionais não conseguem.

Neste esforço de expandir sua área de atuação, a Nvidia entendeu que o fato de o GPU ser focado em processos paralelos é muito útil para lidar com grandes quantidades de dados. Isso potencialmente abre o mercado de análise e modelagem para pesquisa científica e acadêmica.

Na mesma época, pesquisadores estão concluindo que o custo de aumentar a capacidade de processamento dos CPUs estava ficando impraticável. Isso ocorreu devido aos próprios limites da física de quantos transistores é possível colocar num chip. A Lei de Moore estava ficando muito cara. Isso abriu espaço para que o GPU, acelerando a computação do CPU, pudesse tomar o protagonismo dos avanços em computação.

Fonte: Nvidia

A lei de Moore é a linha Azul. A linha verde inclui computação acelerada, ou seja, é mais rápida que a própria Lei de Moore!

Em 2006 a Nvidia lançou o primeiro GPU que poderia ser utilizado para diversos propósitos, não apenas games. Esse GPU, junto com um CPU, poderia acelerar a computação de alta performance em diferentes campos. Para permitir que desenvolvedores pudessem programar os GPUs, que era um dos grandes desafios para aumentar o escopo de utilização, a Nvidia também lança o CUDA (Compute Unified Device Architecture), um software proprietário que permite programar seus GPUs. O CUDA veio com uma biblioteca de códigos, debuggers e APIs.

Os investidores inicialmente não gostaram da ideia. Eles tinham investido numa empresa dominante em um segmento rentável, de games. Agora a empresa estava pegando os lucros de games e investindo bilhões para crescer seu mercado potencial, mas em tese esses mercados ainda não existiam.

Não existiam pessoas usando GPUs para lidar com dados. A Nvidia acreditava que elas não faziam isso pois não tinham as ferramentas certas e ela estava criando-as agora. Mesmo com a crise financeira, em que as ações da empresa caíram 80%, Jensen continua obcecado em usar GPUs para outros propósitos. Ele apostou a empresa inteira que esse era o futuro!

Jensen também via esse movimento como uma forma de tornar a Nvidia um negócio melhor, pois com o CUDA a empresa iria impor um maior custo de troca (switching cost) para um cliente trocar o seu GPU para o de um concorrente. Adicionalmente, a Nvidia poderia se tornar um negócio de plataforma. Para aumentar a adesão, o CUDA é gratuito.

Nvidia Flywheel. Fonte: Nvidia

Inteligência Artificial

No final de 2011 as ações da Nvidia estão no mesmo patamar de preço do início de 2006. O mercado continua cético. Em 2012, temos um momento fundamental para a Inteligência Artificial, que vai mudar tudo.

Existia uma competição acadêmica chamada AlexNet, em que pesquisadores produzem algoritmos que são rodados contra uma base de imagens com o intuito de identificar o que está nelas. Por exemplo, se a imagem é de um cachorro, o computador precisa dizer que é um cachorro e não um gato.

Normalmente os algoritmos vencedores acertam 75% das imagens. Neste ano, o algoritmo vencedor, de um time da Universidade de Toronto, acertou 85% dos casos.

Como eles fizeram isso? Fazendo o computador aprender. Como ele aprendeu? Utilizando redes neurais, um conceito de inteligência artificial que organiza o computador como se fosse o cérebro de um mamífero, ou seja, com vários neurônios que fazem cálculos simples e transmitem isso um para os outros. Essa arquitetura não foi inventada por eles, já existia na teoria, o que não existia era o poder computacional para fazer estes cálculos. O time vencedor criou o algoritmo utilizando o CUDA e GPUs da Nvidia.

Logo depois, um cientista da Nvidia, junto de pesquisadores de Stanford e do Google publicam um paper sobre redes neurais, mostrando como é possível fazer computação de altíssima performance, mais rápida e gastando menos energia. É o início dos modelos de Inteligência Artificial.

Jogada de Mestre

Aqui fica claro a genialidade de Jensen. A Nvidia oferece os chips de melhor performance e o software para as pessoas interagirem com ele, mas faz disso uma arquitetura fechada. Isso quer dizer que um algoritmo escrito em CUDA apenas vai rodar no chip da Nvidia. No CUDA os programadores podem encontrar livrarias, sistemas e aplicações que vão sendo continuamente expandidas para a criação de modelos de IA para as diferentes indústrias em que esta pode ser aplicada.

Empresas como Google e Facebook estão numa corrida para oferecer melhores insights de seus usuários para seus clientes. Modelos de IA são essenciais para isso. Estas empresas começam a usar Nvidia e o custo de deixar de usa-la é alto. A Nvidia oferece uma solução completa e quando eu ouço a palavra “solução”, o que meus ouvidos ouvem é “Pricing Power e Margens Altas”. Google, Facebook, Microsoft, Amazon são alguns de seus principais clientes. Para tangibilizar, abaixo estão alguns exemplos de empresas que utilizam Nvidia em segmentos como saúde, telecom, serviços financeiros, correios e enterprise.

Fonte: Punchcard Investor & Nvidia

Jensen foi ousado ao dizer em 2017 que “esse negócio de Inteligência Artificial vai dar super certo, ou muito errado, pois apostamos tudo nisso”.

Computação acelerada numa escala de data center, combinada com machine learning, conseguiu acelerar a computação em um milhão de vezes. A computação acelerada viabiliza modelos de Inteligência Artificial como os da OpenAI.

Inteligência Artificial transformou fundamentalmente o que software pode fazer e também como fazemos software. As companhias estão processando e refinando seus dados, fazendo software com IA. Os data centers estão se transformando em fábricas de IA. A primeira onda é percepção e inferência de como reconhecer imagens e textos (ex: ChatGPT), recomendar um vídeo ou um item para comprar. A próxima onda é robótica, IA planejando ações no mundo real.

De uma empresa que vendia chips, ela agora oferece soluções para rodar modelos de Inteligência Artificial que usam trilhões de dados. É estimado que seu market share para processamento de soluções de IA seja acima de 80%. A Nvidia possui hoje o sistema operacional em que IA roda, ajudando na aceleração dessa tecnologia para as maiores indústrias do mundo e é por isso que ela é a pedra fundamental da Inteligência Artificial.

Grande abraço,

Edu

DISCLAIMER: essa newsletter não é recomendação de investimentos. Seu propósito é puramente de entretenimento e não constitui aconselhamento financeiro ou solicitação para comprar ou vender qualquer ativo. Faça a sua própria pesquisa. Todas as opiniões visões são pessoais do próprio autor e não constituem a visão institucional de nenhuma empresa da qual ele seja sócio, colaborador ou investidor.