Guerin Blask/Forbes
Acessibilidade
Depois de uma manhã revisando um conjunto de dados, lendo artigos de pesquisa e brincando com modelos de IA de ponta em seu apartamento em Manhattan, Edwin Chen faz uma curta caminhada até o elegante Starbucks Reserve Roastery de três andares na Nona Avenida.
Vestido com uma camiseta azul-marinho Vuori e uma bolsa de lona com estampa de tigre pendurada no ombro, Chen desce as escadas e se acomoda em uma mesa escura no canto. Bebendo um chá verdezinho “porque pedir café aqui demora muito”, o fundador e CEO da Surge AI, uma empresa de rotulagem de dados e treinamento em IA, inicia uma discussão ininterrupta de duas horas sobre tudo, desde a cultura do Vale do Silício (que ele odeia) até seus rivais (“são todos oficinas de reparação”) e como os humanos poderiam interagir com alienígenas se viessem à Terra. “Eles não falam inglês. Então, como você se comunicaria com eles? Como você decifraria a língua deles? Tomara que haja alguma maneira matemática de fazer isso”, diz.
Esse dilema também é explorado em seu conto favorito, uma peça de 1998 do autor de ficção científica Ted Chiang. “História da Sua Vida” se tornou a base para o filme A Chegada, no qual um linguista tenta falar com alienígenas identificando padrões em sua fala e escrita. Também foi parte da inspiração de Chen para iniciar a Surge em 2020, ele diz, acrescentando que quer que sua empresa de rotulagem de dados codifique a “riqueza da humanidade”.
Para ele, isso significa fazer com que os humanos mais inteligentes (incluindo professores de Stanford, Princeton e Harvard) treinem a IA, traduzindo seu conhecimento especializado para os 1s e 0s (o sistema binário) que sustentam grandes modelos de linguagem. Além dos gênios da Ivy League, Chen emprega um exército de mais de um milhão de trabalhadores temporários de mais de 50 países ao redor do mundo que ajudam a criar perguntas que podem confundir a IA, avaliando as respostas dos modelos e escrevendo critérios que ajudam a IA a gerar uma resposta perfeita.
“Eu realmente acredito que o que estamos fazendo é tão crucial para todos os modelos de IA que, sem nós, a AGI [inteligência artificial geral, jargão tecnológico para quando a IA igualará ou superará as capacidades humanas] simplesmente não aconteceria”, diz Chen. “E eu quero que aconteça.”
Prolixo, brilhante e excêntrico, Chen é talvez o empreendedor de tecnologia mais bem-sucedido de quem você nunca ouviu falar. Isso porque, até muito recentemente, ele queria que fosse assim, apesar de ser bem conhecido na comunidade de IA.
O cientista de dados que trabalhou no Twitter, Google e Facebook evitou o capital de risco tradicional e deixou o aquário da Bay Area há sete anos, optando por financiar a Surge ele mesmo, começando com “alguns milhões” de economias de sua década em Big Tech. “Um dos motivos pelos quais nos engajamos é que eu sempre odiei o jogo de status do Vale do Silício”, diz Chen, que descreve a típica startup do Vale financiada por capital de risco como um “esquema para enriquecimento rápido”.
Ele também odeia a ideia de levantar tanto dinheiro e depois precisar gastá-lo. Em sua opinião, isso leva a uma supercontratação em massa. Ele ressalta que a Surge tem apenas 250 funcionários, incluindo tempo integral, meio período e consultores. Em contraste, a Scale AI, sua grande rival, tem quatro vezes mais funcionários e menos receita.
A Surge, que auxilia empresas de tecnologia a obter dados de alta qualidade necessários para aprimorar seus modelos de IA, arrecadou US$ 1,2 bilhão (R$ 6,37 bilhões) em receita em 2024, menos de cinco anos após sua fundação, com clientes como Google, Meta, Microsoft e os laboratórios de IA Anthropic e Mistral. Ele ajudou a treinar a Gemini, do Google, e a Claude, da Anthropic.
A empresa tem sido lucrativa desde quase o primeiro dia, de acordo com Chen. Com base nesses números, o valor estimado da empresa é de US$ 24 bilhões (R$ 127,4 bilhões). A Surge está em negociações para levantar US$ 1 bilhão (R$ 5,31 bilhões), com uma avaliação de US$ 30 bilhões (R$ 159,3 bilhões), embora a rodada ainda não tenha sido concluída.
A decisão de Chen, de ele mesmo financiar a Surge, rendeu bons frutos: sua participação de aproximadamente 75% na empresa vale cerca de US$ 18 bilhões (R$ 95,6 bilhões), o suficiente para torná-lo o novato mais rico na lista Forbes 400. Aos 37 anos, ele também é o integrante mais jovem da lista.
Chen tem a mesma probabilidade de pedir a alguém em uma entrevista para discutir David Foster Wallace ou linguística, assim como de pedir para programar ou resolver problemas em um quadro branco. “Valorizamos a criatividade”, diz ele.
A Surge afirma que sua abordagem não se assemelha às formas mais antigas de rotulagem de dados, nas quais pessoas, geralmente de países menos desenvolvidos do Sul Global, recebem centavos por hora para se sentarem diante de computadores e identificarem a diferença entre um gato e um cachorro.
Em vez disso, os anotadores de dados de Chen, que incluem profissionais e professores, seguem um conjunto de instruções para interagir com chatbots online. Eles podem ser solicitados a tentar induzir o chatbot a emitir uma resposta errada ou tóxica. Em seguida, eles escrevem uma resposta melhor. Ou podem ser solicitados a comparar diferentes respostas de IA à mesma pergunta e explicar por que uma é melhor.
Em termos de receita, a Surge é a maior do setor atualmente, mas concorrentes como a Scale AI — da qual a Meta comprou 49% por US$ 14 bilhões (R$ 74,3 bilhões) em junho —, a Turing, a Mercor e a Invisible AI estão se movendo rapidamente. As empresas gastaram US$ 104 bilhões (R$ 552,24 bilhões) em infraestrutura de IA em 2024, estima a empresa de pesquisa de tecnologia International Data Corporation, e estão a caminho de gastar mais este ano.
“Os dados são uma parte importante dessa infraestrutura, assim como a computação [poder de processamento bruto] e a energia”, diz Jonathan Siddharth, CEO da Turing, sediada em Palo Alto, Califórnia. “Acho que faz sentido para uma empresa gastar entre 10% e 20% de seus gastos com computação em dados”, diz.
Todos querem uma fatia do bolo: em maio, Jeff Bezos liderou um investimento de US$ 72 milhões (R$ 382,3 bilhões) na empresa holandesa de rotulagem de dados Toloka. A gigante de compartilhamento de viagens Uber começou a rotular seus próprios dados em 2024. Players tradicionais como a Appen, sediada na Austrália, que atende cada vez mais fabricantes de modelos chineses, também estão reformulando sua marca para se concentrar em IA generativa. Durante todo esse tempo, silenciosamente nos bastidores, Chen vem construindo sua empresa e sua reputação. “Acho que [a Surge] simplesmente não quer revelar nada sobre o que faz”, diz um pesquisador atual do Meta.
Mas, à medida que o setor evolui, Chen não se contenta mais em ficar nos bastidores. Ele tem sérias preocupações de que os modelos de IA atuais sejam otimizados para as coisas erradas, levando os usuários a uma “toca de coelho delirante”, semelhante a como os algoritmos do YouTube e do Twitter eram amplamente otimizados para caça-cliques quando ele trabalhava nesses lugares. Ele quer que a Surge ajude a “orientar o setor de IA”, o que significa se posicionar mais como um líder de pensamento. Já era hora, diz o pesquisador do Meta. “A Surge é muito boa e as pessoas sabem disso. Eu estava perguntando [a Chen]: ‘por que você acha que não é tão famoso?’”
Origens
Chen cresceu em Crystal River, na Flórida, uma cidade da Costa do Golfo mais conhecida pelos peixes-boi e aposentados do que pelos bilionários da tecnologia. Seus pais, que imigraram de Taiwan para os EUA, administravam o Peking Garden, um restaurante chinês-tailandês-americano, onde Chen trabalhou quando era adolescente.
Seu verdadeiro apetite era por línguas e matemática, em relação uma com a outra. Em suas palavras: “sempre me interessei pelos fundamentos matemáticos da linguagem”. Quando criança, ele queria aprender “umas 20 línguas” e adorava concursos de soletração. Hoje, ele ainda fala um pouco de francês, além de um pouco de espanhol e mandarim (hindi e alemão ficaram para trás). A matemática era fácil para ele, mas não conquistou sua imaginação até que começou a notar padrões distintos em números, “especialmente no número três”, encontrados em tudo, de pétalas de flores a montanhas.
Chen, que cursou cálculo na oitava série, conta que conseguiu bolsa integral nos últimos dois anos do ensino médio no internato de elite Choate, em Connecticut, cujos ex-alunos incluem John F. Kennedy, John Dos Passos e Ivanka Trump. Depois de esgotar o currículo de matemática do Choate, ele passou a maior parte do último ano pesquisando o que lhe agradava com professores de Yale que também lecionavam no Choate. Depois veio o MIT, onde se formou em matemática, foi cofundador de uma sociedade de linguística e operou um esquema de sono polifásico, o que significa dividir o sono em vários intervalos curtos de descanso — por exemplo, um cochilo de 30 minutos a cada seis horas, em vez de uma soneca de oito horas.
Após três anos no MIT, Chen estagiou no antigo fundo de hedge de Peter Thiel em São Francisco e gostou tanto que nunca mais voltou a estudar. Após concluir os cursos obrigatórios, candidatou-se a um diploma e o recebeu dois anos depois. Na sequência, vieram suas passagens pelo Twitter, Google e Facebook, onde trabalhou em vários cargos que envolviam moderação de conteúdo e algoritmos de recomendação. Em cada função, Chen se deparava com o mesmo problema: era difícil obter dados humanos de alta qualidade em grande escala. Ele deixou seu último emprego no Twitter em 2020 para resolver esse enigma sozinho e incorporou a Surge naquele ano. “Tenho construído as primeiras versões deste sistema nos últimos dez anos”, diz ele.
Tudo o que Chen faz é consciente. Vegano, ele dá 20 mil passos por dia, ele diz que consegue pensar melhor caminhando por Nova York. Uma ou duas vezes por semana, ele vai até a Times Square à meia-noite. “Adoro ver essa minirrepresentação da humanidade — atores da Broadway, turistas do mundo todo, trabalhadores noturnos, artistas — cercada por luzes, tecnologia e infraestrutura.” Ele é um superfã de Eminem, mas aqui cita uma letra de “Empire State of Mind”, de Jay-Z e Alicia Keys: “estas ruas farão você se sentir novo em folha, grandes luzes irão inspirá-lo.”
“Por que alguém iria querer abrir o capital? Um grande problema com empresas de capital aberto é que elas sempre precisam se preocupar com o curto prazo.”
Ele estava farto de anotações de dados que eram “completamente lixo” de pessoas que não eram pagas o suficiente para se importar ou não tinham o conhecimento cultural ou político necessário para fazer um julgamento informado. Um exemplo: um anotador não familiarizado com as eleições dos EUA poderia classificar um comentário de mídia social de “vamos lá, Brandon!” como “positivo”. A Surge procurou contratar pessoas que entendessem o contexto e tivessem um profundo conhecimento da linguagem.
Em 2021, Chen recebeu um e-mail interessante do irmão de um engenheiro de software que ele tentou contratar. O irmão, Scott Heiner, quase não tinha experiência em tecnologia; ele foi baterista e gerente de turnê de artistas indie-pop como Alec Benjamin por mais de uma década. Anexado ao e-mail, porém, havia um famoso ensaio de David Foster Wallace discutindo quem tem o direito de definir o inglês “correto”. Chen ficou intrigado e contratou Heiner em outubro daquele ano como o funcionário número cinco da Surge, apesar de ele nunca ter trabalhado em tecnologia antes. Heiner diz sobre Chen: ele é um “pensador completamente não tradicional”.
Em uma entrevista, Chen tem a mesma probabilidade de pedir a um candidato que discuta o trabalho de Wallace ou sua linguística, ou de pedir que ele programe ou resolva problemas em um quadro branco. Aproximadamente 20% dos funcionários da Surge têm formação não tradicional. “Valorizamos a criatividade”, diz Chen.
Ele também traz sua própria abordagem para outras áreas do negócio. Abandonando as vendas e o marketing tradicionais, ele inicialmente se comunicou por meio de seu popular blog de ciência de dados, que iniciou em seu tempo livre há mais de uma década. Foi lá que a Surge conquistou seus primeiros clientes, diz ele, embora não especifique quais. Entre os primeiros estavam Airbnb, Twitch e seu antigo empregador, Twitter. Ele tenta se dirigir diretamente aos cientistas de dados de empresas de tecnologia, presumindo que eles reconhecerão a qualidade dos dados da Surge e estarão mais dispostos a pagar por eles. Segundo pesquisadores consultados pela Forbes, a Surge cobra de 50% a dez vezes mais que os concorrentes.
Um especialista do Google ligou para Chen em uma noite de sábado em maio de 2023, por recomendação de colegas de trabalho. Na época, a família Gemini de modelos de IA do Google estava “em péssimas condições”. A ligação durou mais de duas horas. Logo depois, o Google assinou um contrato com a Surge que chegou a mais de US$ 100 milhões por ano. “Você sente que está pagando por qualidade em um caso, em vez de pagar por horas trabalhadas”, diz o pesquisador, que desde então deixou o Google e pediu para não ser identificado.
Startups de IA podem ser discretas, mas mesmo comparadas a suas concorrentes, a Surge se destaca. Seus maiores clientes não sabem exatamente o que torna seus dados melhores. Por outro lado, a Surge e seus concorrentes têm pouca ideia de quais dados acabam treinando modelos como Gemini, Claude ou o GPT da OpenAI. A empresa não divulga como associa participantes a projetos, coleta seus dados ou como eles são anotados. Tudo o que seus clientes recebem em troca de seus milhões é um link para um conjunto de dados.
Quanto ao sigilo, Chen afirma que não é intencional, mas que a Surge tem estado “ocupada demais para discutir nosso trabalho externamente”. Além disso, a Surge opera sob acordos de confidencialidade com seus clientes. E contrata anotadores por meio de uma afiliada integral chamada DataAnnotation Tech. Nem seus anúncios de emprego e nem o site usado pelos anotadores mencionam a Surge — o que significa que os trabalhadores podem não saber que a Surge é a empresa por trás dela. O trabalho paga pelo menos US$ 20,00 (R$ 106,40) por hora e mais de US$ 40,00 (R$ 212,80) para tarefas mais especializadas, o que não parece muito para os melhores talentos. “Se você é um bom funcionário, é muito inteligente e tem muito conhecimento”, diz Chen, “queremos ser uma plataforma onde você possa trabalhar em tempo integral”.
Em raras ocasiões, a Surge chega a contratar anotadores, como fez com Juliet Stanton, ex-professora de linguística da Universidade de Nova York, doutora pelo MIT. Stanton começou a trabalhar com a Surge em abril de 2024 “para ganhar um dinheiro extra” e agora é funcionária em tempo integral. A empresa busca pessoas “capazes de pensamento analítico e criativo”, diz ela, acrescentando que Chen quer anotadores para ajudar a IA a capturar diferentes contextos culturais e sociais em vários idiomas. Por exemplo, o idioma que você usaria para falar com um amigo é diferente daquele que você usaria para falar com seu chefe. Alguns idiomas até têm palavras diferentes para contextos românticos e não românticos — tudo o que os anotadores de dados humanos podem ajudar a ensinar à IA.
Mas um exército de trabalhadores horistas, muitos dos quais anotam dados como seu trabalho principal, mas não recebem benefícios, também é um convite para ação legal. Surge e Scale enfrentam ações coletivas na Califórnia, alegando que classificaram incorretamente trabalhadores em tempo integral como contratados independentes para não pagar por benefícios como férias e assistência médica. “A decisão deliberada da Surge AI de explorar seus trabalhadores para obter lucro é parte de uma tendência mais ampla que continuaremos a ver à medida que as gigantes da tecnologia correm para dominar o espaço da IA, a menos que as responsabilizemos”, disse Glenn Danas, sócio do escritório de advocacia Clarkson, com sede em Los Angeles, em uma declaração à Forbes.
“Em sua essência, o que a Surge AI está fazendo é roubo de salários em grande escala.” Chen responde: “acreditamos que o processo não tem mérito.” Ele e o porta-voz da Scale, Joe Osborne, dizem que estão comprometidos em defender suas empresas vigorosamente; ambos os casos estão em andamento.
A questão existencial para empresas como a Surge: com o avanço da IA, chegará um momento em que não haverá mais necessidade de anotações humanas em dados? Modelos como o Llama 4 da Meta, lançado em abril, já dependiam fortemente da IA criando e rotulando seus próprios dados, os chamados “dados sintéticos”, segundo um pesquisador da Meta. A Surge usa uma variação “human-in-the-loop” dessa abordagem, na qual a IA gera seus próprios dados e os rotula, mas os humanos criticam seu desempenho.
Chen acredita firmemente que os humanos são vitais. Quando as pessoas e a IA trabalham juntas, diz ele, elas superam qualquer coisa que poderiam ter feito separadamente. Mas mesmo que os humanos permaneçam tangencialmente envolvidos, uma ênfase maior no treinamento das máquinas afetaria seus resultados financeiros, já que o treinamento ficaria muito mais barato.
Outro problema para a Surge: o tsunami de dinheiro de capital de risco se espalhando sobre os rivais. Cheios de dinheiro, eles não precisam se preocupar muito com a lucratividade (pelo menos no curto prazo), pressionando para baixo as margens em todo o setor. Dois clientes importantes da Surge já seguiram em frente. Um porta-voz da OpenAI confirmou que a empresa não trabalha mais com a Surge (as concorrentes Mercor e Invisible declararam que a OpenAI é cliente).
A Cohere, o laboratório de IA que foi um dos primeiros clientes da Surge, basicamente transferiu toda a sua anotação de dados para dentro da empresa. Em última análise, os criadores de modelos de IA não têm muita — ou nenhuma — fidelidade. A maioria dos clientes da Surge também contrata seus concorrentes. A Meta, por exemplo, ainda usa a Surge mesmo depois de gastar bilhões para comprar metade da Scale.
“Não é um mercado em que o vencedor leva tudo”, afirma Ashu Garg, investidor da Turing e sócio da Foundation Capital. Se as empresas de IA e serviços de dados conseguirem acessar os orçamentos de TI das maiores empresas do mundo e conquistar a fatia de mercado dos players tradicionais de serviços de TI, afirma ele, o mercado poderá movimentar um trilhão de dólares.
Independentemente da evolução da indústria, Chen planeja manter o Surge até que a inteligência artificial geral surja, supondo que ela realmente aconteça. Sam Altman, por exemplo, tem certeza de que a IA é iminente. A estimativa de Chen é mais conservadora. Ele acredita que ela chegará em um prazo de 20 anos.
Pensando no futuro, Chen diz que “não tem interesse algum em ser adquirido” e não tem intenção de abrir o capital. “Por que alguém iria querer abrir o capital? Um grande problema com empresas de capital aberto é que elas sempre precisam se preocupar com o curto prazo.” O chefe de produto Nick Heiner tem outra teoria: “Se a Surge não existisse, o que Edwin faria para se divertir? Ele provavelmente criaria dados e treinaria IA. Acontece que é algo lucrativo. Mas é como assistir Michael Jordan enterrar. É exatamente para isso que esse cara foi criado.”