'Fizeram de forma totalmente diferente da maioria das empresas de tecnologia'

O chatbot de inteligência artificial chinês Deepsek-R1 Foi lançado discretamente em 20 de janeiro de 2025.

Dois dias depois, o equipe atrás da plataforma publicado a Relatório Técnico 22 páginas em que ele avaliou seu desempenho e o colocou no mesmo nível que os rivais americanos Chatgptde Openai, e Claudede antropal.

O mundo de tecnologia Ele reagiu inicialmente com o ceticismo: quem garantiu que o que foi escrito lá era verdadeiro e que não era mera propaganda do governo chinês?

Este momento foi breve. Enquanto os especialistas estavam testando o modelo e entendendo como ele havia sido construído, eles perceberam que ele realmente rivalizava Grandes técnicos Americano – e embaralhou a disputa entre EUA e China pela superpotência da tecnologia.

Uma semana depois, o Vale do Silício entrou em pânico. As ações das 7 principais empresas de tecnologia dos EUA desidrataram e o magnífico 7 (Apple, Microsoft, Alphabet (Google), Amazon, Nvidia, Tesla e Meta) perderam US $ 1 trilhão em valor de mercado em 27 de janeiro.

Depois, surgiram as perguntas de que os US $ 5,5 milhões que a empresa afirma ter investido para treinar o modelo foram subestimados, que o número de chips usados no projeto foi maior do que os dois mil liberados pela empresa.

Na quinta -feira (29/1), o OpenAI alegou que o DeepSeek usou dados do ChatGPT para treinar seu chatbot sem mais detalhes sobre o caso.

Também reverberou a auto -cenção da plataforma, que é desconcertante e oferece respostas como “Desculpe, isso está além do meu escopo atual. Vamos falar sobre outra coisa” quando perguntado sobre tópicos controversos do ponto de vista da ideologia do Partido Comunista Chinês – ” Qual foi o massacre da praça celestial? “, Por exemplo.

Mas, além Alta tensão na arena dos negócios e geopolíticaA inovação em si trazida pela plataforma impressionou a comunidade científica, enfatiza o pesquisador brasileiro Cleber Zanchettin.

Apesar de ter sido comparado ao ChatGPT do ponto de vista da experiência do usuário, por trás das cortinas Deepseek é bastante distinto do concorrente americano.

“A maneira como eles fizeram isso era totalmente diferente da maioria das empresas de tecnologia”, diz o professor do Centro de Informática da Universidade Federal de Pernambuco (CIN-UFPE), criado na década de 1980 e hoje um dos líderes em pesquisa de inteligência artificial em América latina.

Em uma entrevista à BBC News Brasil, o especialista mergulhou em quatro recursos que explicam por que o DeepSeek impressionou.

Sede da NVIDIA em Santa Clara, Califórnia: os fabricantes de chips foi uma das ações de serra despencadas nos últimos dias

1. Código aberto

A primeira coisa que chamou a atenção foi o código aberto. “Eles disseram às coisas que não haviam sido divulgadas por outros fabricantes”, diz o professor.

Até então, eles predominavam entre modelos de idiomas em grande escala (LLM na sigla em inglês “.Grandes modelos de linguagem“) Código de código fechado, como ChatGPT e Claude, no qual todo o equipamento por trás da interface é mantido confidencial e os de pesos abertos, onde alguns dos parâmetros são divulgados, caso da llama, o objetivo.

Deepseek, de acordo com Zanchettin, foi além.

“Eles publicaram de alguma forma a receita de como você treina o modelo, que é um negócio protegido para sete chaves, mesmo por aqueles que publicam os modelos em pesos abertos.

Antes da chegada do chatbot, os pesquisadores não tinham uma noção muito clara da cadeia de raciocínio para alcançar modelos de inteligência artificial mais avançados.

Interface Deepseek com o botão — Botão *DeepThink* Mostre a linha modelo do modelo

2. Raciocínio explícito

Nesse sentido, também aponta como diferencial o mecanismo que detalha o passo a passo do raciocínio em cada uma das respostas Deepsek dá quando o botão “DeepThink“Está ativo.

“A maioria das empresas não queria que entendessem certo [como o modelo raciocina]Porque isso pode levá -lo a perceber que ele está fazendo as coisas certas ou que não entendeu nada e que o resultado é mais ou menos aleatório “, argumenta ele.

Em um teste realizado pelo relatório com uma edição de matemática da segunda fase do exame de admissão do Instituto de Tecnologia da Força Aérea (ITA) de 2024, o Deepseek testou uma série de caminhos até chegar ao que ele considerou a resposta correta.

Foi e voltou na linha de pensamento, com expressões como “calma”, “espera”, “mas como?”, “Espere, talvez exista um caminho melhor”, “Deixe -me tentar essa abordagem”, “outra ideia : “,” Isso parece demais, vamos verificar novamente “,” vamos para essa direção “.

Ver esse processo, de acordo com Zanchettin, é útil para os especialistas entenderem melhor a robustez e interpretarem as habilidades do modelo.

“Esta é uma informação muito relevante do ponto de vista de como o modelo toma decisões”.

Imagem mostra tela móvel com o logotipo do App Deepseek e Chatgpt — Para especialistas, a experiência do usuário na Deepseek aborda a versão mais recente do ChatGPT

3. Aprendizagem de reforço

Outra surpresa foi o método usado para desenvolver e treinar a plataforma.

Os modelos fechados até então exigiram muita intervenção humana, uma estratégia conhecida no jargão da inteligência artificial como “humano no laço“(Hitl), amplamente usado nas etapas de ajuste finas (“Afinação“).

Deepseek tem uma dependência “muito menor” da supervisão humana, com uma abordagem centrada no aprendizado de reforço: o sistema é treinado em um modelo de recompensa (onde recebe um retorno positivo, por exemplo, cada vez que dá a resposta correta para um problema matemático) e é sofisticado por si só, aprendendo a “razão” cada vez mais eficiente e, como resultado, melhorar a qualidade das respostas que retorna.

No relatório técnico divulgado em 22 de janeiro, a equipe compartilhou que percebendo que a abordagem focada na auto-evolução foi bem-sucedida equivalente a um “Aha Moment“, Algo como um” momento da Euroca “.

“Isso tornou o processo não apenas mais interessante, mas também mais barato computacionalmente”, diz Zanchettin.

O que pode significar, acrescenta, que estamos enfrentando uma mudança de paradigma importante. Sem a necessidade de investimentos bilionários, mais atores têm a chance de competir na busca de inovação em inteligência artificial, incluindo brasileiros.

O pesquisador, que era professor visitante na Northwestern University, pondera que, mesmo nos Estados Unidos, grupos de pesquisa e startups sem grandes recursos dificilmente podem competir com o Grandes técnicosque são baseados em “força bruta” quando se trata de sistemas de inteligência artificial: “Quanto mais recursos você tiver, mais hardware puder obter, mais dados você pode usar para treinar o modelo e melhor o modelo”.

Os custos mais baixos de Deepseek “colocaram muitas pessoas muito talentosas de volta ao quadro de jogos, com a possibilidade de inovar no mesmo nível”, acredita ele.

“Acho que abrirá portas não apenas para ir à academia, mas para a indústria e a população como um todo, que serão inundadas com muita inovação e um custo menor”.

Deepseek Home em um telefone celular, com bandeiras da China e dos Estados Unidos em segundo plano — Deepseek se aqueceu entre nós e a China para a supremacia tecnológica

4.

A aprendizagem de reforço é uma de uma série de inovações que a Deepseek apresentou.

“Existem vários avanços tecnológicos, do ponto de vista da engenharia, que eles conseguiram fazê -lo funcionar juntos e que ainda não tínhamos alcançado. Esse também foi um ótimo diferencial”, diz o professor.

O feito chama ainda mais atenção, porque foi alcançado sem os melhores chips disponíveis no mercado, pois em 2022 os Estados Unidos impostos às restrições da China sobre a importação de estado -o -de -etas, precisamente para bloquear o avanço chinês nessa área , reivindicar preocupações com segurança.

“Aqui no Brasil, por causa das muitas dificuldades que enfrentamos, sempre tivemos esse mantra de que a dificuldade gera oportunidades, que a inovação vem da restrição, e acho que a China provou isso agora”, acrescenta ele.

Até a estréia de Deepseek, a crença em grande parte do oeste era que a China estava bem atrás dos Estados Unidos na área avançada da IA. Chatgpt surgiu em 2022 e desde então o Grandes técnicos Os americanos lançaram suas plataformas generativas de IA com algum sucesso, como Claude do Anthrópico e Gemini do Google.

Empresas chinesas como Baidu, Tencent e Bytedance, proprietário da Tiktok, até colocaram os modelos de IA no mercado, mas não haviam sido considerados no ChatGPT.

O Deepseek muda o jogo e aquece a corrida entre a China e os Estados Unidos pela posição altamente em vasos deste século XXI.

Dias após a estréia, outra empresa chinesa, Alibaba, lançou seu modelo de IA e disse que era ainda melhor que o compatriota.

Para o pesquisador brasileiro, essa rivalidade de chatbots é uma pequena fatia das ambições de ambos os países da área de inteligência artificial, um ângulo que pode nem mesmo interessá -los do ponto de vista estratégico.

A IA, ele lembra, possui aplicações militares e em áreas tão diversas quanto robótica, veículos autônomos, comunicação e sistemas de saúde.

como fazer emprestimo consignado auxilio brasil

whatsapp apk blue

simular site

consignado auxilio

empréstimo rapidos

consignado simulador

b blue

simulador credito consignado

simulado brb

picpay agência 0001 endereço

1. Código aberto

2. Raciocínio explícito

3. Aprendizagem de reforço

4.

SOBRE NÓS

Categorias

Escolhas do Editor

‘Fizeram de forma totalmente diferente da maioria das empresas de tecnologia’

1. Código aberto

2. Raciocínio explícito

3. Aprendizagem de reforço

4.

Antidepressivos são eficazes no tratamento de transtorno de ansiedade generalizada

há infelicidade no marcante longa A verdadeira dor

You may also like

SOBRE NÓS

Categorias

Escolhas do Editor