IA e encriptação lideram a transformação da indústria de Bots. O modelo VLA inaugura uma nova era de automação.

A grande quebra na indústria dos Bots: A IA e a encriptação lideram uma nova era de automação

O rápido desenvolvimento da inteligência artificial está a remodelar as expectativas das pessoas em relação aos Bots. À medida que os grandes modelos de linguagem começam a interagir com o mundo exterior, muitas pessoas acreditam que os agentes de IA atingiram o auge. No entanto, se olharmos para as obras clássicas de ficção científica, descobrimos que o que a humanidade realmente aspira são Bots que possam interagir no mundo físico.

Especialistas da indústria acreditam que o campo dos Bots está prestes a enfrentar uma grande ruptura semelhante ao ChatGPT. Este artigo começará por analisar como a tecnologia de AI tem mudado o panorama da indústria nos últimos anos, e em seguida, explorará como os avanços tecnológicos em baterias, latência e coleta de dados moldarão o futuro, bem como o papel da encriptação nisso. Finalmente, iremos focar em áreas-chave como segurança dos Bots, financiamento, avaliação e educação.

Bots "ChatGPT Moment": Revolução automatizada impulsionada por IA e encriptação

1. Fatores-chave da transformação

(1) A quebra da inteligência artificial

O avanço dos modelos de linguagem multimodal fornece o "cérebro" necessário para os Bots executarem tarefas complexas. Os Bots percebem o ambiente principalmente através da visão e da audição.

Modelos tradicionais de visão computacional são bons na detecção e classificação de objetos, mas têm dificuldade em transformar informações visuais em instruções de ação com propósito. Embora os grandes modelos de linguagem se destaquem na compreensão e geração de texto, a sua capacidade de percepção do mundo físico é limitada.

Através do modelo de Visão-Linguagem-Ação ( VLA ), os Bots conseguem integrar percepção visual, compreensão linguística e ação física dentro de uma estrutura computacional unificada. Em fevereiro de 2025, uma empresa de IA lançou o modelo de controle de robô humanoide universal Helix, que estabeleceu um novo padrão para a indústria com a capacidade de generalização sem amostras e arquitetura de sistema duplo. A característica de generalização sem amostras permite que os Bots se adaptem a novos cenários, novos objetos e novas instruções sem a necessidade de treinamento repetido para cada tarefa. A arquitetura de sistema duplo separa o raciocínio de alto nível do raciocínio leve, alcançando um robô humanoide comercial que combina pensamento semelhante ao humano com precisão em tempo real.

(2) O robô econômico tornou-se uma realidade

A tecnologia que muda o mundo tem uma característica comum - a possibilidade de ser amplamente adotada. Os smartphones, computadores pessoais e a tecnologia de impressão 3D tornaram-se acessíveis a preços que a classe média pode suportar. Quando o preço de certos Bots estiver abaixo do preço de um carro de médio porte ou do rendimento mínimo anual nos Estados Unidos, a ideia de um mundo onde o trabalho físico e as tarefas diárias são realizadas principalmente por Bots já não parecerá inatingível.

(3) Do armazenamento para o mercado de consumo

A tecnologia de Bots está se expandindo de soluções de armazenamento para o campo do consumo. O nosso mundo é projetado para os humanos - os humanos podem realizar todo o trabalho que os Bots profissionais fazem, enquanto os Bots profissionais não conseguem realizar todo o trabalho que os humanos fazem. As empresas de Bots não estão mais limitadas à fabricação de Bots específicos para fábricas, mas estão desenvolvendo Bots humanoides mais versáteis. Portanto, a vanguarda da tecnologia de Bots não está apenas em armazéns, mas também irá penetrar na vida cotidiana.

O custo é um dos principais gargalos da escalabilidade. O indicador mais crítico é o custo total por hora, que é calculado como a soma do custo de oportunidade do tempo de treinamento e carregamento, do custo de execução da tarefa e do custo de aquisição dos Bots, dividido pelo total de horas de operação dos Bots. Este custo deve ser inferior ao nível médio de salários da indústria relevante para ser competitivo.

Para penetrar totalmente no setor de armazém, o custo total dos Bots por hora deve ser inferior a 31,39 dólares. E no maior mercado de consumo - o setor de educação privada e serviços de saúde, esse custo deve ser mantido abaixo de 35,18 dólares. Atualmente, os Bots estão se desenvolvendo em direção a soluções mais baratas, mais eficientes e mais versáteis.

Bots"ChatGPT时刻": Revolução da automação impulsionada por AI e encriptação

2. O próximo avanço em encriptação de Bots

(1) otimização da bateria

A tecnologia de baterias sempre foi um gargalo para os Bots amigáveis ao usuário. Os primeiros veículos elétricos enfrentaram dificuldades na sua popularização devido às limitações da tecnologia de baterias, que resultavam em baixa autonomia, altos custos e baixa praticidade; os Bots estão enfrentando a mesma dificuldade. Alguns Bots conhecidos têm uma autonomia de apenas 90 minutos a 2 horas. Os usuários claramente não estão dispostos a carregar manualmente a cada duas horas, portanto, a carga autônoma e a infraestrutura de conexão tornaram-se direções de desenvolvimento prioritárias. Atualmente, os Bots têm principalmente duas modalidades de carga: troca de bateria ou carga direta.

O modo de troca de bateria permite a substituição rápida do conjunto de baterias esgotadas para garantir a operação contínua, minimizando o tempo de inatividade, sendo adequado para cenários de campo ou de fábrica. Este processo pode ser realizado manualmente ou ser automatizado.

O carregamento por indução utiliza um método de fornecimento sem fios, embora o tempo total de carregamento seja longo, permite a realização de um processo totalmente automatizado.

(2) otimização de atraso

Operações de baixa latência podem ser divididas em duas categorias: percepção ambiental e controle remoto. Percepção refere-se à capacidade dos Bots de reconhecer o espaço do ambiente, enquanto controle remoto refere-se ao controle em tempo real por operadores humanos.

A pesquisa mostra que os sistemas de percepção de Bots começam com sensores baratos, mas a proteção tecnológica reside no software de fusão, computação de baixo consumo e circuitos de controle precisos em milissegundos. Quando os Bots completam a localização espacial, redes neurais leves marcam elementos como obstáculos, paletes ou humanos. Após a entrada de etiquetas de cena no sistema de planejamento, são gerados imediatamente comandos de motor enviados aos pés, grupos de rodas ou braços mecânicos. Um atraso de percepção abaixo de 50 milissegundos é equivalente à velocidade de reflexão humana - qualquer atraso além desse limite resultará em movimentos desajeitados dos Bots. Portanto, 90% das decisões precisam ser feitas localmente por uma única rede de visão-linguagem-ação.

Robôs totalmente autónomos precisam garantir que o modelo VLA de alto desempenho tenha um atraso inferior a 50 milissegundos; os robôs controlados remotamente exigem que o atraso do sinal entre a interface de operação e o robô não exceda 50 milissegundos. Aqui, a importância do modelo VLA é particularmente destacada - se a entrada visual e textual for processada por modelos diferentes antes de ser inserida em um modelo de linguagem grande, o atraso total superará amplamente o limite de 50 milissegundos.

(3) otimização da coleta de dados

A coleta de dados tem principalmente três abordagens: dados de vídeo do mundo real, dados sintéticos e dados de controle remoto. O principal gargalo entre dados reais e dados sintéticos é a ponte entre o comportamento físico dos Bots e as diferenças nos modelos de vídeo/simulação. Os dados de vídeo do mundo real carecem de detalhes físicos, como feedback de força, erro de movimento das articulações e deformação do material; os dados de simulação, por outro lado, carecem de variáveis imprevisíveis, como falhas de sensores e coeficientes de atrito.

A forma de coleta de dados com maior potencial é o controle remoto - onde um operador humano controla remotamente Bots para executar tarefas. No entanto, o custo da mão de obra é o principal fator limitante na coleta de dados por controle remoto.

O desenvolvimento de hardware personalizado também está a fornecer novas soluções para a coleta de dados de alta qualidade. Algumas empresas estão a combinar métodos convencionais com hardware personalizado para coletar dados de movimento humano em múltiplas dimensões, que, após processamento, são transformados em conjuntos de dados adequados para o treino de redes neurais de Bots, proporcionando uma enorme quantidade de dados de alta qualidade para o treino de Bots com ciclos de iteração rápidos. Esses canais tecnológicos encurtam coletivamente o caminho de conversão desde os dados brutos até Bots implantáveis.

Bots "Momento ChatGPT": A revolução automatizada impulsionada pela AI e encriptação

3. Domínios de Exploração Focada

(1) encriptação tecnologia e Bots fusão

A encriptação pode incentivar partes não confiáveis a melhorar a eficiência da rede de Bots. Com base nas áreas-chave mencionadas anteriormente, a encriptação pode melhorar a eficiência em três aspectos: integração de infraestrutura, otimização de latência e coleta de dados.

A rede de infraestrutura física descentralizada ( DePIN ) tem o potencial de revolucionar a infraestrutura de carregamento. Quando robôs humanoides operarem globalmente como automóveis, as estações de carregamento precisarão ser tão acessíveis quanto os postos de gasolina. Redes centralizadas exigem um enorme investimento inicial, enquanto o DePIN distribui os custos entre os operadores de nós, permitindo que as instalações de carregamento se expandam rapidamente para mais áreas.

DePIN também pode utilizar infraestrutura distribuída para otimizar a latência de controle remoto. Ao agregar recursos de computação de nós de borda geograficamente dispersos, os comandos de controle remoto podem ser processados por nós locais ou os mais próximos disponíveis, minimizando a distância de transmissão de dados e reduzindo significativamente a latência de comunicação. No entanto, os projetos atuais do DePIN estão principalmente focados em armazenamento descentralizado, distribuição de conteúdo e compartilhamento de largura de banda. Embora haja projetos que demonstram as vantagens da computação de borda em streaming de mídia ou Internet das Coisas, ainda não se estendeu para o campo dos Bots ou controle remoto.

O controle remoto é a forma de coleta de dados mais promissora, mas o custo para entidades centralizadas contratarem profissionais para coletar dados é extremamente alto. O DePIN resolve esse problema incentivando terceiros a fornecer dados de controle remoto através de encriptação. Alguns projetos estão construindo uma rede global de operadores remotos, convertendo suas contribuições em ativos digitais tokenizados, formando um sistema descentralizado sem permissão - os participantes podem tanto obter ganhos quanto participar da governança e ajudar no treinamento de Bots AGI.

(2) A segurança é sempre uma preocupação central

O objetivo final da tecnologia de Bots é alcançar total autonomia, mas a maior preocupação da humanidade é que a autonomia transforme os Bots em armas ofensivas. Os problemas de segurança dos grandes modelos de linguagem têm gerado preocupações, e quando esses modelos possuem capacidade de ação física, a segurança dos Bots torna-se uma condição fundamental para a aceitação social.

A segurança económica é um dos pilares da prosperidade do ecossistema de Bots. Algumas empresas neste campo estão a construir uma camada de coordenação de máquinas descentralizada, que permite a autenticação de identidade de dispositivos, verificação de presença física e acesso a recursos através de encriptação. Diferente da simples gestão de mercados de tarefas, estes sistemas permitem que os Bots provem autonomamente informações de identidade, localização geográfica e registos de comportamento, sem depender de intermediários centralizados.

A restrição de comportamento e a autenticação de identidade são executadas por mecanismos on-chain, garantindo que qualquer pessoa possa auditar a conformidade. Os Bots que atendem aos padrões de segurança, requisitos de qualidade e normas regionais serão recompensados, enquanto os infratores enfrentarão penalidades ou desqualificação, estabelecendo assim um mecanismo de responsabilidade e confiança na rede de máquinas autônomas.

A rede de rehipoteca de terceiros também pode fornecer garantias de segurança equivalentes. Embora o sistema de parâmetros de penalidade ainda precise ser aprimorado, a tecnologia relacionada já entrou na fase prática. Espera-se que as diretrizes de segurança da indústria estejam prestes a ser formadas, e na altura, os parâmetros de penalidade serão modelados com base nessas diretrizes.

4. Preencher as lacunas na pilha tecnológica dos Bots

Ao contrário da IA, o campo dos Bots é difícil de entrar quando os fundos são limitados. Para alcançar a popularização dos Bots, o limiar de desenvolvimento deve ser reduzido a um nível de conveniência semelhante ao desenvolvimento de aplicações de IA. Acreditamos que há espaço para melhorias em três níveis: mecanismos de financiamento, sistemas de avaliação e ecossistemas educacionais.

O financiamento é um ponto crítico na área dos Bots. Desenvolver programas de computador requer apenas um computador e recursos de computação em nuvem, enquanto construir um Bot funcional exige a aquisição de motores, sensores, baterias e outros hardwares, com custos que facilmente ultrapassam 100.000 dólares. Essa natureza de hardware torna o desenvolvimento de Bots menos flexível e mais caro em comparação com a IA.

A infraestrutura de avaliação de Bots em cenários reais ainda está em sua fase inicial. No campo da IA, um sistema claro de funções de perda foi estabelecido, e os testes podem ser totalmente virtualizados. No entanto, estratégias virtuais excepcionais não podem ser diretamente convertidas em soluções eficazes no mundo real. Os Bots precisam de instalações de avaliação para testar estratégias autônomas em ambientes reais diversificados, a fim de alcançar a otimização iterativa.

Quando essa infraestrutura amadurecer, talentos irão fluir em massa, e os robôs humanoides irão repetir a curva de explosão do Web2. Algumas empresas estão avançando nessa direção—seus projetos de código aberto transformam hardware original em agentes inteligentes escaláveis com consciência econômica. Módulos de visão, linguagem e planejamento de movimento podem ser plug-and-play como aplicativos de celular, e todos os passos de raciocínio são apresentados em inglês claro, permitindo que os operadores auditem ou ajustem comportamentos sem precisar tocar no firmware. Essa capacidade de raciocínio em linguagem natural permite que a nova geração de talentos entre sem costura no campo da robótica, dando um passo crucial para desencadear a revolução dos robôs em uma plataforma aberta, assim como o movimento de código aberto acelerou a IA.

A densidade de talentos determina a trajetória da indústria. Um sistema educacional inclusivo e estruturado é crucial para a formação de talentos na área de Bots. Algumas empresas já começaram a implementar cursos de educação universal baseados em Bots humanoides nas escolas públicas K-12 dos EUA. O design do curso possui neutralidade em relação à plataforma, podendo ser adaptado a diversas formas de Bots, proporcionando aos alunos oportunidades de prática. Este sinal positivo reforça a avaliação da indústria: nos próximos anos, a riqueza de recursos educacionais em Bots irá rivalizar com a do campo da IA.

5. Perspectivas Futuras

O modelo de ação-visual-linguagem ( VLA ), com seus efeitos de inovação e economias de escala, já deu origem a robôs humanos que são econômicos, eficientes e versáteis. À medida que os robôs de armazém se expandem para o mercado de consumo, a segurança, os modelos de financiamento e os sistemas de avaliação tornam-se direções de exploração chave. Especialistas da indústria acreditam firmemente que a encriptação irá através de três

AGI2.54%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 4
  • Repostar
  • Compartilhar
Comentário
0/400
WalletDetectivevip
· 12h atrás
Sinto-me confuso, o que é que se passa agora?
Ver originalResponder0
ChainSpyvip
· 14h atrás
Este ai ainda não está a trabalhar a sério, todos os dias a puxar o bull.
Ver originalResponder0
StablecoinArbitrageurvip
· 14h atrás
*sigh* outro ciclo de hype tecnológico... mostra-me as margens de lucro na arbitragem de robôs primeiro, para ser sincero
Ver originalResponder0
DaoDevelopervip
· 14h atrás
fascinante como as zk-proofs poderiam garantir interações entre robôs e humanos, para ser honesto
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)