BITS | Boletim de Inovação, Tecnologia e Segurança | 25/06/2025

BITS: o seu clipping diário, por Fábio Xavier
Inteligência Artificial
SeamGPT: Modelo Auto-Regressivo para Cortes de Superfícies em Computação Gráfica
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★★
O artigo apresenta o SeamGPT, um modelo auto-regressivo inovador para cortes de superfícies, crucial em áreas como parametrização UV e mapeamento de texturas. A abordagem transforma o corte de superfície em uma tarefa de predição sequencial, utilizando um transformer GPT para gerar segmentos de costura com coordenadas 3D quantizadas. O SeamGPT demonstra desempenho superior em benchmarks de UV unwrapping, incluindo malhas manifold e não-manifold. Além disso, a ferramenta melhora a segmentação 3D ao fornecer limites limpos para a decomposição de partes, otimizando workflows profissionais.
Tar: Unificando Compreensão e Geração Visual via Representações Alinhadas a Texto
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★★
Este artigo apresenta uma estrutura multimodal (Tar) que unifica a compreensão e geração visual através de uma representação semântica discreta compartilhada. O Text-Aligned Tokenizer (TA-Tok) converte imagens em tokens discretos usando um codebook alinhado ao texto, projetado a partir do vocabulário de um LLM. Tar integra visão e texto em um espaço unificado, permitindo entrada e saída cross-modal sem designs específicos para cada modalidade. A abordagem inclui codificação e decodificação adaptáveis à escala, além de um de-tokenizer generativo para saídas visuais de alta fidelidade, utilizando modelos autoregressivos e baseados em difusão. Tarefas de pré-treinamento avançadas aprimoram a fusão de modalidades, melhorando a compreensão e geração visual. Experimentos mostram que Tar iguala ou supera outros LLMs multimodais, com convergência mais rápida e maior eficiência de treinamento.
Stream-Omni: Modelo de IA multimodal em tempo real da Academia Chinesa de Ciências
Fonte: MarkTechPost | Índice de Inovação: ★★★★☆
Pesquisadores da Academia Chinesa de Ciências desenvolveram o Stream-Omni, um modelo de linguagem grande (LLM) multimodal que integra texto, visão e fala em tempo real. Diferente de modelos que concatenam representações de diferentes modalidades, o Stream-Omni alinha as modalidades com base em seus relacionamentos semânticos, usando concatenação na dimensão da sequência para visão-texto e mapeamento na dimensão da camada para fala-texto. Isso permite o uso de menos dados de treinamento e melhora o desempenho em tarefas de compreensão visual e interação por voz. O Stream-Omni supera modelos como VITA-1.5 em benchmarks de compreensão visual e interação por voz, demonstrando a eficácia de seu método de alinhamento. Sua arquitetura inovadora e o desempenho superior em benchmarks estabelecem um novo paradigma para LLMs multimodais. O modelo está disponível em Hugging Face.
GeNeRT: Modelagem de Canais Sem Fio Inteligente com Ray Tracing Neural
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★☆
O artigo apresenta o GeNeRT, um novo framework de rastreamento neural generalizável para modelagem de canais sem fio. O GeNeRT supera as limitações de métodos atuais ao incorporar princípios de propagação física e um design de rede neural inspirado em Fresnel. Ele permite transferência espacial intra-cenário e generalização zero-shot inter-cenário, melhorando a precisão na predição de componentes multipercurso. O framework utiliza uma estratégia de aceleração GPU-tensorizada para maior eficiência. Experimentos em cenários externos demonstram sua superioridade em generalização e precisão em relação a métodos existentes, incluindo o Wireless Insite, especialmente em configurações multitransmissor. A arquitetura da rede e a estratégia de treinamento foram validadas para capturar os princípios físicos das interações raio-superfície.
Agentes de API vs. Agentes de GUI: Divergência e Convergência em LLMs
Fonte: ArXiv (Inteligência Artificial) | Índice de Inovação: ★★★★☆
Modelos de linguagem grandes (LLMs) agora controlam agentes de software que traduzem comandos de linguagem natural em ações. Inicialmente, agentes baseados em API dominaram pela automação robusta e integração com endpoints programáticos. No entanto, avanços em LLMs multimodais permitiram agentes baseados em GUI, interagindo com interfaces gráficas de forma semelhante à humana. Apesar do objetivo comum de automação via LLM, eles divergem em complexidade arquitetural, fluxos de trabalho e modelos de interação. Este estudo compara esses agentes, analisando suas diferenças e convergências potenciais, examinando dimensões-chave e cenários para abordagens híbridas. O estudo visa guiar pesquisadores e profissionais na seleção e combinação dessas abordagens, indicando que inovações em automação baseada em LLM podem fundir agentes baseados em API e GUI, criando soluções mais flexíveis.
Segurança Cibernética
Carteira Blockchain Modular Segura e Amigável com Android & OP-TEE
Fonte: ArXiv (Criptografia e Segurança) | Índice de Inovação: ★★★★★ | Índice de Risco: ★★★★☆
Este artigo propõe uma solução para a vulnerabilidade de carteiras de criptoativos, onde chaves privadas são expostas. A solução reimagina o gerenciamento de chaves como um serviço em ARM TrustZone via OP-TEE, fraturando o Trusted Application em módulos por cadeia em um TA store multi-tenant. Um pipeline firmware-over-the-air sela cada TA a uma imagem Android, permitindo atualizações rápidas com proteção contra rollback. A arquitetura garante isolamento entre TAs, minimizando a exposição a malware e permitindo que usuários instalem ou removam blockchains facilmente. A análise de ameaças demonstra a neutralização de malware REE, injeção OTA e ataques side-channel. A solução visa reduzir a lacuna entre segurança e usabilidade, impulsionando a adoção em massa da autocustódia.
Ataque de Raciocínio Passo a Passo Revela Conhecimento 'Apagado' em LLMs
Fonte: ArXiv (Criptografia e Segurança) | Índice de Inovação: ★★★★☆ | Índice de Risco: ★★★★☆
O artigo demonstra que o raciocínio passo a passo pode ser usado como uma porta dos fundos para recuperar informações ocultas em Large Language Models (LLMs) após a aplicação de técnicas de 'unlearning'. É introduzido o ataque Sleek, que sistematicamente expõe falhas no processo de remoção de conhecimento. O ataque utiliza uma estrutura com geração de prompts adversários, um mecanismo para recuperar conteúdo apagado e categorização de prompts. As avaliações mostram que as abordagens existentes falham em garantir a remoção confiável de conhecimento, expondo riscos persistentes de vazamento de informações e a necessidade de estratégias de 'unlearning' mais robustas.
Plataforma Anônima Draugnet Permite Relatos de Ameaças Cibernéticas
Fonte: Infosecurity Magazine | Índice de Inovação: ★★★★☆ | Índice de Risco: ★☆☆☆☆
A plataforma Draugnet, criada por profissionais de segurança cibernética europeus, permite o envio anônimo de informações sobre ameaças cibernéticas. Construída sobre a MISP (Malware Information Sharing Platform), ela facilita o relato de vulnerabilidades e ameaças, mesmo por amadores ou denunciantes, sem a necessidade de registro ou login. O sistema usa um token para permitir atualizações e compartilhamento, mas a anonimidade perfeita não é garantida. Apesar dos riscos de relatos falsos, Draugnet visa democratizar o compartilhamento de inteligência cibernética, tornando-o mais acessível e menos burocrático. Sua implementação pode ser adaptada para ambientes de acesso restrito, como ISACs, melhorando a segurança e confidencialidade.
Malware sofisticado em plugin WordPress rouba dados de cartão de crédito
Fonte: Infosecurity Magazine | Índice de Inovação: ★★★★☆ | Índice de Risco: ☆☆☆☆☆
Pesquisadores de segurança cibernética descobriram uma campanha de malware altamente sofisticada que utiliza um plugin WordPress malicioso para roubar dados de cartões de crédito, credenciais e perfis de usuários. A campanha, ativa desde setembro de 2023, emprega técnicas anti-detecção inovadoras, incluindo um sistema back-end em tempo real hospedado em sites infectados. O malware evita páginas de administrador, ativando-se apenas em telas de checkout e até mesmo verifica infecções anteriores. Além do skimming, variantes adicionais foram encontradas, manipulando anúncios do Google, roubando credenciais do WordPress e distribuindo malware adicional. O plugin falso, chamado “WordPress Core”, usa hooks do WooCommerce para marcar pedidos fraudulentos como completos, dificultando a detecção. Dados roubados são exfiltrados via strings Base64 disfarçadas como URLs de imagem, ou pelo Telegram. A descoberta destaca a crescente sofisticação de ataques de malware direcionados a plataformas populares como WordPress.
IA e Humanos: Uma Parceria para Resolver Desafios da Humanidade
Fonte: IT Forum (Cibersegurança) | Índice de Inovação: ★★★★☆ | Índice de Risco: ☆☆☆☆☆
Um estudo inovador analisou a colaboração entre inteligência artificial (IA) e especialistas humanos em cinco áreas: educação, saúde, trabalho, marketing e terceiro setor. A pesquisa utilizou chatbots como ChatGPT, Gemini e Claude, comparando suas respostas com as de especialistas. Em educação, houve convergência em ensino híbrido e uso de blockchain; em saúde, a IA sugeriu diagnósticos preditivos e terapias regenerativas, enquanto humanos focaram em ética e custo-benefício. No trabalho, a IA e humanos concordaram na importância da empatia e criatividade, propondo colaboração e automação. Em marketing, a IA sugeriu campanhas dinâmicas, e humanos enfatizaram a autenticidade. Finalmente, no terceiro setor, a IA propôs soluções como mapeamento automatizado de problemas sociais. O estudo conclui que a parceria entre humanos e máquinas é crucial para resolver grandes desafios, combinando a ousadia da IA com a empatia e ética humanas.
Tecnologia e Liderança Inovadora
Artigos mais populares de líderes de pensamento Thinkers360 (1º semestre de 2025)
Fonte: Thinkers360 Blog | Índice de Inovação: ★★★☆☆
O Thinkers360 divulgou seus artigos mais populares de 2025, cobrindo negócios, tecnologia e sustentabilidade. Temas abordados incluem KPIs para execução estratégica, a importância da experiência do cliente, ameaças da IoT e estratégias de prevenção com IA, o uso da tecnologia imersiva em mercados emergentes, e a necessidade de acelerar o processamento de dados para impulsionar a IA. Outros artigos discutem liderança, gestão de mudanças, transição energética, a revolução tecnológica no Vietnã, o impacto da IA na saúde e recursos humanos, além de analisar o cenário de inovação na África do Sul e os desafios da transformação digital. A plataforma Thinkers360 conecta marcas e profissionais de diversos setores.
Clipping automatizado com análise de IA.
Fábio Correa Xavier é um apaixonado por construir futuros inspiradores por meio da tecnologia e inovação.
Mestre em Ciência da Computação pela Universidade de São Paulo, com MBA em Gestão de Negócios pelo Ibmec/RJ, e Especialização Network Engineering pela Japan International Cooperation Agency (JICA).
Atualmente é CIO do Tribunal de Contas do Estado de São Paulo, Professor e Coordenador de graduação e pós-graduação, e colunista da MIT Technology Review Brasil e da IT Forum.
Possui as certificações CIPM e CDPO/BR (IAPP – International Association of Privacy Professionals), CC((ISC)²) e EXIN Privacy e Data Protection.
É autor de vários livros sobre tecnologia, inovação, privacidade, proteção de dados e LGPD, com destaque para o Best Seller “CIO 5.0”, semifinalista do Prêmio Jabuti 2024 e destaque da Revista Exame, e também de Mapa da Liderança.
