ReALM – índice
O que é ReALM?
ReALM significa “Resolução de Referência Como Modelagem de Linguagem”, uma solução inovadora desenvolvida por pesquisadores da Apple. Assim, é um novo modelo de linguagem (Modelo de Linguagem Grande, LLM) que trata o problema do reconhecimento de referência como uma tarefa no campo da modelagem de linguagem.
ReALM converte efetivamente vários tipos de contexto em uma representação textual, que depois processa como parte de uma tarefa de linguagem. Isso pode incluir:
- conversas – como mensagens de texto, comandos de voz para um assistente ou e-mails,
- elementos na tela – por exemplo, fotos, calendário, widget de clima ou aplicativos e processos em execução em segundo plano.
O que torna o ReALM diferente de outros modelos de reconhecimento de referência? Primeiro, a abordagem – em vez de depender do processamento de imagens, o ReALM opera no domínio do texto. Isso o torna muito mais leve e eficiente, o que deve permitir que ele funcione diretamente em dispositivos móveis, mantendo a privacidade do usuário.
De que forma o ReALM é melhor que o GPT-4?
A equipe de pesquisa da Apple comparou o ReALM aos modelos de linguagem mais poderosos do mercado hoje – GPT-3.5 e GPT-4 da OpenAI. Os resultados foram impressionantes. Em tarefas de reconhecimento de referência, a menor variante do ReALM alcançou uma precisão comparável à do GPT-4! Os modelos maiores do ReALM até superaram o GPT-4 no reconhecimento de referências a itens exibidos na tela (http://arxiv.org/abs/2403.20329).
O que explica essa vantagem? Primeiro, o ReALM é excelente com consultas específicas de domínio, como aquelas relacionadas a eletrodomésticos inteligentes. Isso ocorre porque o ReALM demonstra uma compreensão mais profunda do contexto ao ajustar o modelo para dados específicos de domínio.
Além disso, ao contrário do GPT-4, que treina principalmente com imagens de objetos reais, o ReALM se destaca em reconhecer elementos textuais e componentes de interfaces de usuário de aplicativos. E é a compreensão da interface que é crítica para a interação suave dos assistentes de voz com os aplicativos que usamos hoje.

Fonte: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
É este o começo da era de assistentes verdadeiramente inteligentes?
De fato, a integração do ReALM com a Siri poderia abrir um novo capítulo na interação humano-computador. Com o ReALM, a Siri será capaz de entender comandos que incluem referências a itens exibidos na tela do smartphone, bem como processos e aplicativos em execução em segundo plano. Mas quando essa opção estará disponível para os usuários? Isso ainda é desconhecido.
Ficamos com especulações baseadas nas capacidades técnicas do modelo. Então, como poderia funcionar uma Siri alimentada pelo ReALM? Por exemplo, se você estiver navegando em um site de listagens de empresas e ver uma empresa que lhe interessa, você poderia simplesmente dizer à Siri: “Ligue para esta empresa”, e o assistente – usando o ReALM para analisar o contexto – encontrará o número de telefone da empresa que você especificou e iniciará a chamada. Você nem precisa explicar exatamente qual empresa você quer dizer.
Isso é apenas o começo das possibilidades do ReALM. Comandos como “Reproduza a última playlist” permitiriam um controle intuitivo de aplicativos multimídia e dispositivos de casa inteligente. O ReALM também poderia permitir que a Siri entendesse o contexto das conversas e o histórico de comandos, para que o assistente respondesse adequadamente aos pedidos anteriores do usuário. Este é um passo em direção a agentes inteligentes, aproximando-nos não tanto de uma inteligência artificial que compreende nossos pedidos, mas de uma que sabe como executar comandos.
E isso é apenas o começo do que o ReALM pode fazer. Comandos como “toque a última playlist” permitiriam um controle intuitivo de aplicativos de mídia e dispositivos de casa inteligente. O ReALM também poderia permitir que a Siri entendesse o contexto das conversas e o histórico de comandos, para que o assistente respondesse de forma apropriada aos pedidos anteriores do usuário. Este é um passo em direção a agentes inteligentes, movendo-nos mais perto de não uma inteligência artificial que entende nossos pedidos, mas uma que sabe como executar comandos.
Infelizmente, os usuários de dispositivos Android terão que esperar. Atualmente, não há informações sobre os planos do Google para adicionar as capacidades do Gemini ao Google Assistant. Um aplicativo Google Gemini para dispositivos Android foi desenvolvido (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), mas ainda não está disponível fora dos Estados Unidos.

Fonte: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Resumo
ReALM é a abordagem inovadora da Apple para resolver o problema do reconhecimento de contexto por assistentes de voz. Em vez de depender do processamento de imagens, este modelo de linguagem converte diferentes tipos de contexto em uma representação textual, que depois processa em uma tarefa de linguagem. Essa abordagem garante não apenas alta precisão de reconhecimento, mas também a capacidade de operar em um dispositivo móvel enquanto mantém a privacidade do usuário.
Dar à Siri acesso ao ReALM pode proporcionar interações de voz mais naturais e contextuais, um passo importante em direção a assistentes verdadeiramente inteligentes. Com o ReALM, a Siri será capaz de responder instantaneamente a comandos relacionados a itens na tela, aplicativos e processos em segundo plano. Uma coisa é certa – melhorar a consciência contextual dos assistentes é a chave para criar interações de voz verdadeiramente inteligentes e naturais, e o ReALM é, sem dúvida, um passo importante nessa direção.

Se você gosta do nosso conteúdo, junte-se à nossa comunidade de abelhas ocupadas no Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
Especialista em JavaScript e instrutor que orienta departamentos de TI. Seu principal objetivo é aumentar a produtividade da equipe, ensinando os outros a cooperar efetivamente enquanto codificam.
AI in business:
- 6 plugins incríveis do ChatGTP que tornarão sua vida mais fácil
- Navegando novas oportunidades de negócios com o ChatGPT-4
- 3 escritores de IA incríveis que você deve experimentar hoje
- Atores sintéticos. Top 3 geradores de vídeo com IA
- Quais são as fraquezas da minha ideia de negócio? Uma sessão de brainstorming com o ChatGPT
- Usando o ChatGPT nos negócios
- Novos serviços e produtos operando com IA
- Postagens automatizadas em redes sociais
- Agendando postagens em redes sociais. Como a IA pode ajudar?
- O papel da IA na tomada de decisões empresariais
- Negócios de PNL hoje e amanhã
- Chatbots de texto assistidos por IA
- Aplicações de IA nos negócios - visão geral
- Ameaças e oportunidades da IA nos negócios (parte 2)
- Ameaças e oportunidades da IA nos negócios (parte 1)
- Qual é o futuro da IA segundo o McKinsey Global Institute?
- Inteligência artificial nos negócios - Introdução
- O que é PNL, ou processamento de linguagem natural nos negócios
- Google Translate vs DeepL. 5 aplicações de tradução automática para negócios
- Processamento automático de documentos
- A operação e as aplicações comerciais dos voicebots
- Tecnologia de assistente virtual, ou como conversar com a IA?
- O que é Inteligência de Negócios?
- Como a inteligência artificial pode ajudar com BPM?
- IA criativa de hoje e de amanhã
- Inteligência artificial na gestão de conteúdo
- Explorando o poder da IA na criação musical
- 3 ferramentas úteis de design gráfico com IA. IA generativa nos negócios
- IA e redes sociais – o que elas dizem sobre nós?
- A inteligência artificial substituirá os analistas de negócios?
- Ferramentas de IA para o gerente
- O mercado de trabalho futuro e as profissões que estão por vir
- RPA e APIs em uma empresa digital
- Novas interações. Como a IA está mudando a maneira como operamos dispositivos?
- IA multimodal e suas aplicações nos negócios
- Inteligência artificial e o meio ambiente. 3 soluções de IA para ajudá-lo a construir um negócio sustentável.
- Detectores de conteúdo de IA. Vale a pena?
- ChatGPT vs Bard vs Bing. Qual chatbot de IA está liderando a corrida?
- O chatbot de IA é um concorrente do Google?
- Prompts Eficazes do ChatGPT para RH e Recrutamento
- Engenharia de prompts. O que faz um engenheiro de prompts?
- IA e o que mais? Principais tendências tecnológicas para negócios em 2024
- IA e ética nos negócios. Por que você deve investir em soluções éticas
- Meta AI. O que você deve saber sobre os recursos suportados por IA do Facebook e Instagram?
- Regulação da IA. O que você precisa saber como empreendedor?
- 5 novos usos da IA nos negócios
- Produtos e projetos de IA - como eles são diferentes dos outros?
- IA como um especialista na sua equipe
- Equipe de IA vs. divisão de papéis
- Como escolher uma área de carreira em IA?
- IA em RH: Como a automação de recrutamento afeta o RH e o desenvolvimento da equipe
- Automação de processos assistida por IA. Por onde começar?
- 6 ferramentas de IA mais interessantes em 2023
- Qual é a análise de maturidade em IA da empresa?
- IA para personalização B2B
- Casos de uso do ChatGPT. 18 exemplos de como melhorar seu negócio com o ChatGPT em 2024
- Gerador de mockups de IA. Top 4 ferramentas
- Microaprendizagem. Uma maneira rápida de adquirir novas habilidades.
- As implementações de IA mais interessantes em empresas em 2024
- Quais desafios o projeto de IA traz?
- As 8 principais ferramentas de IA para negócios em 2024
- IA em CRM. O que a IA muda nas ferramentas de CRM?
- A Lei de IA da UE. Como a Europa regula o uso da inteligência artificial
- Top 7 construtores de sites de IA
- Ferramentas sem código e inovações em IA
- Quanto o uso de IA aumenta a produtividade da sua equipe?
- Como usar o ChatGTP para pesquisa de mercado?
- Como ampliar o alcance da sua campanha de marketing de IA?
- IA em transporte e logística
- Quais pontos de dor nos negócios a IA pode resolver?
- Como você combina uma solução de IA a um problema de negócios?
- Inteligência artificial na mídia
- IA em bancos e finanças. Stripe, Monzo e Grab
- IA na indústria de viagens
- Como a IA está promovendo o surgimento de novas tecnologias
- IA no comércio eletrônico. Visão geral dos líderes globais
- As 4 principais ferramentas de criação de imagens com IA
- As 5 principais ferramentas de IA para análise de dados
- A revolução da IA nas redes sociais
- Vale sempre a pena adicionar inteligência artificial ao processo de desenvolvimento de produtos?
- 6 maiores erros de negócios causados pela IA
- Estratégia de IA na sua empresa - como construí-la?
- Melhores cursos de IA – 6 recomendações incríveis
- Otimizando a escuta nas redes sociais com ferramentas de IA
- IoT + IA, ou como reduzir os custos de energia em uma empresa
- IA na logística. 5 melhores ferramentas
- GPT Store – uma visão geral dos GPTs mais interessantes para negócios
- LLM, GPT, RAG... O que significam as siglas de IA?
- Robôs de IA – o futuro ou o presente dos negócios?
- Qual é o custo de implementar IA em uma empresa?
- O que fazem os especialistas em inteligência artificial?
- Como a IA pode ajudar na carreira de um freelancer?
- Automatizando o trabalho e aumentando a produtividade. Um guia de IA para freelancers
- IA para startups – melhores ferramentas
- Construindo um site com IA
- Onze Labs e o que mais? As startups de IA mais promissoras
- OpenAI, Midjourney, Anthropic, Hugging Face. Quem é quem no mundo da IA?
- Dados sintéticos e sua importância para o desenvolvimento do seu negócio
- Principais motores de busca de IA. Onde procurar ferramentas de IA?
- Vídeo IA. Os mais recentes geradores de vídeo com IA
- IA para gerentes. Como a IA pode facilitar o seu trabalho
- O que há de novo no Google Gemini? Tudo o que você precisa saber
- IA na Polônia. Empresas, reuniões e conferências
- Calendário de IA. Como otimizar seu tempo em uma empresa?
- IA e o futuro do trabalho. Como preparar sua empresa para a mudança?
- Clonagem de voz por IA para negócios. Como criar mensagens de voz personalizadas com IA?
- "Todos nós somos desenvolvedores". Como os desenvolvedores cidadãos podem ajudar sua empresa?
- Verificação de fatos e alucinações de IA
- IA na recrutamento – desenvolvendo materiais de recrutamento passo a passo
- Sora. Como os vídeos realistas da OpenAI mudarão os negócios?
- Midjourney v6. Inovações na geração de imagens por IA
- IA em PMEs. Como as PMEs podem competir com os gigantes usando IA?
- Como a IA está mudando o marketing de influenciadores?
- A IA é realmente uma ameaça para os desenvolvedores? Devin e Microsoft AutoDev
- Melhores chatbots de IA para ecommerce. Plataformas
- Chatbots de IA para e-commerce. Estudos de caso
- Como se manter atualizado sobre o que está acontecendo no mundo da IA?
- Domando a IA. Como dar os primeiros passos para aplicar a IA em seu negócio?
- Perplexidade, Bing Copilot ou You.com? Comparando motores de busca de IA
- Especialistas em IA na Polônia
- ReALM. Um modelo de linguagem inovador da Apple?
- Google Genie — um modelo de IA generativa que cria mundos totalmente interativos a partir de imagens
- Automação ou aumento? Duas abordagens da IA em uma empresa
- LLMOps, ou como gerenciar efetivamente modelos de linguagem em uma organização
- Geração de vídeo por IA. Novos horizontes na produção de conteúdo em vídeo para empresas.
- Melhores ferramentas de transcrição de IA. Como transformar gravações longas em resumos concisos?
- Análise de sentimentos com IA. Como isso ajuda a impulsionar mudanças nos negócios?
- O papel da IA na moderação de conteúdo