Categories: BlogIA nos negócios

Sora. Como os vídeos realistas da OpenAI mudarão os negócios? | IA nos negócios #94

Há alguns dias, o Google mais uma vez chamou a atenção dos entusiastas de IA ao anunciar o Gemini 1.5 apenas uma semana após o lançamento do poderoso modelo Gemini 1.0 Ultra e renomear o chatbot Bard para Gemini.

No entanto, a OpenAI não deixou o Google desfrutar de uma posição forte no campo da IA por sequer um dia. Os criadores do ChatGPT revelaram uma solução ainda mais empolgante: Sora, um gerador de vídeo capaz de criar vídeos de quase um minuto com base em prompts textuais. O Sora da OpenAI está prestes a se tornar uma ferramenta revolucionária com o potencial de transformar a indústria de criação de conteúdo em vídeo. No entanto, o que torna o Sora excepcional não são apenas suas capacidades técnicas, mas também sua ampla gama de aplicações potenciais — desde marketing e educação até a indústria do entretenimento e comunicação cotidiana. Vamos examinar como o Sora pretende trazer essas mudanças e quais perspectivas ele abre para os negócios.

Sora da OpenAI – uma nova era na criação de conteúdo em vídeo

Fizemos um longo caminho desde os dias das primeiras tentativas desajeitadas de criar vídeos usando computadores. Já é evidente que os vídeos criados por inteligência artificial generativa, mesmo aqueles com apenas seis meses, parecem bastante desajeitados em comparação com as gerações do Sora. Embora o Sora, que pode criar cenas de vídeo realistas com base em instruções textuais, ainda esteja em fase experimental e não esteja disponível ao público, suas capacidades são impressionantes.

O Sora oferece uma ampla gama de aplicações que podem mudar a forma como criamos e consumimos conteúdo em vídeo. Aqui estão alguns exemplos:

  • gerar cenas complexas com múltiplos personagens ou objetos,
  • animar imagens já existentes,
  • editar vídeos criados,
  • combinar diferentes gráficos ou vídeos em um só.

Esses exemplos mostram um progresso tremendo no campo da IA. No entanto, acima de tudo, abrem portas para novas possibilidades na criação de conteúdo em vídeo. Basta olhar para a apresentação de um vídeo em alta resolução que retrata a beleza de uma flor em flor:

Fonte: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 ou https://youtu.be/UNmqxZoTgsk)

Como o Sora será utilizado?

O Sora é apenas um brinquedo e outra ferramenta para criar conteúdo em vídeo? Não. Pelo menos de acordo com a OpenAI. Como os criadores do Sora escrevem:

Ensinamos a inteligência artificial a entender e simular o mundo físico em movimento, e o objetivo é treinar modelos que ajudem as pessoas a resolver problemas que exigem interação com o mundo real.

Para gerar vídeos com precisão, o modelo deve compreender o mundo em um nível muito mais profundo do que o necessário para a criação de texto. Isso implica entender a física, as relações espaciais entre objetos no mesmo plano e a interação entre primeiro plano e fundo.

O Sora será capaz de gerar:

  • vídeo a partir de texto – a primeira e mais importante inovação do modelo,
  • vídeo a partir de imagens – permitindo a animação de gerações existentes criadas no DALL·E 3,
  • vídeo a partir de imagem e texto – permitindo uma criação de filme mais precisa,
  • vídeo a partir de vídeo – adicionando efeitos especiais, estendendo o filme, combinando duas gravações existentes ou mudando o estilo do vídeo,
  • imagens a partir de texto – presumivelmente eventualmente substituindo o DALL·E e oferecendo gerações com uma resolução de 2048×2048.

No futuro, o Sora pode ser usado para criar vídeos promocionais, conteúdo para redes sociais ou apresentações de negócios. É uma ferramenta que pode mudar completamente a forma como criamos e compartilhamos conteúdo em vídeo:

Fonte: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 ou https://youtu.be/3l8wjxjNubE)

Embora este colossal passo no desenvolvimento da inteligência artificial generativa seja empolgante, também levanta preocupações em relação aos riscos associados a deep fakes, especialmente em relação às eleições presidenciais dos EUA. As ameaças associadas ao uso do Sora incluem principalmente:

  • Desinformação. Deepfakes, incluindo vídeos fotorealistas gerados pelo Sora, podem espalhar notícias falsas que podem influenciar a opinião pública e minar a democracia. Ao criar vídeos falsos que parecem reais, os espectadores podem ser manipulados e enganados.
  • Violação de privacidade. Tornar o Sora disponível permitiria que qualquer pessoa com um computador e acesso à internet criasse conteúdo falso, incluindo vídeos que violam a privacidade e usam dados pessoais sem permissão. Provavelmente por essa razão, levará algum tempo até que o Sora esteja disponível ao público em geral. A OpenAI precisa garantir salvaguardas apropriadas.
  • Dano à reputação. Ao usar o Sora, hackers podem se passar por outras pessoas, organizações ou marcas para difamá-las. Ao criar a impressão de que alguém está dizendo ou fazendo coisas que nunca fez, tais vídeos podem prejudicar significativamente a reputação e a credibilidade. Combinar a tecnologia deepfake com clonagem de voz baseada em IA pode, infelizmente, levar à criação de muitos fakes altamente convincentes. À medida que nos aproximamos de um ponto em que distinguir um fake de uma gravação genuína se torna extremamente difícil, vigilância, conscientização e pensamento crítico se tornam cada vez mais cruciais para combater os potenciais danos causados por deepfakes.

Portanto, embora as capacidades do Sora sejam impressionantes, devemos ser cautelosos quanto ao seu impacto na sociedade, criar regulamentações e tomar medidas adicionais para minimizar suas consequências negativas.

Como usar o Sora?

Embora o Sora esteja atualmente na fase de testes e não esteja disponível para um público mais amplo, usá-lo parece ser um processo simples e intuitivo. Os usuários provavelmente poderão usá-lo como agora usam o DALL-E 3 no ChatGPT Plus. Ou seja, digitar comandos de texto, que o Sora converterá em clipes de vídeo curtos. Isso oferece novas oportunidades para criadores de conteúdo, profissionais de marketing e educadores, permitindo que eles façam vídeos envolventes e de alta qualidade rapidamente.

Como o Sora se compara a outros geradores de vídeo de IA?

Mas como o Sora se compara a outros geradores de vídeo? Por enquanto, só podemos especular sobre como o Sora se sairá, mas com base na descrição da ferramenta disponível no site da OpenAI, podemos fazer algumas observações gerais:

  • Runway – O Sora funcionará de maneira semelhante, mas com um realismo muito maior. O Runway permite criar conteúdo em vídeo e imagem usando IA, incluindo opções de texto para vídeo e imagem para imagem. Também oferece melhorias de edição, como remoção de fundo e substituição de elementos com base em comandos de texto.
  • Synthesia – a plataforma opera de maneira diferente do Sora, pois oferece a criação de vídeos realistas com avatares digitais, suportando mais de 120 idiomas e permitindo a criação de avatares personalizados. Ainda não sabemos como o Sora lidará com tarefas como combinar áudio ou gerar fala com o material visual que cria.
  • HeyGen – sua singularidade reside na clonagem de voz e na capacidade de criar um avatar com gestos personalizados, portanto, sua funcionalidade difere significativamente da oferta do Sora.
  • Stable Video Diffusion – provavelmente o concorrente direto mais sério do Sora, capaz de transformar imagens estáticas em animações de vídeo, principalmente para criadores de conteúdo em redes sociais. Sua natureza experimental e o fato de ser baseado em modelos de acesso aberto levantam grandes esperanças no contexto da produção de filmes e animação.

O Sora se diferencia de outras ferramentas de geração de vídeo, pois cria vídeos altamente realistas que se assemelham muito a gravações reais. A resolução é particularmente importante aqui. O Sora pode fazer vídeos com resoluções de até 1920x1080px.

Com sua profunda compreensão da linguagem, o modelo interpreta comandos com precisão. Aqui, a OpenAI usou o método comprovado no DALL-E 3. O modelo primeiro interpreta um prompt simples inserido pelo usuário e, em seguida, gera conteúdo visual com base em sua versão elaborada e detalhada. Isso permite criar cenas complexas e gerar personagens que expressam emoções autênticas:

Fonte: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 ou https://youtu.be/pxkfUDoQg5I)

Como o Sora pode afetar a indústria criativa?

O potencial do Sora para transformar a indústria criativa é enorme. O acesso a essa ferramenta para cineastas e designers traz uma nova qualidade à criação de conteúdo em vídeo. O Sora serve como a base para modelos capazes de simular o mundo real, o que poderia ser um avanço na conquista da AGI (Inteligência Geral Artificial). Pelo menos é isso que seus criadores, a OpenAI, afirmam.

Uma vez que o Sora cria imagens em movimento realistas semelhantes às filmadas pela mão humana, ele tem o potencial de mudar significativamente o campo da criação de vídeos, desde materiais de treinamento até produções de Hollywood. O Sora, sem dúvida, impactará:

  • Marketing. O Sora tem o potencial de revolucionar campanhas publicitárias, gerando rapidamente conteúdo em vídeo atraente com base em mensagens de marketing ou descrições de produtos.
  • Indústria do entretenimento. Estúdios de cinema e criadores de conteúdo podem se beneficiar da capacidade do Sora de criar cenas e personagens realistas, agilizando os processos de produção.
  • Jogos. Desenvolvedores de jogos podem usar o Sora para criar filmes ou trailers dentro dos jogos, aprimorando a experiência dos jogadores.
  • Treinamento. A facilidade de criar materiais educacionais de alta qualidade, incluindo vídeos instrutivos “como fazer”, pode aumentar muito a atratividade de treinamentos e cursos.

Fonte: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Como as empresas podem se beneficiar de vídeos realistas gerados por IA?

Usar IA na produção de vídeo oferece às empresas uma série de benefícios, como economia de tempo e custos, qualidade consistente dos resultados e aumento do valor do produto final. A OpenAI está tomando medidas para garantir a segurança do Sora, incluindo a colaboração com equipes de testes anti-adversariais e o desenvolvimento de um classificador para detectar vídeos gerados por IA.

O Sora da OpenAI abre novas possibilidades para criar e consumir conteúdo em vídeo. Desde a revolução da indústria criativa até o impacto no marketing e na educação, até a influência na comunicação cotidiana – o potencial é imenso. Como uma ferramenta que pode mudar completamente as regras do jogo, o Sora merece atenção especial. Aguardamos mais informações da OpenAI, especialmente sobre quando o Sora estará disponível para o público em geral. Isso marca o início de uma nova era na criação de conteúdo em vídeo. O próximo passo é sua integração com som, voz e modelos 3D, o que abrirá portas para o metaverso.

Se você gosta do nosso conteúdo, junte-se à nossa comunidade de abelhas ocupadas no Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Especialista em JavaScript e instrutor que orienta departamentos de TI. Seu principal objetivo é aumentar a produtividade da equipe, ensinando os outros a cooperar efetivamente enquanto codificam.

View all posts →

Robert Whitney

Especialista em JavaScript e instrutor que orienta departamentos de TI. Seu principal objetivo é aumentar a produtividade da equipe, ensinando os outros a cooperar efetivamente enquanto codificam.

Share
Published by
Robert Whitney

Recent Posts

O papel da IA na moderação de conteúdo | IA nos negócios #129

As empresas enfrentam o desafio de gerenciar uma vasta quantidade de conteúdo publicado online, desde…

22 hours ago

Análise de sentimento com IA. Como isso ajuda a impulsionar mudanças nos negócios? | IA nos negócios #128

Na era da transformação digital, as empresas têm acesso a uma quantidade sem precedentes de…

23 hours ago

Melhores ferramentas de transcrição de IA. Como transformar gravações longas em resumos concisos? | IA nos negócios #127

Você sabia que pode obter a essência de uma gravação de várias horas de uma…

1 day ago

Geração de vídeo com IA. Novos horizontes na produção de conteúdo em vídeo para empresas | IA nos negócios #126

Imagine um mundo onde sua empresa pode criar vídeos envolventes e personalizados para qualquer ocasião…

1 day ago

LLMOps, ou como gerenciar efetivamente modelos de linguagem em uma organização | IA nos negócios #125

Para aproveitar totalmente o potencial dos Modelos de Linguagem de Grande Escala (LLMs), as empresas…

1 day ago

Automação ou aumento? Duas abordagens da IA em uma empresa | IA nos negócios #124

Em 2018, a Unilever já havia embarcado em uma jornada consciente para equilibrar as capacidades…

1 day ago