Há alguns dias, o Google mais uma vez chamou a atenção dos entusiastas de IA ao anunciar o Gemini 1.5 apenas uma semana após o lançamento do poderoso modelo Gemini 1.0 Ultra e renomear o chatbot Bard para Gemini.
No entanto, a OpenAI não deixou o Google desfrutar de uma posição forte no campo da IA por sequer um dia. Os criadores do ChatGPT revelaram uma solução ainda mais empolgante: Sora, um gerador de vídeo capaz de criar vídeos de quase um minuto com base em prompts textuais. O Sora da OpenAI está prestes a se tornar uma ferramenta revolucionária com o potencial de transformar a indústria de criação de conteúdo em vídeo. No entanto, o que torna o Sora excepcional não são apenas suas capacidades técnicas, mas também sua ampla gama de aplicações potenciais — desde marketing e educação até a indústria do entretenimento e comunicação cotidiana. Vamos examinar como o Sora pretende trazer essas mudanças e quais perspectivas ele abre para os negócios.
Fizemos um longo caminho desde os dias das primeiras tentativas desajeitadas de criar vídeos usando computadores. Já é evidente que os vídeos criados por inteligência artificial generativa, mesmo aqueles com apenas seis meses, parecem bastante desajeitados em comparação com as gerações do Sora. Embora o Sora, que pode criar cenas de vídeo realistas com base em instruções textuais, ainda esteja em fase experimental e não esteja disponível ao público, suas capacidades são impressionantes.
O Sora oferece uma ampla gama de aplicações que podem mudar a forma como criamos e consumimos conteúdo em vídeo. Aqui estão alguns exemplos:
Esses exemplos mostram um progresso tremendo no campo da IA. No entanto, acima de tudo, abrem portas para novas possibilidades na criação de conteúdo em vídeo. Basta olhar para a apresentação de um vídeo em alta resolução que retrata a beleza de uma flor em flor:
Fonte: OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 ou https://youtu.be/UNmqxZoTgsk)
O Sora é apenas um brinquedo e outra ferramenta para criar conteúdo em vídeo? Não. Pelo menos de acordo com a OpenAI. Como os criadores do Sora escrevem:
Ensinamos a inteligência artificial a entender e simular o mundo físico em movimento, e o objetivo é treinar modelos que ajudem as pessoas a resolver problemas que exigem interação com o mundo real.
Para gerar vídeos com precisão, o modelo deve compreender o mundo em um nível muito mais profundo do que o necessário para a criação de texto. Isso implica entender a física, as relações espaciais entre objetos no mesmo plano e a interação entre primeiro plano e fundo.
O Sora será capaz de gerar:
No futuro, o Sora pode ser usado para criar vídeos promocionais, conteúdo para redes sociais ou apresentações de negócios. É uma ferramenta que pode mudar completamente a forma como criamos e compartilhamos conteúdo em vídeo:
Fonte: OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 ou https://youtu.be/3l8wjxjNubE)
Embora este colossal passo no desenvolvimento da inteligência artificial generativa seja empolgante, também levanta preocupações em relação aos riscos associados a deep fakes, especialmente em relação às eleições presidenciais dos EUA. As ameaças associadas ao uso do Sora incluem principalmente:
Portanto, embora as capacidades do Sora sejam impressionantes, devemos ser cautelosos quanto ao seu impacto na sociedade, criar regulamentações e tomar medidas adicionais para minimizar suas consequências negativas.
Embora o Sora esteja atualmente na fase de testes e não esteja disponível para um público mais amplo, usá-lo parece ser um processo simples e intuitivo. Os usuários provavelmente poderão usá-lo como agora usam o DALL-E 3 no ChatGPT Plus. Ou seja, digitar comandos de texto, que o Sora converterá em clipes de vídeo curtos. Isso oferece novas oportunidades para criadores de conteúdo, profissionais de marketing e educadores, permitindo que eles façam vídeos envolventes e de alta qualidade rapidamente.
Mas como o Sora se compara a outros geradores de vídeo? Por enquanto, só podemos especular sobre como o Sora se sairá, mas com base na descrição da ferramenta disponível no site da OpenAI, podemos fazer algumas observações gerais:
O Sora se diferencia de outras ferramentas de geração de vídeo, pois cria vídeos altamente realistas que se assemelham muito a gravações reais. A resolução é particularmente importante aqui. O Sora pode fazer vídeos com resoluções de até 1920x1080px.
Com sua profunda compreensão da linguagem, o modelo interpreta comandos com precisão. Aqui, a OpenAI usou o método comprovado no DALL-E 3. O modelo primeiro interpreta um prompt simples inserido pelo usuário e, em seguida, gera conteúdo visual com base em sua versão elaborada e detalhada. Isso permite criar cenas complexas e gerar personagens que expressam emoções autênticas:
Fonte: OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 ou https://youtu.be/pxkfUDoQg5I)
O potencial do Sora para transformar a indústria criativa é enorme. O acesso a essa ferramenta para cineastas e designers traz uma nova qualidade à criação de conteúdo em vídeo. O Sora serve como a base para modelos capazes de simular o mundo real, o que poderia ser um avanço na conquista da AGI (Inteligência Geral Artificial). Pelo menos é isso que seus criadores, a OpenAI, afirmam.
Uma vez que o Sora cria imagens em movimento realistas semelhantes às filmadas pela mão humana, ele tem o potencial de mudar significativamente o campo da criação de vídeos, desde materiais de treinamento até produções de Hollywood. O Sora, sem dúvida, impactará:
Fonte: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Usar IA na produção de vídeo oferece às empresas uma série de benefícios, como economia de tempo e custos, qualidade consistente dos resultados e aumento do valor do produto final. A OpenAI está tomando medidas para garantir a segurança do Sora, incluindo a colaboração com equipes de testes anti-adversariais e o desenvolvimento de um classificador para detectar vídeos gerados por IA.
O Sora da OpenAI abre novas possibilidades para criar e consumir conteúdo em vídeo. Desde a revolução da indústria criativa até o impacto no marketing e na educação, até a influência na comunicação cotidiana – o potencial é imenso. Como uma ferramenta que pode mudar completamente as regras do jogo, o Sora merece atenção especial. Aguardamos mais informações da OpenAI, especialmente sobre quando o Sora estará disponível para o público em geral. Isso marca o início de uma nova era na criação de conteúdo em vídeo. O próximo passo é sua integração com som, voz e modelos 3D, o que abrirá portas para o metaverso.
Se você gosta do nosso conteúdo, junte-se à nossa comunidade de abelhas ocupadas no Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Especialista em JavaScript e instrutor que orienta departamentos de TI. Seu principal objetivo é aumentar a produtividade da equipe, ensinando os outros a cooperar efetivamente enquanto codificam.
As empresas enfrentam o desafio de gerenciar uma vasta quantidade de conteúdo publicado online, desde…
Na era da transformação digital, as empresas têm acesso a uma quantidade sem precedentes de…
Você sabia que pode obter a essência de uma gravação de várias horas de uma…
Imagine um mundo onde sua empresa pode criar vídeos envolventes e personalizados para qualquer ocasião…
Para aproveitar totalmente o potencial dos Modelos de Linguagem de Grande Escala (LLMs), as empresas…
Em 2018, a Unilever já havia embarcado em uma jornada consciente para equilibrar as capacidades…