Trabalhando com gêmeos digitais e o futuro do entretenimento em vídeo

A conversational AI human created with DeepBrain AI

A velocidade com que a IA parece estar avançando é inacreditável. Antes do final do ano passado, a maioria de nós pensava que a IA ainda não seria útil individualmente por alguns anos. Então o ChatGPT atingiu, apoiado pela tecnologia GPT-3, seguido rapidamente pelo GPT-4 e, de repente, estamos cercados por inteligência artificial que pode melhorar nossa produtividade.

Um dos mais interessantes é o modelo AI de síntese de vídeo por IA DeepBrainque pode criar um gêmeo digital funcional de um humano que pode cada vez mais assumir tarefas que o humano que ele espelha normalmente teria que fazer.

Vamos conversar sobre o surgimento do útil gêmeo digital humano esta semana. Encerraremos com o meu Produto da Semana, o Motorola ThinkPhone da Lenovo, um smartphone que aborda um dos maiores erros da indústria de computadores em sua resposta ao iPhone da Apple.

Modelos de AI de síntese de vídeo

Inicialmente focado no talento de âncora de notícias, o DeepBrain AI é o primeiro gêmeo digital humano que eu vi que pode executar tarefas indistinguíveis de como o humano as teria feito.

O gêmeo digital é criado permitindo que ele aprenda com uma série de vídeos de notícias para criar um banco de dados de conhecimento sobre o comportamento, peculiaridades, fala e movimentos do apresentador humano.

O gêmeo digital resultante pode ser alimentado com um script e, a partir desse script, ele funcionará como o apresentador de notícias. O gêmeo digital não substitui o talento humano e, geralmente, o talento é compensado toda vez que o serviço de notícias usa esse avatar, principalmente para notícias de última hora ou provocações de formato curto para a próxima programação ao vivo.


Às vezes, os serviços de notícias notam que o público está assistindo a um avatar gerado por IA. Onde essa tecnologia já está em uso, ela foi aceita pelo público de notícias e pelo talento.

A razão pela qual o talento jornalístico está bem com isso é que eles são compensados ​​quando o avatar é usado, e usar o avatar significa que o talento não precisa dirigir até um estúdio para gravar ou gravar segmentos curtos ao vivo, atualizações ou anúncios que geralmente exigem que eles retornem a um estúdio.

Portanto, o avatar não prejudica sua renda e complementa o trabalho humano reduzindo sua carga e o agravamento relacionado, o que deve melhorar a satisfação no trabalho.

Casos de uso de avatar

Embora a maioria dos casos de uso iniciais dessa tecnologia sejam programas de notícias em vídeo em que o avatar e o jornalista são indistinguíveis (exemplo na Ásia), outros usos incluem:

  • Quiosques virtuais em bancos onde parece que você está falando com um humano, mas está conversando com uma IA
  • Vídeos de treinamento unidirecionais trabalhando a partir de um roteiro escrito
  • Um concierge virtual em um hotel que pode ajudar com coisas como reservas em restaurantes ou ingressos para shows
  • Vídeos interativos onde, novamente, parece que você está conversando com uma pessoa ao vivo

Alguns desses avatares nunca foram pessoas reais; eram imagens altamente realistas geradas por computador.

As vantagens de custo são significativas, pois normalmente custa cerca de US$ 4.000 para criar parte desse conteúdo curto com uma pessoa viva, mas custa apenas cerca de US$ 100 para fazer a mesma coisa com um avatar gerado por computador.

O avatar não requer ensaio e funcionará a partir do roteiro escrito sem distrações como doenças ou qualquer um dos conflitos ou problemas comportamentais normalmente associados ao talento ao vivo.

Dado que o avatar funciona a partir de texto, ele pode ser controlado por outra IA como ChatGPT ou Watson da IBM, que criou um nível de conteúdo interativo semelhante ao humano que pode enganar muitas pessoas fazendo-as pensar que estão falando com uma pessoa viva.

Outro uso que tem sido explorado é a defesa de celebridades:

As celebridades não escalam bem porque, se você as usar como defensoras, a capacidade de as pessoas conversarem com elas é quase inexistente. No entanto, um avatar de uma celebridade pode interagir com fãs em escala, além dos clientes atuais ou futuros do cliente.

Conforme observado, essa tecnologia pode digitalizar pessoas reais e personagens criados artisticamente, o que poderia resolver alguns dos problemas que empresas como McDonald’s (Ronald McDonald), Kentucky Fried Chicken e Jack in the Box tiveram ao usar pessoas vivas, onde todos trocavam regularmente atores para que o ator não ficasse tão ligado ao personagem que não pudesse ser substituído.

Com um avatar criado digitalmente, a empresa é dona do ator virtual, e os problemas de origem humana desaparecem assim que você remove os humanos da mistura.

Gêmeos Digitais Humanos e Virtuais – O que está por vir

O foco atual do DeepBrain é aprimorar, e não substituir, as pessoas em sua maior parte. No entanto, o uso de avatares totalmente sintetizados que não têm conexão com nenhum ser humano é mais uma substituição do que um modelo de aprimoramento. Enquanto eles estão focados inicialmente em conteúdo de formato curto, nada impede que a tecnologia avance para produções de formato longo, como programas de TV e filmes.

A natureza hiper-realista dos avatares melhorará com treinamento adicional e conforme a tecnologia avança, mesmo em formato longo. Os atores virtuais se tornarão indistinguíveis das pessoas reais, embora sejam amálgamas dessas pessoas, assim como produtos como Dalle-E constroem arte a partir de amálgamas de imagens.

Dadas as enormes vantagens de custo do uso de conteúdo criado virtualmente em relação à ação ao vivo, o potencial de uma tecnologia como essa para interromper a indústria de mídia é significativo. Olhando para o futuro, não é apenas o custo do talento que está sendo evitado. O custo total do estúdio onde o talento atuaria também poderia ser eliminado.


Como o GPT-4 já está fazendo um trabalho interessante com scripts e histórias, você pode colocar isso no roteiro para ter filmes fotorrealistas completos e programas de TV criados inteiramente por AIs dinamicamente com base nas preferências do usuário.

No final, em vez de assistir ao mesmo programa de TV e filme que todos os outros, essa tecnologia, combinada com IA generativa, pode criar vídeos personalizados em escala e potencialmente colocar você e sua família como atores principais (com sua permissão, é claro ).

Concedido, você poderia compartilhar esses vídeos nas mídias sociais com os interessados ​​em ver o que os outros criam, potencialmente criando grandes quantidades de conteúdo exclusivo que os serviços precisariam analisar e apresentar a um mundo de clientes em potencial.

Empacotando

Ser capaz de criar seu gêmeo para fazer parte do seu trabalho, que é onde o DeepBrain AI está focado atualmente, é uma mudança de jogo. Mas quando podemos pegar imagens sintetizadas e fazer a mesma coisa, especialmente para conteúdo de formato longo, isso irá interromper massivamente todas as formas de entretenimento. A indústria da pornografia, por exemplo, já está toda envolvida nisso. O conteúdo do Reddit faz isso há algum tempo, e a maioria dos usuários não parece se importar.

Tudo, desde personagens não-jogadores (NPCs) do jogo que se apresentam como pessoas reais, até a capacidade de construir equipes esportivas virtuais inteiras com representações precisas de jogadores reais, imaginários ou até mesmo mortos, todos estão potencialmente na mesa, todos o que sugere um nível de perturbação que estamos apenas começando a ver.

Em suma, já é difícil dizer o que é real e o que não é, e essa dificuldade só vai aumentar. Quando se trata de entretenimento, isso pode ser uma coisa boa, mas quando se trata de nossa capacidade de ver a verdade, pode ter um impacto muito mais problemático. Não estamos nem perto de estar prontos para isso.

Produto tecnológico da semana

Lenovo ThinkPhone da Motorola

Um dos maiores erros que a indústria de computadores cometeu foi girar totalmente para o iPhone. A ironia é que a indústria inicialmente não acreditava em um smartphone focado no consumidor. Então, em vez de lutar contra essa tendência por seus méritos, ela tentou se basear no iPhone para transformar a Apple de seguidora tardia em líder de mercado aparentemente da noite para o dia.

Esta não foi a primeira vez que aconteceu. Algumas décadas antes, a IBM tentou migrar para a computação cliente/servidor e quase abandonou o mainframe, levando-o de líder de mercado a quase fora do mercado em um curto período de anos.

Hoje, existe um mercado mal atendido em relação aos smartphones voltados para negócios. Certa vez, conversei com o então CEO do Bank of America, que não queria que seu pessoal usasse telefones de consumo. Ele queria algo seguro e focado nos negócios, como o BlackBerry já foi, mas estava frustrado por ninguém ter construído tal dispositivo.

Bem, a Lenovo corrigiu isso com seu icônico ThinkPhone.

Lenovo ThinkPhone da Motorola

O Lenovo ThinkPhone da Motorola (Crédito da imagem: Lenovo)


Construído a partir da marca fortemente focada nos negócios do ThinkPad que se originou com a IBM, o ThinkPhone tem dimensões semelhantes a um iPhone, mas é embalado com vários recursos exclusivos focados nos negócios.

Esses recursos incluem:

  • Conexão instantânea: O telefone e o PC descobrem perfeitamente quando estão próximos e se conectam por Wi-Fi.
  • Área de transferência unificada: Transfira facilmente texto copiado ou fotos recentes, documentos digitalizados e vídeos entre dispositivos colando-os em qualquer aplicativo no dispositivo de destino.
  • Notificações unificadas: As notificações do telefone aparecem instantaneamente no Windows Action Center. Clicar em uma notificação inicia automaticamente o aplicativo de telefone correspondente na tela do PC.
  • Drop de arquivo: Arraste e solte facilmente arquivos entre o ThinkPhone e o PC.
  • Transmissão de aplicativos: Abra qualquer aplicativo Android diretamente em um PC.
  • Webcam avançada: Aproveite as poderosas câmeras ThinkPhone e os recursos de IA, usando-o perfeitamente como sua webcam para todas as suas chamadas de vídeo. Por que comprar uma webcam separada quando você já tem uma câmera melhor em seu smartphone?
  • Ponto de acesso instantâneo: Conecte-se à Internet com um clique diretamente do PC para aproveitar a conectividade 5G do ThinkPhone. Isso é enorme e reduz potencialmente a necessidade e o custo da capacidade de WAN em seu PC.

Como o ThinkPad, o ThinkPhone é envolto em segurança e testado de acordo com o Padrão Militar 810H (MIL-STD-810H) devido ao uso de fibra de aramida (usada em coletes à prova de balas), alumínio de qualidade aeronáutica e Victus — a solução mais robusta por Gorilla Glass.

O ThinkPhone é à prova d’água até uma profundidade de 1,5 metros por até 30 minutos. Ele ainda tem um botão vermelho para iniciar um aplicativo crítico. Normalmente, escolho a câmera, pois é o que mais preciso para acessar rapidamente. Outros podem usá-lo para reimplementar push-to-talk para polícia, segurança e outros usos onde a comunicação instantânea é crítica (isso é suportado no Microsoft Walkie Talkie do Teams aplicativo).


Projetado para abranger o gerenciamento remoto, o ThinkPhone pode ser configurado e gerenciado centralmente para garantir a segurança do dispositivo e que não seja usado de forma inadequada, um requisito típico para um dispositivo de computação voltado para negócios. O ThinkPhone tem um processador exclusivo chamado Moto Secure que isola PINs, senhas e chaves criptográficas, mantendo-os em um ambiente inviolável para que pessoas mal-intencionadas não possam acessá-los.

O ThinkPhone vem com um carregador universal exclusivo e muito pequeno de 68 W que carregará o telefone em minutos e também é forte o suficiente para alimentar a maioria dos laptops voltados para negócios ou outros dispositivos USB-C – embora não máquinas de jogos ou estações de trabalho.

Finalmente, o telefone possui uma câmera de 50 MP de alta qualidade que deve cobrir a maioria das necessidades de fotos, seja para capturar um evento pessoal ou para um investigador de seguros ou outra pessoa que precise criar um registro de alta qualidade.

O ThinkPhone preenche o vazio nos telefones comerciais que existiam desde que o BlackBerry e o Palm saíram do mercado e é o meu produto da semana.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *