Building peace in the minds of men and women

Grande Angular

A quarta revolução

cou_03-18_big_data_01.jpg

Reflexão#2, instalação da artista brasileira Raquel Kogan: em uma sala escura são projetados números gerados automaticamente, de modo que os corpos dos espectadores são diretamente integrados à obra.

Após a internet e a internet móvel terem dado a largada para a terceira revolução industrial, as tecnologias de Inteligência Artificial (IA), direcionadas por big data, estão desencadeando uma quarta revolução industrial.

Yang Qiang, entrevistado por  Wang Chao

Como surgiu a convergência entre IA e big data?

A convergência de IA e big data começou no início dos anos 2000. Quando o Google e o Baidu – os novos mecanismos de busca da época – passaram a utilizar sistemas de recomendação para propagandas alimentados por IA, e descobriram que os resultados eram ainda melhores que o esperado. E quanto mais dados coletavam, melhores eram os resultados. Mas, naquele momento, ninguém percebeu que isso poderia ser aplicado também em outras áreas.

O momento real de mudança aconteceu com o surgimento do ImageNet, a maior base de dados de reconhecimento de imagens do mundo, projetada para uso em pesquisa de softwares de reconhecimento visual. Criada por cientistas da computação nas universidades de Stanford e Princeton, nos Estados Unidos, ela é considerada o começo de uma revolução na aprendizagem profunda. A grande quantidade de dados de imagem na ImageNet resultou em uma queda de 10% na taxa de falso reconhecimento. Isso demonstrou que, com a ajuda de aprendizagem profunda e big data, pode-se dominar cálculos extremamente complexos. The large amount of image data on ImageNet resulted in a ten per cent drop in the rate of mis-recognition. This showed that the convergence of deep learning and big data could help master extremely complex calculations. 

 

Como o senhor define a relação entre aprendizagem profunda e big data?

Se um sistema de IA é bem projetado, o produto possuirá um uso mais conveniente, mais preciso, portanto será mais útil. Surgirão mais usuários, e consequentemente, mais dados, o que por sua vez torna o sistema de IA ainda melhor. Há uma relação mutuamente fortalecedora entre sistemas de IA e dados. Big data e IA podem se fundir para se transformar em um novo tipo de IA, que poderá ser chamada de “big data impulsionado pela IA” ou de “inteligência de dados”.

 

O senhor poderia definir o conceito de big data? Como as empresas poderiam se adaptar a este conceito e quais mudanças precisariam ser feitas?

O primeiro ponto do conceito big data é coletar dados de maneira consciente. Em outras palavras, antes de fazer qualquer negócio, você precisa pensar em como vai coletar dados.

O segundo ponto é que a coleta de dados e os algoritmos principais estejam intimamente ligados. Você precisa saber o que está faltando de acordo com os algoritmos, e então coletar dados com um propósito específico, incluindo dados de fontes diferentes.

O terceiro requisito é formular um circuito fechado. Os serviços oferecidos por um sistema de software devem ter a capacidade de estimular a fonte a gerar ainda mais dados que podem ser alimentados de volta no sistema, formando um circuito fechado. Isso permite um processo contínuo de auto melhoria e auto refinamento do sistema. Um modelo especial é necessário para o circuito fechado, o que é muito diferente do modelo anterior usado para os negócios.

 

O senhor poderia falar mais sobre o design de circuito fechado para IA e big data?

Em primeiro lugar, deve-se considerar os fornecedores de dados – por exemplo, os usuários. Todos os comportamentos de usuários devem ser gravados em forma de dados. Então, prestadores de serviço como WeChat Pay, uma mobile wallet* chinesa, e Taobao, o site de e-commerce chinês, precisam ser considerados. Retornos inteligentes são gerados com base em dados para entender a necessidade dos usuários. Os usuários oferecem dados de retorno para os prestadores de serviço, e os prestadores de serviço, por sua vez, oferecem o serviço de dados aos usuários. Isso forma o circuito fechado.

Para que o circuito fechado evolua rapidamente, ele deve ser suficientemente curto. E é melhor que não existam pessoas envolvidas nele, porque um circuito não pode ser completamente automatizado se tiver participação humana. Em segundo lugar, o processo de atualização do circuito deve acontecer com frequência – o ideal é que seja atualizado diversas vezes ao dia, para manter o sistema atualizado. Em terceiro lugar, o processo deve ser contínuo para solicitar que os usuários forneçam retornos constantes. Para resumir o processo em três palavras, ele deve ser curto, frequente e rápido.

 

Na sua opinião, quanto tempo levará para que esse circuito fechado seja alcançado de fato?

Eu acho que o desenvolvimento de IA será dividido em dois momentos. O primeiro será quando todas as indústrias tentarão utilizar a tecnologia. Por exemplo, serviços de segurança e vigilância utilizarão tecnologia de reconhecimento facial; o setor bancário utilizará IA no controle de riscos, e assim por diante. Estas são tecnologias e soluções únicas que servem a setores que já existem.

O segundo momento acontecerá com o surgimento de indústrias completamente novas, com inteligência artificial em sua base. Por exemplo, um banco que utilizar IA como o centro de sua tecnologia pode ser completamente dirigido por IA em termos de investimentos, serviços e crédito. Os bancários seriam necessários apenas para fazer pequenos ajustes. Também será possível a construção de tipos de sistemas de atendimento ao consumidor completamente novos.

Eu acredito que a segunda fase consistirá na forma futura que a IA realmente dará à sociedade. Assim como na época em que surgiu a internet, no início, uma livraria tradicional criou uma página na internet e se considerou uma livraria virtual, o que não era o caso. Depois, sites como a Amazon foram estabelecidos e eram completamente diferentes das livrarias tradicionais.

 

A combinação entre big data e IA também poderia ameaçar o fluxo de informação e a igualdade social. Como se pode assegurar que o fluxo normal de dados em larga escala ocorra sem violação da privacidade pessoal?

Produtos criados por meio do uso de big data e tecnologias de IA trarão novos modelos de negócios. O sistema de IA coleta dados dos usuários, constrói um bom modelo a partir disso, e então projeta deduções a partir de diversas outras fontes. Ele observa o usuário novamente e então coleta e analisa os dados para servir o usuário. Não é apenas um modelo que ajuda, é também um excelente modelo de negócios. No entanto, a condição preexistente para este modelo ser implementado em larga escala é assegurar a privacidade dos usuários. Aqui estão três preocupações: 

‣ Primeiro, devemos de um conjunto de normas sociais e jurídicas para proteger a propriedade dos dados e para esclarecer onde eles podem e não podem ser usados. Na minha opinião, os dados dos usuários deveriam ser classificados por categorias diferentes, por exemplo, categoria vermelha para dados totalmente protegidos, amarela para dados com acesso restrito, e verde para acesso livre. Por enquanto não há consenso sobre a classificação dos dados. Além disso, não há nenhuma lei que defina o perfil da pessoa responsável nem as sanções em caso de descumprimento dessas normas jurídicas.

‣ Segundo, devemos proteger tecnicamente a confidencialidade dos dados. Por exemplo, o 4Paradigm (um provedor de serviços e tecnologia IA de Beijing) estuda atualmente o uso de migration learning (aprendizagem de migração de dados) para proteger a privacidade, o que é um campo relativamente novo. O aprendizado migratório pode ajudar empresas diferentes a trocar dados. Por exemplo, a empresa “A” cria um modelo que pode ser transferido para a empresa “B”, em vez de transferir os dados diretamente entre “A” e “B”, esses dados são incluídos no modelo intermediário, que tem a função de melhor proteger a privacidade do usuário.

‣ Terceiro, devemos pesquisar mais sobre a relação entre a privacidade dos usuários e o preço dos dados. Por exemplo, quando um usuário clica em um anúncio publicitário online oferecido por um sistema de recomendação controlado por IA, o sistema deveria receber uma parte dos lucros? Se um mecanismo de busca gera renda, essa renda deveria ser distribuída entre os usuários? Essas são algumas questões que valem a pena serem exploradas.

Durante os próximos anos, todos compreenderão a importância da IA. Devemos nos atentar mais quanto à forma pela qual ela será adotada e em quais áreas será aplicada. Atualmente, as áreas mais adequadas para a aplicação de IA são finanças, internet e veículos automatizadosI.

 

De uma perspectiva mundial, quais serão os impactos da combinação entre big data e inteligência artificial nos países em desenvolvimento? 

Eu acredito que as tecnologias de IA e big data permitirão que alguns países emergentes alcancem o mesmo nível dos países desenvolvidos, ou até mesmo os superem. Porque no futuro, a competição econômica não será apenas com relação à escala financeira ou econômica, mas acima de tudo, sobre a quantidade de dados e a rapidez da aceitação de uma economia de dados (data economy). Por exemplo, o rápido desenvolvimento da internet e da internet móvel na China permitiu a coleta de um grande volume de dados. Isso também irá acelerar o desenvolvimento da indústria de IA na China, o que poderá mudar o padrão mundial.

Por outro lado, se um país já possui uma boa infraestrutura e educação de alta qualidade, ele poderá se beneficiar da IA para alcançar uma produção mais eficiente. Assim como o uso de máquinas a vapor se desenvolveu mais rapidamente em alguns países durante a Revolução Industrial.

* Mobile wallet (carteira móvel em tradução livre) é um aplicativo para dispositivos móveis que possibilita o pagamento sem a utilização de um cartão físico, além da utilização dos meios de pagamentos de forma prática e segura, facilitando o dia-a-dia dos consumidores.

Foto: Raquel Kogan

Wang Chao

Jornalista e líder de equipe no AI Studio da NetEase News, que oferece cobertura dos maiores eventos na indústria de IA.

Yang Qiang

Especialista internacional em IA e em mineração de dados (data mining), Yang Qiang (China) é o primeiro chinês presidente da Conferência Internacional Conjunta sobre Inteligência Artificial (IJCAI), membro da Associação para o Avanço da Inteligência Artificial (AAAI), chefe do Departamento de Ciência da Computação e Engenharia na Univerisade de Ciência e Tecnologia de Hong Kong, e cofundador e cientista-chefe do 4Paradigm.