Facebook lança ferramentas de IA para iPhone, Android e Raspberry Pi

Agam Shah, IDG News Service
19/04/2017 - 12h11
Com Caffe2, seu smartphone em breve conseguirá reconhecer objetos em imagens sem a necessidade de acessar a nuvem

Uma nova inteligência pode ser acrescentada a dispositivos móveis como iPhone e aparelhos Android e computadores de baixo consumo de energia como o Raspberry Pi com o novo framework open source de aprendizado de máquina do Facebook, o Caffe2.

O Caffe2 pode ser usado para programar recursos de inteligência artificial em smartphones e tablets, permitindo que eles reconheçam imagens, vídeo, texto e discurso e fiquem mais conscientes de seu contexto.

É importante observar que o Caffe2 não é um programa de IA, mas sim uma ferramenta que permite a IA ser programada dentro de smartphones. E leva apenas algumas linhas de código para escrever modelos de aprendizado, que podem depois ser empacotados em aplicativos.

O lançamento do Caffe2 é significante. Isso significa que usuários poderão obter reconhecimento de imagem, processamento de linguagem natural e visão computacional diretamente em seus telefones. Essa tarefa é tipicamente descarregada em servidores remotos na nuvem, com smartphones depois conectando a eles.

Dispositivos móveis estão ganhando cada vez mais capacidades de inteligência artificial. Mais aparelhos estão sendo 'embrulhados' com a Alexa da Amazon e Google Assistant, enquanto a Siri da Apple tem sido o marco em aparelhos iPhone por anos. Os novos modelos da Samsung, o Galaxy S8, estão habilitados com a também inédita assistente inteligente da companhia, a Bixby.

Outro destaque do Caffe2 é que o framework consegue trabalhar com restrições de energia em dispositivos móveis. Funciona com hardware móvel para acelerar aplicações de IA e criar redes neurais. A solução leva vantagem da energia computacional de novos hardware móveis para acelerar tarefas de deep learning. Por exemplo, em smartphones o Caffe2 irá se aproveitar do poder de computação das GPUs Adreno e DSPs Hexagon dos chips da Qualcomm.

O novo framework de aprendizado de máquina sucede o Caffe, notável pelo seu reconhecimento de imagem. O Caffe foi usado, principalmente, em data centers de machine learning, e o Caffe2 é uma completa revisão para que possa trabalhar em dispositivos móveis.

"Nós estamos comprometidos em fornecer a comunidade ferramentas de alta performance de machine learning para que qualquer pessoa consiga criar serviços e apps inteligentes", disse o Facebook no site sobre o Caffe2.

O Caffe2 também poderia ser usado para criar chatbots. O site para o framework conta com alguns modelos pré-treinados que poderiam ser usados para criar modelos de aprendizado.

Antes deste anúncio, já era possível criar modelos de aprendizado de máquina em dispositivos móveis através do TensorFlow do Google. Este pode ser incorporado em dispositivos como drones para habilitar câmeras com reconhecimento de imagem. Assim como no TensorFlow, o código no Caffe2 poderia ser facilmente incorporado em diferentes ambientes.

O novo framework também é muito mais rápido que o seu antecessor. Benchmarks da Intel, Qualcomm e Nvidia aumentam significativamente a velocidade em comparação com o primeiro Caffe e outros frameworks de aprendizado de máquina.

Mas talvez o principal apelo do Caffe2 ainda se mantém ligado aos mega data centers. Por exemplo, servidores com GPUs são usados para criar os dados necessários para reconhecimento de imagem, uma prática que envolve a classificação e categorização de pixels, que pode ajudar a identificar um objeto com precisão.

O modelo de aprendizado se torna mais preciso a medida que mais dados são entregues. Isso pode ser especialmente trabalhoso em aplicações como carros autônomos, que precisam identificar objetos para evitar colisões. 

A Nvidia garante que o Caffe2 será significativamente mais rápido em suas GPUs do que o original Caffe. Algumas GPUs da Nvidia projetadas para machine learning possuem capacidades de computação flutuante de baixo nível, e são hábeis na criação de poderosas redes neurais para chegar a premissas mais precisas.