A inteligência artificial pode me recomendar o melhor algoritmo para o meu negócio?

Se temos IA que nos recomenda livros e séries, onde está o sistema para nos ajudar em uma escolha tão importante para as empresas?

Gosto de ler e sempre procuro livros e autores novos que se adaptem aos meus estilos preferidos, mas com a publicação de um livro a cada 5 minutos é impossível seguir o ritmo do número de novidades. A inteligência artificial pode nos ajudar neste aspecto: posso ir à minha livraria online favorita para me recomendar aquilo que se aproxime dos meus gostos. Isto se faz através de um algoritmo que procura entre os milhões de livros disponíveis para me mostrar uma lista curta de livros recomendados para leitores como eu.

Mas também quero que a inteligência artificial me recomende uma lista curta de algoritmos para que eu possa experimentá-los com os meus dados.

Assim quando precisar de inteligência artificial para automatizar meu negócio, por que não posso obter recomendações para saber qual algoritmo de aprendizado automático (machine learning) se ajusta mais às minhas necessidades individuais? Cada negócio é único e há centenas de algoritmos disponíveis, cada um com seus pontos fortes e fracos. Da mesma maneira que não analiso individualmente cada livro para escolher qual quero ler, não tenho tempo, recursos nem conhecimento para experimentar com meus dados todos os algoritmos possíveis.

Aqui está a lista com as 5 coisas que um sistema de inteligência artificial deveria saber na hora de me recomendar algoritmos.

1. Quais algoritmos não funcionarão com meus dados

Alguns algoritmos se especializam em classificação (estimando probabilidades de coincidência, por exemplo, a probabilidade de que uma pessoa a quem se emprestou dinheiro não o devolva) enquanto outros se especializam em regressão (estimando uma quantidade, por exemplo, quanto falta para que seu voo chegue a seu destino). Alguns algoritmos requerem uma grande quantidade de dados enquanto outros não funcionam com grandes volumes. Alguns se especializam em dados desestruturados como o texto, mas outros só admitem dados numéricos.

Quero que a minha inteligência artificial observe as características dos meus dados e que automaticamente filtre os algoritmos que não poderão funcionar. Os descartados poderiam ser salvos para seu uso em outras ocasiões e com outros pacotes de dados diferentes.

2. Quais algoritmos requerem que meus dados estejam especialmente preparados

Alguns algoritmos lidam automaticamente com valores ausentes (por exemplo, quando falta a idade de uma pessoa) enquanto outros não o fazem. Alguns levam em conta dados categóricos (valores que vêm de uma lista fixa, como o gênero) enquanto outros não. Uns funcionam bem quando seus dados numéricos estão normalizados (reescalados para ter as mesmas médias e posições) enquanto outros algoritmos dão as mesmas respostas independentemente da normalização.

Minha inteligência artificial deveria saber quais algoritmos requerem uma preparação especial dos meus dados e que automaticamente acrescente esse pré-processamento de dados ao nosso canal de processamento.

3. Que métrica de precisão tem mais sentido para os meus dados

Quero a habilidade de comparar a precisão de cada um dos algoritmos, mas com isto não é suficiente. Os diferentes tipos de dados requerem diferentes métricas de precisão. Se estiver prevendo uma probabilidade, usarei uma métrica diferente da que quando prevejo uma quantidade. Se preciso prever um evento estranho, não quero uma métrica de precisão que meça o resultado mais provável – isso só preverá que nunca acontece nada!

Preciso que minha inteligência artificial analise as características dos meus dados, especialmente os valores que estou prevendo, e escolha a métrica de precisão mais apropriada para mim.

4. Que algoritmos têm mais probabilidades de ser precisos com os meus dados

Apesar de não sabermos com antecipação qual algoritmo será o melhor para o nosso pacote de dados e que o benchmarking nos mostra que nenhum algoritmo é perfeito, às vezes temos uma ideia aproximada sobre que algoritmos têm mais probabilidades de funcionar melhor em um pacote concreto de dados. Isto acontece porque já vimos como diferentes algoritmos funcionam com poucas ou com muitas colunas de dados e quais tendem a funcionar melhor com dados numéricos categóricos ou textuais.

Quero que minha inteligência artificial use o conhecimento do rendimento histórico de diversos grupos de algoritmos com vários pacotes de dados e que selecione os que se ajustem melhor às características individuais dos meus dados.

5. Quais algoritmos admitem requerimentos especiais

Alguns negócios especializados têm requerimentos especiais. Por exemplo, os modelos tarifários de seguradoras precisam permitir “exposição”, impondo uma escala pró-rateada das predições frente à duração da apólice de seguro. Outras vezes, queremos incluir conhecimento preexistente ou regras de negócio como reforçar um risco extra de mortalidade para fumantes. Alguns algoritmos admitem estes requerimentos especiais, mas outros não.

Minha inteligência artificial deverá saber que algoritmos admitem estes requerimentos específicos e quais não.

Colin Priest
Diretor de produto da DataRobot

ADataRobot é parceira da Nae para soluções de machine learning automatizado e inteligência artificial orientadas à empresa e especialista em automatizar o fluxo de trabalho da ciência de dados tanto para a recomendação de algoritmos como para a construção de modelos preditivos. 

Learn more:

A Nae trabalha com operadoras de telecomunicações, grandes empresas e administrações públicas para antecipar os desafios de crescimento e transformação do mercado, melhorando sua estratégia de negócio e eficiência operacional. A Nae conta com filiais na Espanha, Colômbia, México, Brasil e Costa Rica, formando uma equipe de mais de 600 profissionais.