¿Puede la inteligencia artificial recomendarme el mejor algoritmo para mi negocio?

Si tenemos IA que nos recomienda libros y series, ¿dónde está el sistema para ayudarnos en una elección tan importante para las empresas?

Me gusta leer y siempre voy buscando libros y autores nuevos que se ajusten a mis estilos preferidos, pero con la publicación de un libro cada 5 minutos, es imposible seguir el ritmo del número de novedades. La inteligencia artificial nos puede ayudar en este aspecto: puedo ir a mi librería online favorita para que me recomiende aquello que se aproxime a mis gustos. Esto se hace a través de un algoritmo, que busca entre los millones de libros disponibles para mostrarme una lista corta de libros recomendados para lectores como yo.

Pero también quiero que la inteligencia artificial me recomiende una lista corta de algoritmos para que yo pueda probarlos con mis datos.

Así, cuando necesite inteligencia artificial para automatizar mi negocio, ¿por qué no puedo obtener recomendaciones para saber qué algoritmo de aprendizaje automático (machine learning) se ajusta más a mis necesidades individuales? Cada negocio es único y hay centenares de algoritmos disponibles, cada uno con sus puntos fuertes y sus puntos débiles. De la misma manera que no analizo individualmente cada libro para elegir cuál quiero leer, no tengo tiempo, recursos, ni conocimiento para probar con mis datos todos los algoritmos posibles.

Aquí está la lista con las 5 de cosas que un sistema de inteligencia artificial debería saber en el momento de recomendarme algoritmos.

1. Qué algoritmos no funcionarán con mis datos

Algunos algoritmos se especializan en clasificación (estimando probabilidades de coincidencia, por ejemplo la probabilidad de que una persona a la que se le ha prestado dinero no lo devuelva), mientras que otros se especializan en regresión (estimando una cantidad, por ejemplo, cuánto falta para que tu vuelo llegue a su destino). Algunos algoritmos requieren una gran cantidad de datos, mientras que otros no funcionan con grandes volúmenes. Algunos se especializan en datos desestructurados, como el texto, pero otros solo admiten datos numéricos.

Quiero que mi inteligencia artificial observe las características de mis datos y que automáticamente filtre aquellos algoritmos que no podrán funcionar. Los descartados podrían guardarse para su uso en otras ocasiones y con otros paquetes de datos distintos.

2. Qué algoritmos requieren que mis datos estén especialmente preparados

Algunos algoritmos tratan automáticamente con valores ausentes (por ejemplo, cuando falta la edad de una persona), mientras que otros no lo hacen. Algunos tienen en cuenta datos categóricos (valores que vienen de una lista fija, como el género), mientras que otros no. Unos funcionan bien cuando tus datos numéricos están normalizados (reescalados para tener las mismas medias y rangos), mientras que otros algoritmos dan las mismas respuestas independientemente de la normalización.

Mi inteligencia artificial debería saber qué algoritmos requieren una preparación especial de mis datos y que automáticamente añada ese preprocesamiento de datos a nuestro canal de procesamiento.

3. Qué métrica de precisión tiene más sentido para mis datos

Quiero la habilidad de comparar la precisión de cada uno de los algoritmos, pero con esto no es suficiente. Los diferentes tipos de datos requieren distintas métricas de precisión. Si estoy prediciendo una probabilidad, usaré una métrica diferente que cuando predigo una cantidad. Si necesito prever un evento extraño, no quiero una métrica de precisión que mida el resultado más probable – ¡eso solo predecirá que nunca pasa nada!

Necesito que mi inteligencia artificial analice las características de mis datos, especialmente los valores que estoy prediciendo, y elija la métrica de precisión más apropiada para mí.

4. Qué algoritmos tienen más probabilidades de ser precisos con mis datos

A pesar de que no sabemos con anticipación qué algoritmo será el mejor para nuestro paquete de datos y que el benchmarking nos muestra que ningún algoritmo es perfecto, a veces tenemos una idea aproximada sobre qué algoritmos tienen más probabilidades de funcionar mejor en un paquete concreto de datos. Esto es porque ya hemos visto cómo diferentes algoritmos funcionan con pocas o con muchas columnas de datos, y cuáles tienden a funcionar mejor con datos numéricos, categóricos o textuales.

Quiero que mi inteligencia artificial use el conocimiento del rendimiento histórico de diversos grupos de algoritmos con varios paquetes de datos y que seleccione aquellos que se ajusten mejor a las características individuales de mis datos.

5. Qué algoritmos admiten requerimientos especiales

Algunos negocios especializados tienen requerimientos especiales. Por ejemplo, los modelos tarifarios de aseguradoras necesitan permitir «exposición» imponiendo una escala prorrateada de las predicciones frente a la duración de la póliza de seguro. Otras veces queremos incluir conocimiento preexistente o reglas de negocio, como reforzar un riesgo extra de mortalidad para fumadores. Algunos algoritmos admiten estos requerimientos especiales, pero otros no.

Mi inteligencia artificial deberá saber qué algoritmos admiten estos requerimientos específicos y cuáles no.

Colin Priest
Director de producto de DataRobot

DataRobot es partner de Nae para soluciones de machine learning automatizado e inteligencia artificial orientadas a la empresa, y especialista en automatizar el flujo de trabajo de la ciencia de datos, tanto para la recomendación de algoritmos como para la construcción de modelos predictivos. 

Saber más:

Nae trabaja con operadores de telecomunicaciones, grandes empresas y administraciones públicas para anticipar los retos de crecimiento y transformación del mercado, mejorando su estrategia de negocio y eficiencia operativa. Con sedes en España, Colombia, México, Brasil y Costa Rica el equipo de Nae está formado por más de 600 profesionales.