Pot la intel·ligència artificial recomanar-me el millor algoritme per al meu negoci?

Si tenim IA que ens recomana llibres i series, on es troba el sistema per ajudar-nos en una elecció tan important per a les empreses?

M’agrada llegir i sempre vaig buscant llibres i autors nous que s’ajustin als meus estils preferits, però amb la publicació d’un llibre cada 5 minuts, és impossible seguir el ritme del nombre de novetats. La intel·ligència artificial ens pot ajudar en aquest aspecte: puc anar a la meva llibreria online preferida perquè em recomani allò que s’aproximi als meus gustos. Això es fa a través d’un algoritme, que cerca entre milions de llibres disponibles per mostrar-me una llista curta de llibres recomanats per a lectors com jo.

Però també vull que la intel·ligència artificial em recomani una llista curta d’algoritmes perquè jo els pugui provar amb les meves dades.

Així, quan necessiti intel·ligència artificial per automatitzar el meu negoci, perquè no puc obtenir recomanacions per saber quin algoritme d’aprenentatge automàtic (machine learning) s’ajusta més a les meves necessitats individuals? Cada negoci és únic i hi ha centenars d’algoritmes disponibles, cadascun amb els seus punts forts i els seus punts dèbils. De la mateixa manera que no analitzo individualment cada llibre per tal d’escollir quin vull llegir, no tinc temps, recursos, ni coneixement per provar amb les meves dades tots els algoritmes possibles.

Aquí està la llista amb les 5 coses que un sistema d’intel·ligència artificial hauria de saber al moment de recomanar-me algoritmes.

1. Quins algoritmes no funcionaran amb les meves dades

Alguns algoritmes s’especialitzen en classificació (estimant probabilitats de coincidència, per exemple la probabilitat de què una persona a qui se li ha deixat diners no els torni), mentre que altres s’especialitzen en regressió (estimant una quantitat, per exemple, quant falta perquè el teu vol arribi al seu destí). Alguns algoritmes requereixen una gran quantitat de dades, mentre que altres no funcionen amb grans volums. Alguns s’especialitzen en dades desestructurades, com el text, però altres només admeten dades numèriques.

Vull que la meva intel·ligència artificial observi les característiques de les meves dades i que automàticament filtri aquells algoritmes que no podran funcionar. Els descartats podrien guardar-se per al seu ús en altres ocasions i amb altres paquets de dades diferents.

2. Quins algoritmes requereixen que les meves dades estiguin especialment preparades

Alguns algoritmes tracten automàticament amb valors absents (per exemple, quan falta l’edat d’una persona), mentre que altres no ho fan. Alguns tenen en compte dades categòriques (valors que vénen d’una llista fixa, com el gènere), mentre que altres no. Uns funcionen bé quan les teves dades numèriques estan normalitzades (redimensionades per tenir la mateixa mesura i rang), mentre que altres algoritmes donen les mateixes respostes independentment de la normalització.

La meva intel·ligència artificial hauria de saber quins algoritmes requereixen una preparació especial de les meves dades i que automàticament afegeixi aquest preprocessament de dades al nostre canal de processament.

3. Quina mètrica de precisió té més sentit per a les meves dades

Vull l’habilitat de comparar la precisió de cadascun dels algoritmes, però amb això no és suficient. Els diferents tipus de dades requereixen diferents mètriques de precisió. Si estic predient una probabilitat, faré servir una mètrica diferent que quan predic una quantitat. Si necessito preveure un esdeveniment estrany, no vull una mètrica de precisió quan mesuri el resultat més probable – això només predirà que mai passa res!

Necessito que la meva intel·ligència artificial analitzi les característiques de les meves dades, especialment els valors que estic predient, i esculli la mètrica de precisió més apropiada per a mi.

4. Quins algoritmes tenen més probabilitats de ser precisos amb les meves dades

Tot i que no sabem amb anticipació quin algoritme serà el millor per al nostre paquet de dades i que el benchmarking ens mostra que cap algoritme és perfecte, a vegades tenim una idea aproximada sobre quins algoritmes tenen més probabilitats de funcionar millor en un paquet de dades. Això és perquè ja hem vist com diferents algoritmes funcionen amb poques o moltes columnes de dades, i quins tendeixen a funcionar millor amb dades numèriques, categòriques o textuals.

Vull que la meva intel·ligència artificial utilitzi el coneixement del rendiment històric de diversos grups d’algoritmes amb diversos paquets de dades i que seleccioni aquells que s’ajusten millor a les característiques individuals de les meves dades.

5. Quins algoritmes admeten requeriments especials

Alguns negocis especialitzats tenen requeriments especialitzats. Per exemple, els models tarifaris d’asseguradores necessiten permetre “exposició” imposant una escala prorratejada de les prediccions enfront de la duració de la pòlissa d’assegurança. Altres vegades volem incloure coneixement preexistent o regles de negoci, com reforçar un risc extra de mortalitat per a fumadors. Alguns algoritmes admeten aquests requeriments especials, però altres no.

La meva intel·ligència artificial hauria de saber quins algoritmes admeten aquests requeriments específics i quins no.

Colin Priest
Director de producte de DataRobot

DataRobot és partner de Nae per a solucions de machine learning automatitzat i intel·ligència artificial orientada a l’empresa, i especialista en automatitzar el flux de treball de la ciència de dades, tant per a la recomanació d’algoritmes com per a la construcció de models predictius.

Saber-ne més:

Nae treballa amb operadors de telecomunicacions, grans empreses i administracions públiques per a anticipar els reptes de creixement i transformació del mercat, millorant la seva estratègia de negoci i eficiència operativa. Amb seus a Espanya, Colòmbia, Mèxic, Brasil i Costa Rica l’equip de Nae està format per més de 600 professionals.