Cuadrante Mágico de Gartner: Las tres claves para entenderlo

Publicado por Kruger on 27/02/2020 7:45:07

 

 

Blog de Innovación

 

 

 

Tres claves para entender qué es Cuadrante Mágico de Gartner de DSML Platforms 2020

Esta semana Gartner publicó su séptimo reporte anual de Plataformas de Data Science y Machine Learning, estudio que se basa en varios parámetros, no solamente técnicos, sino también de mercado, precio y retroalimentación de los clientes actuales de cada plataforma. Año tras año Gartner censa a cada vendor y arma su indicador que ayuda a clientes, en búsqueda de adquirir alguna solución, a tener un estudio formal de competencia entre plataformas.

Tras analizar el informe, denominado el Cuadrante Mágico de Gartner, se identifican tres conceptos predominantes que permiten ampliar una explicación sobre su significado y cómo estas características ayudan a las empresas a obtener un mejor valor de datos.

  • Analítica Aumentada

Imaginemos a Carlos, quien es un científico de datos en una importante empresa. Cuando le llega un nuevo problema a resolver, recibe una gran cantidad de datos de distintas fuentes, es entonces cuando su trabajo empieza. Explora fuentes, comprueba la calidad de datos, crea variables sintéticas, etc. Todo esto utilizando muchas librerías y tornando su trabajo en una actividad de "hacha y machete". Esta etapa inicial, en muchos casos, le puede tomar hasta el 80% de su trabajo, es decir; tiene que preparar su tabla analítica con la que posteriormente aplicará diferentes técnicas estadísticas para emitir un resultado, sea este una clasificación, predicción, dashboard o cualquier producto de datos.

Ahora imaginemos que este 80% del trabajo de Carlos pueda ser automatizado, utilizando las propias capacidades de AI y NLP, es decir; que ahora Carlos puede tener un recomendador automatizado que le va sugiriendo como armar su data set y qué variables adicionales puede crear para mejorar el poder predictivo de los mismos.

Estas mismas capacidades las podemos tener dentro de las herramientas de BI, donde el usuario final puede explorar la información y obtener las sugerencias para conseguir resultados más precisos; otra de las funcionalidades más comunes hoy en día en cuanto a analítica aumentada, son las opciones de AutoML ya provisto en algunas librerías y herramientas. Esta consiste en utilizar algoritmos genéticos o de optimización para configurar la hiperparametría de un algoritmo (árbol de decisión, red neuronal, gradientboosting, etc), haciendo que el científico de datos se demore menos en la obtención de su modelo final.

¿Por qué esta característica es importante?

El proceso de preparación de datos a un científico le toma el 80% del tiempo y apenas tendrá un 20% para ejecutar el proceso de modelamiento y extracción de insights En un mundo donde se habla ya de industrialización de la analítica y las empresas ya empiezan a tener cientos de modelos en producción, es importante automatizar, no solamente la obtención de datos, sino también los procesos de parametrización y puesta producción de modelos. Según la predicción de Gartner para este año, se estima que el 40% de tareas de los científicos de datos estarán automatizadas haciendo que más personas puedan usar, entender y compartir resultados analíticos, de esta forma se da lugar a un nuevo perfil llamado el Citizen Data Scientist.

  • Operacionalización

En el Strata Conference de este año, uno de los temas principales que se trató es la operacionalización de la analítica, que consiste en cómo la empresa puede centralizar, gobernar, monetizar y manejar diferentes estrategias de despliegue de todos sus modelos analíticos, independientemente de la herramienta en la que este haya sido construido (R, Python, SAS). Un modelo de arquitectura inicial es el Rendezvous que por más sencillo que se lo vea su implementación puede llegar a ser un dolor de cabeza.

El problema principal que aborda es el tiempo que demoran las empresas actualmente en poner en producción sus modelos, esta tarea en muchas empresas tarda entre 6 y 9 meses, debido a que en muchas ocasiones se necesita realizar una migración de código para poder integrarse con algún sistema interno o simplemente para ganar optimización en velocidad de procesamiento. En el 50% de los casos, los modelos no pueden ser puestos en producción por su dificultad técnica.

Una vez que el modelo está en producción, se necesita tener un seguimiento periódico para evaluar la precisión del modelo, y además tener una estrategia de Champion/Challenger entre el modelo campeón (en producción) y modelos retadores para garantizar el mejor modelo en producción siempre.

Si bien la operacionalización es una fase dentro de todo el proceso analítico, Gartner destacó la facilidad con las que las herramientas ponen en producción los modelos y los diferentes tipos de despliegue: batch, in-database, realtime.

  • Explainable AI

Una de las principales dificultades para que las empresas adopten modelos de inteligencia artificial, es sobre la interpretación de sus resultados. Cuando un gerente de riesgos, marketing o fraude recibe los resultados de un modelo, va a buscar las variables más importantes que influyeron en la predicción y cuáles son sus pesos. Tras interpretar estos resultados, se plantean estrategias para mitigar riesgos o aprovechar oportunidades.

Los modelos de machine learning o inteligencia artificial se caracterizan por ser cajas negras, las herramientas tradicionales no devuelven un modelo interpretable, sin embargo algunas plataformas como SAS ya implementan algoritmos que permiten obtener una importancia de variables de este tipo de modelos, como lo demuestran en esta serie de artículos, donde explican los diferentes algoritmos y técnicas.

La ventaja de utilizar modelos de machine learning o inteligencia artificial destaca sobre todo en la precisión de la predicción que se puede obtener, muy pocas empresas son las que al momento han podido implementar modelos de machine learning.

Estos fueron los tres principales conceptos extraídos del análisis de Gartner, sin embargo, todavía no se ha profundizado en otros temas adyacentes al Cuadrante Mágico de Gartner, que abordaremos en futuros artículos.

Visita periódicamente nuestro Blog de Innovación para más noticias y curiosidades en el mundo de la innovación.

 

 

Conoce más acerca de nuestras soluciones de Business Transformation

 

[addthis tool="addthis_inline_share_toolbox_45hh"]

Conoce nuestro
Blog de Innovación.

 

Transfórmate

 

Transforma tu empresa. Contáctanos para proveer soluciones creativas e innovadoras para tu negocio ¡ahora!

            

            

Política de Privacidad      Información Legal 

© 2019 KRUGERCORPORATION S.A. - Todos los derechos reservados

Temas: BLOG DE INNOVACIÓN, analítica, interoperabilidad, integración, Innovación

Suscríbete a nuestro blog

Lo más popular

Publicaciones por tema

Ver todo