No todo lo que generan los sistemas de información y modelos analíticos es el evangelio. Pero, ¿cómo evitar que el lago de datos se convierta en relleno sanitario?
Por Alex Infanzon
La tendencia de las personas a aceptar como verdadera la información generada por sistemas computarizados, resulta sorprendente. Esto, porque el razonamiento parece ser: “Si los datos fueron procesados por un sistema de cómputo, entonces el resultado debe ser correcto.” Esto no es necesariamente cierto. Veamos un ejemplo:
Basura entra
Si invertimos 200,000 pesos cada mes en una campaña de mercadotecnia enfocada en un segmento específico de 100,000 clientes, entonces el costo anual de la campaña es de 2.4 millones de pesos (excluyendo salarios y costos de operación). En años anteriores, el ingreso generado por las ventas asociadas a la campaña había sido de 5 millones de pesos y la ganancia de 2.6 millones de pesos (ingresos menos costos).
Ahora bien, si el algoritmo que se ejecuta para seleccionar y enviar el correo a los clientes es correcto, entonces ¿cuál es el impacto en el éxito de la campaña si la calidad de los datos es mala? Por ejemplo, datos erróneos en forma de registros duplicados, direcciones incorrectas, listas obsoletas y otros errores. Si se asume una tasa de error del 50% (una cifra común en departamentos de mercadotecnia), entonces la mitad de los correos se pierden y, por lo tanto, el ingreso se reduce también a la mitad (de 5 millones a 2.5 millones de pesos). Las ganancias también se reducen de 2.6 millones a 100,000 pesos. Si añadimos salarios y otros costos de operación, ¡lo más probable es que perdamos dinero!
Si definimos el gobierno de datos como un programa que abarca la calidad de los datos, sus políticas de uso, así como aspectos de seguridad y privacidad, entonces la escena descrita arriba es sólo un aspecto de dichos programas. En las últimas dos décadas, la gobernabilidad de datos ha madurado significativamente en áreas como:
Con el advenimiento de Big Data, el nuevo paradigma es crear un lago de datos (Data Lake), por lo que es necesario reexaminar qué tan bien se cumplen los requerimientos originales de cada una de las áreas antes mencionadas. Pero, ¿qué quiere decir crear un lago de datos? Éste se define como un repositorio de almacenamiento masivo y económico, como Hadoop, donde se puede almacenar permanentemente todo tipo de datos para realizar procesos analíticos o de minería de datos. El lago de datos contiene los datos en su forma más cruda, sin procesar y con un mínimo de gobierno. Para evitar que el lago de datos prístino se convierta en un relleno sanitario (basurero) es necesario implementar un programa de gobierno de datos.
Evangelio sale
Pero, ¿qué hay respecto a los resultados generados por los sistemas de información? La tecnología de la información se ha convertido en el posibilitador de notables cambios en las organizaciones. Su uso ha ocasionado una profunda transformación de las mismas, e incluso de los mercados, de manera que la información se ha convertido en un activo cada vez más valorado. Por ello, hoy las organizaciones deben redoblar esfuerzos para establecer procesos de gobernabilidad que garanticen la confiabilidad de la información a partir de dichos sistemas.
De la misma forma, en muchas organizaciones los procesos analíticos están creciendo rápidamente, lo que genera nuevos retos de gobernabilidad en temas como: integración entre diferentes áreas de la empresa y sus fuentes de datos; aspectos regulatorios y/o legales y de capital humano, así como otros aspectos como:
Ahora bien, aun cuando la información generada sea correcta, deben existir controles de gobierno para mitigar otro tipo de riesgos, por ejemplo, el de la imagen corporativa.
En Estados Unidos en el 2012, la empresa Target tuvo que enfrentar un problema de su imagen corporativa cuando el periódico New York Times publicó un artículo: “Cómo las Empresas Conocen Tus Secretos” (How Companies Learn Your Secrets, por Charles Duhigg, febrero 16, 2012). El artículo describe la forma en que la compañía utilizó modelos analíticos para identificar si una clienta estaba embarazada, incluso si ella no quería saberlo.
El problema surgió cuando el padre de una adolescente se quejó ante la empresa de que le estaban enviando cupones y publicidad para mujeres embarazadas a su hija. La empresa se disculpó aun cuando era verdad que la adolescente estaba embarazada.
Hay que ser cauteloso, verificar los resultados y el impacto de las acciones que se toman.
No todo lo que generan los sistemas de información y modelos analíticos es el evangelio. Debemos validar siempre su veracidad. Como dice el refrán: “Si te digo que la burra es parda es porque tengo los pelos en la mano.”
Alex Infanzon, Arquitecto de la Práctica de High Performance Analytics en SAS.
Contacto:
Twitter: @SASMexico
Facebook: SASMx
Página web: SAS
Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Forbes México.
La entrada Cuando la basura entra, el ‘evangelio’ sale aparece primero en Forbes México.
En un entorno financiero cada vez más descentralizado, Bitget ha logrado posicionarse como una de…
Decirnos la verdad, aunque duela, es una forma de liderazgo. En México, este cierre de…
En un entorno corporativo donde la única constante es el cambio, las empresas en México…
Eliminar el impuesto a videojuegos no solo es un ajuste fiscal, sino una apuesta estratégica…
El futuro de la comunicación corporativa no se anuncia con ruido, pero avanza con pasos…
Romper barreras y transformar paradigmas no es solo un acto social, también es una estrategia…