Data Science

Data Science

El miércoles 23 de septiembre, de 18 a 19.30 horas y en el marco de las Charlas Jóvenes CAI, se realizó, a través de la plataforma Zoom, el encuentro a cargo de Fredi Vivas, CEO y co fundador de Rocking Data, una startup que brinda servicios de Big Data, IA y ciencia de datos a empresas y corporaciones internacionales, y el Ingeniero Darío Rajmanovich, presidente del Comisión de Jóvenes del CAI.

Vivas, CEO de Rocking Data es Ingeniero en Sistemas de Información. Egresado del Profesorado Universitario en Disciplinas Industriales. Estudió en Singularity University (NASA + GOOGLE). Y es coordinador académico del programa Big Data, de la Universidad de San Andrés.

Abrió la charla el Ing. Rajmanovich quien realizó una breve introducción a la temática. “Hace algunas décadas uno de los temas principales era el tema de la información y esta escaseaba, algunos libros de entonces contaban que la información era poder y traía respeto. En las últimas décadas con los cambios en las comunicaciones y en la capacidad de almacenamiento, los filtros para obtener información se convirtieron en una herramienta para poder crear valor a esa información. Ese desafío nos trae al diálogo que mantendremos hoy con un especialista en esto”, señaló. Fue el turno del Ing. Vivas que contó que “desde siempre fui bastante nerd de la tecnología y siempre me gustó y ya desde muy chico tuve la suerte de meterme en ese mundo. Estudié programación y operación en DOS y eso me llevó después a terminar ingeniería. Estudié 6 años, en el secundario, computación. En el primer año de la facultad conseguí trabajo en un Instituto dando clases de computación y fui aprendiendo mucho. Luego trabajé en corporaciones de telecomunicaciones y luego en el mundo de Big Data. Me interesó el mundo de la tecnología y de cómo las empresas usan eso. Luego fui leyendo sobre el Big Data, la IA, y ese mundo me fue interesando mucho. Hace 7 años no había por dónde arrancar en la Argentina. Tuvimos que traer gente de España para que nos diera cursos y así poder aprender más. Gané una beca para ir a estudiar a Sillicon Valley todos temas vinculados a Big Data, IA, Machine Learning y demás, y de regreso en el país fundé Rocking Data y comenzó otra historia. Es una empresa que hace IA y machine learning para otras empresas. Hoy trabajamos para multinacionales muy grandes para implementarles modelos de machine learning, es decir, ¿cómo hago para predecir cuántas ventas voy a tener en los próximos meses? ¿Cómo hago para saber si un turno que saca un cliente, va a ser cancelado o no?, o ¿cómo hago para saber si un empleado quiere irse de la empresa? Todo esto se puede saber con la ciencia de datos que se usa para resolver problemas hoy en empresas, por ejemplo, para ahorrar costos, vender más y fidelizar clientes. Podríamos decir que la IA suele usarse para fines más disruptivos. Y los inicios fueron “hagamos proyectos de datos” o sea, nos gusta el rock nos gustan los datos, hagamos Rocking Data. Qué servicio y que producto íbamos a vender, no lo sabíamos bien, pero sabíamos que queríamos trabajar con Analytics, que hoy ya no hacemos, Machine learning e Inteligencia Artificial. Analyticis es como el nivel básico de análisis de datos y esta tercero en la pirámide de esa temática, debajo de los dos anteriores. Analytics te permite analizar que pasó y como pasó, en cambio el Machine Learning es que pasará. La diferencia es radical porque esto último te permite, a partir de los datos, tomar decisiones de negocio a futuro. Hoy después de tres años de haber pulido esa propuesta, hacemos ocho modelos de Machine Learning pero tuvimos que aprender para que estaba el mercado, cuáles eran las principales barreras para las empresas. Al principio hacíamos lo que necesitara el cliente. Hoy, en la actualidad, puedo decir que estamos vendiendo más que antes de la Pandemia, y es demasiado”

“¿Hacia dónde va el mundo y como estamos en la Argentina en estos temas” ?, quiso saber Rajmanovich. “Si bien la IA tiene 60 años, ahora está explotando, y en el caso de ML, hace 5 años, con lo cuál diría que estamos en pañales en esto. Cada vez que me pongo a investigar y aprender, me doy cuenta de la falta de definiciones que hay: desde como compartir información en proyectos de data, cuestiones legales o éticas, hasta que un modelo no tenga sesgo racial o de géneros. Y hay una gran necesidad de generar cosas, definiciones, para poder generar modelos en ese sentido. Este año nos metimos fuerte a trabajar en áreas de la salud, por ejemplo sanatorios como clientes, y empezamos a ver que cuando les contábamos las cosas que podíamos generarle, nos decían que eso nunca lo habían escuchado. Y a nosotros nos parece como lógico. Por ejemplo hicimos un modelo predictivo para anticipar la gente, los pacientes, que van a entrar con Covid a un Sanatorio de primera línea. Con esa predicción ellos pueden direccionar mejor el equipo, el staff, organizar el stock de equipos y productos, para hacer mucho más eficiente la gestión de este tema. Y eso para mí es algo obvio, pero el cliente se sorprendió. Por esto creo que hay mucha oportunidad en esto. Estamos muy verdes en esto, sobre todo en Latinoamérica. Salvo Argentina, Brasil y México, el resto está muy atrás. Creo también que ahora hay mucho trabajo de estos temas en universidades, academias y que se verán los resultados en un par de años. Y creo, con respecto al futuro, que esto va a explotar en las empresas, las grandes compañías, todas, van a hacer Machine learning e IA y que todos los empleados que hacen trabajo de análisis deberán convertirse en analista de datos. Van a tener que tener la alfabetización elemental en datos, al menos, para poder ejecutar con eficiencia ciertas tareas. Otra tendencia que veo es el mayor uso de la inteligencia Artificial, entrando cada vez más. Algo que veo es el GTP3, una tecnología del uso del lenguaje natural, que no es magia pero se parece mucho. Por ejemplo, vos le decís a una computadora: “Genera un formulario que ponga dos valores, multiplique y eso que lo pinte con los colores del Arcos Iris”. Escribís eso con esas palabras y te lo genera. O sea programa en base a tu lenguaje natural. Es increíble. Nosotros estamos trabajando con un proyecto de GTP2, que es la versión anterior. En esto están trabajando Microsoft y Elon Musk, de Space X, y en octubre se lanza a un costo de U$S 200, para hacer proyectos con GTP3 y nosotros ya la pedimos”, contó Vivas. “¿Qué tipos de perfiles de empleados son los que se van a necesitar en este rubro, que aún está en etapa de crecimiento?”, preguntó Rajmanovich. “En las empresas creo que los perfiles que más se van a desarrollar, y que más se necesitan son los de Analistas de Datos, no pueden construir un modelo de Machine Learning, lo que pueden hacer es entender la data, responder preguntas de negocios. Por ejemplo, imagínate que sos una cadena de farmacias, estás en tu oficina y te dicen que quieren saber cuáles son las sucursales más vendedoras, porque van a abrir una más, y quieren saber cuál abrir. Estos es lo que resuelve una analista de datos y para esto no va a tener tres meses, tendrá seis horas. El trabajo del Analista de Datos está muy pegado al negocio y generalmente son gente que trabaja en Marketing, Finanzas y otras, pero que se forman en esta especialidad”, explicó Vivas. Luego llegó el momento de las preguntas de los presentes en la charla. Uno quiso que Vivas le contara, como medida, un caso de éxito. “Hubo un proyecto para una empresa que vende entradas para recitales, y que esta vez quería hacer algo con el Cirque du Soleil. Lo que buscaban era entender mejor las necesidades o búsquedas de los clientes para ver qué otra cosa le podían ofrecer y como comunicarse con esas audiencias. Nos pasaron todos los datos de los tickets de ventas, sin los datos de las personas- ya que no nos interesaban-, y una vez que fuimos viendo y analizando los datos fuimos como separando a los clientes por grupos: los que compraban para cuatro, los que compraban de noche, los que compraban dos tickets, los que eran del interior, entre otros. Les pasamos eso y ellos con esa información crearon una campaña de mails personalizados. Y por ejemplo a los que venían del interior, le ofrecieron comprar la entrada con el viaje, la noche de hotel, y el regreso, todo en un paquete. Y vendieron realmente muchísimo, casi monetizaron un 40% más, solo en ese rubro específico que eran los clientes del interior. Eso para nosotros es un caso de éxito”. ¿Cómo toman datos las compañías y que información privada manejan?”, consultó otro participante. “La mayoría de los proyectos que hacemos nosotros son con data de CRM o de otros sistemas así. Hemos hechos proyectos de la industria de energía y de oil & gas en los que directamente tomábamos datos de mediciones de equipos. Depende de lo que estemos hablando. Hay aplicaciones de e-commerce, sistemas de fidelización, como por ejemplo las tarjetas de supermercados o de ServiClub, eso genera mucha información. Contrariamente a lo que se piensa Google, Twitter, Facebook, no son la principal fuente de datos para los proyectos. La principal fuente de datos para estos proyectos son los datos que tiene la compañía que en general están poco explotados y muy desordenados”.