Analizando datos, descubriendo patrones

Entrevista a Eduardo Castillo, Data Scientist (Guadalajara, jal; 25 años)Ing. Financiera, ITESO.

Hola Eduardo, gracias por regalarme este espacio y permitirme conocer a través de tu historia un área tan apasionada como metódica, la Ciencia de los Datos

Tu profesión es Ingeniería Financiera ¿Como ingresas al mundo de TI?

Mi carrera tiene muchos elementos que requiere un Data Scientist: Matemáticas, Álgebra Lineal, Cálculo Diferencial, Estadística, Programación y otras; En la primera mitad de la carrera tenía idea de trabajar en algo relacionado con Finanzas y la Bolsa de Valores (QUANT/Quantitative analyst). La carrera que estudié dura 9 semestres, en mi caso fueron 10 porque hice un intercambio en el extranjero. En la segunda mitad, llevé algunas materias con doctores del CINVESTAV y gracias a ellos me llamó la atención experimentar con Data Science en un ámbito más amplio y general que solo finanzas.

Intercambio en el extranjero ¿A dónde te fuiste?

A Hungría, me parece un país increíble, su cultura me resulta interesante, la arquitectura de su ciudad es muy bella, por lo mismo que tiene una buena posición geográfica (está en la ruta de comercio entre Asia y Europa del Oeste) y cuando todos los países están en paz le va muy bien, crece mucho.

Pero también es un punto estratégico de guerra, entonces cuando hay conflictos bélicos, es un país que resulta muy lastimado.

¿Por qué Hungría?

Esa decisión no la pensé mucho, fue simple, la universidad era francesa no se veía mal, fue un semestre enfocado en clases de negocios, que a mi carrera le faltaba un poco, porque estábamos muy en lo técnico.  La verdad no lo pensé tanto, vi la oportunidad y la tomé; con el idioma no tuve problema porque las clases se impartían en inglés.

¿Cómo te fue viviendo en una cultura diferente a la tuya?

Tengo una buena idea de cómo es el país en cuanto a cultura y también como se encuentra económicamente “parado” a nivel mundial y a nivel académico; porque me impresionó bastante y estudié su historia.

A mi parecer es un país similar a México, ellos también pasaron situaciones difíciles al ser conquistados por otro país, solo que ellos se liberaron hasta hace muy poco, estuvieron bajo el régimen de la Unión Soviética, vivieron muchas cosas denigrantes y se liberaron hasta 1990.

El hecho de que llegara otra cultura y aplastara sus creencias por tantos años les hizo tener la misma característica de los mexicanos de tener una cierta pérdida de identidad, por lo que vi similitud en la forma en que interactúan las personas en sociedad.

No es un país que se distinga por tener el mejor mercado laboral, o la mejor calidad estudiantil pero tiene la ventaja de que lo incluyeron en la Unión Europea , y a pesar de que aún no lo incluyen completamente (aún tienen su propia moneda, no les permiten usar el euro) se ha beneficiado bastante de las puertas que  te abre, no solo a nivel económico ,sino en las oportunidades laborales y estudiantiles  de tu población para irse a otros países más fácilmente, entonces es un país que a pesar de tener poco tiempo en desarrollo, se está desarrollando bastante rápido y su economía ha crecido bastante por parte del turismo.

¿Cuál fue tu primer puesto en el área de Data?

 Mi primer acercamiento fue en una empresa que se llama Intersys Consulting que está aquí en Guadalajara, es de EEUU y tiene aquí un Delivery Center, entre al área de Big Data, la compañía se divide en Consultoría de Software y Consultoría de Big Data, en la parte de Big Data se incluyen Ciencia de Datos, Análisis de Datos,  Base de Datos, etc; todo lo que tenga que ver con Datos; trabajé ahí como Consultor, alrededor de año y medio.

A lo largo de tu carrera, ¿Qué experiencias te ha marcado?

A pesar de que a finales de mi carrera ya estaba interesado en cosas como  Machine Learning y Ciencia de Datos, porque eran conceptos vistos en la carrera; cuando me gradué lo primero que intenté fue conseguir empleo en un banco, no me quería desprender completamente  de mi carrera, entonces mi primera búsqueda fue en varios bancos, en City Banamex pase por varias entrevistas y  cuando era la “buena”  con los directivos, me preparé, me corté el cabello (tenía cabello largo), tuve la entrevista y a pesar de que siento que no me fue tan mal, ese fue mi primer fracaso en el mundo laboral, después de ese rechazo me sentí decepcionado, porque era la empresa que me interesaba, porque pensé que ese era el puesto para mí y pensaba que tenía más que ofrecer que otros candidatos y la verdad me frustré. Después de esto tuve la fortuna de asistir a una feria del empleo en el ITESO, fui a ver que empresas se habían presentado  y me encontré con un stand pequeño de la empresa Intersys Consulting, me acerqué para preguntar que hacían y que ofrecían y me dijeron que tenían vacantes  de Big Data, Análisis de Datos, etc; mandé mi CV, pasé a entrevista no técnicas,  las de RH y  Talent Adquisición, un día me citaron para realizar una prueba técnica, yo no sabía que esperar, estaba bastante relajado, no estaba tan motivado fue un “a ver que es”, no me quise  hacer ilusiones una vez más, llegué tranquilo eso me ayudo a resolver mejor  el ejercicio, lo hice  bastante bien, éramos como 20 personas y fui el primero en terminar; así comenzó mi primer acercamiento al área de Big Data.

¿Recuerdas la retro del área de RH del Banco?

No me dieron retroalimentación como tal, fue un correo con un “Gracias por tu tiempo, pero no tienes el perfil”, después me di cuenta de que en el ambiente bancario en parte se guía por el status y apariencia y yo no tengo el estereotipo que ellos buscaban.

Platícame sobre el ejercicio del examen técnico para Intersys Consulting ¿Lo desarrollaste con algo que te enseñaron durante la carrera?

Era hacer un Algoritmo para resolver un problema, era como hacer un mini juego con ciertas reglas y era contra reloj; tuve la ventaja de que el último semestre estuve super enfocado programando cosas de Machine Learning en Python porque estaba haciendo un internship en la institución gubernamental IIEG (Instituto de Información Estadística y Geográfica de Jalisco) es como el INEGI pero Estatal; entonces todo el conocimiento estaba fresco.

¿Qué aprendizaje dejó tu paso por Intersys?

Bastantes cosas, la primera de ellas fue la interacción con clientes, yo nunca lo había vivido; la mayoría eran clientes de EE. UU., que no son los clientes más fáciles de complacer, entonces ver como se manejaba el negocio, las metodologías que se utilizan en proyectos de TI, etc. Aprendí como se maneja ese mundo.

También ahí tuve la oportunidad de conocer a una persona brillante y muy bien preparada en Inteligencia Artificial, es el director del área de Big Data, mi lugar de trabajo estuvo por un tiempo al lado del suyo y tuvimos la oportunidad de platicar mucho, él me ayudó bastante a crecer y a definir el camino por el que me quería ir. Conocerlo fue importante en mi decisión de ser Científico de Datos; es una persona que no solo se admira en lo profesional ya cuenta un doctorado en Inteligencia Artificial por la Universidad de Sussex (Reino Unido) sino a nivel personal también.

¿Cuáles fueron tus siguientes pasos despúes de Intersys?

Después de Intersys me tomé un mes y medio sabático, viaje a Canadá e Islandia y después de eso inició mi búsqueda de trabajo, apliqué para varias empresas, y deserté de algunas por sus procesos, eran demasiado largos y yo no estaba para estar muchos meses más sin trabajar; me decidí por HCL porque tenían la vacante lista, y fue tomar la vacante que estaba lista para mí.

En HCL me fue muy bien, atendí a un banco creado por y para la milicia de EEUU; es una corporación gigante con procesos muy bien definidos, no solo administrativos, sino procesos de desarrollo; colaborar ahí me ayudo a entender como es trabajar con procesos bien establecidos; además la vacante fue retadora, mi puesto fue de Ingeniero de Datos que va ligado a la Ciencia de Datos, área de mi interés.

Actualmente soy científico de datos en Itexico, trabajando para un cliente japonés en la industria de semiconductores.

¿Qué hace un Científico de Datos?

Para explicar que hace, quiero comenzar por explicar que hace un Ingeniero de Datos; se encarga de la extracción, el procesamiento y el almacenamiento de datos; en pocas palabras construye la infraestructura de los datos y crear lo que se conoce como un “Data Lake”. Lo ideal es que el científico de datos vaya a esa fuente de datos y tome lo que necesite para hacer análisis y crear modelos estadísticos; pero la realidad es que las empresas y el mercado no están tan especializados y siempre toca hacer un poco de las dos cosas.

Entonces un Científico de Datos se encarga también de buscar e incorporar nuevas fuentes de datos, además tiene que asegurarse de que la calidad de los mismos sea la que se necesita y si no es así limpiarlos, transformarlos. Los datos son nuestra materia prima y es nuestra responsabilidad procurar su calidad, una vez que hiciste eso, comienza la parte de explorarlos, graficarlos y entender su comportamiento, qué tendencias y patrones tienen. Después de explorar y entender tus datos puedes modelarlos y entrenar algoritmos con ellos, es aquí donde entra la parte de Machine Learning e inteligencia artificial. Al final lo que buscamos es convertir datos en información e información en conocimiento y utilizar ese conocimiento de la mejor manera posible.

¿Qué consideras es lo más difícil o frustrante de tu profesión?

Lo primero es algo simple, es que tienes que estar pegado todo el tiempo a la computadora, es un trabajo sedentario, no es un trabajo en que interactúes mucho con otras personas, pasas mucho tiempo solo y eso es un reto.

Lo segundo es que esta es un área que está en constante crecimiento e investigación, así que, si eres un científico de datos que en 1 año no estudiaste o aprendiste algo nuevo, te habrás perdido de muchas cosas, aquí es muy fácil quedarte atrás.

¿Qué carreras son afines a Ciencia de Datos?

En general la mayoría de los Científicos de Datos estudiaron Ciencias de la Computación y cuentan con una Maestría o Doctorado en Estadística o Matemáticas o pueden ser Matemáticos o Físicos de profesión y después haber estudiado Computer Science.

En México se da mucho que las personas de Actuaría den el brinco a Ciencia de Datos, de hecho, la carrera de Actuaría se parece a Ingeniería Financiera.

¿Qué tipo de empresa requiere un Científico de Datos?

En este punto cualquier empresa que produce datos y no los analice se puede quedar atrás en el mercado y así perder valiosa información que puede ser el diferenciador en si tiene éxito o no.

Lo primero es que te asegures de tener la capacidad de producir datos, puede ser que al principio no sean de la mejor calidad, pero una vez que tienes una cantidad decente de datos, ya sea de tus procesos o de tus productos, puedes empezar a trabajar en ellos, analizarlos y generar insights.

¿Cuál consideras es el perfil de un Científico de Datos?

Paciente, analítico, gusto por la atención a los detalles (todo está en los detalles), persona con la capacidad suficiente de concentración para seguir el mismo hilo de pensamiento por una hora, dos, tres; gusto apasionado por el aprendizaje continuo y capacidad de ser autodidacta, porque al no contar en México con la carrera como tal, si te interesa el área, tendrás que aprender por tu cuenta.

Ser introvertido o extrovertido no es relevante, lo que sí, es que sepas comunicar tu análisis y hallazgos a tus clientes, jefes y personas en el negocio.

¿Qué conocimientos te parecen clave a desarrollar para alguien interesado en Ciencia de Datos?

Conceptos de programación, recomiendo Python (numpy, pandas), Scala, un poco de Java; preparación en Probabilidad y Estadística, Econometría te ayuda a entender cómo tratar las series de tiempo, Álgebra Lineal, Cálculo Determinista y Estocástico;

Digamos que hay dos tipos de Científicos de Datos;  el que sabe utilizar frameworks (sklearn, tensorflow, etc) , conoce conceptos generales, tal vez sabe generar un modelo sin entender realmente como está aprendiendo y comportando el algoritmo matemáticamente, y está el otro Científico de Datos que sabe no solo la práctica si no también la teoría ; obviamente es mucho más completo el que tiene un conocimiento profundo y estudia la teoría Matemática y Estadística detrás, sin embargo hay personas que han hecho carrera sin necesariamente  conocer detalles de la teoría.

¿Cómo visualizas el panorama de Data Science en México?

México tiene mucho talento, tiene presencia en EEUU y Europa, en general ya es visto en el panorama global, una ventaja es que el gobierno es consciente del potencial de la ciencia de datos e inteligencia artificial, entonces le está apostando al área; hace poco asistí a un focus group conformado por personas de aquí de Jalisco expertas en el tema, fue organizado por una Institución de gobierno con el objetivo de crear una organización con un enfoque a la Ciencia de Datos.

Las universidades privadas también están invirtiendo en esto, ya están creando laboratorios y centros de Inteligencia Artificial, el ITEMS abrió uno hace poco, la UdeG tiene un equipo de Inteligencia Artificial que hacen Deep Learning y han hecho algunos modelos que han aportado a la medicina; entonces México definitivamente tiene un buen panorama en el área de ciencia de datos. Pienso que tenemos todo para ser un diferenciador global en esta tecnología.

A tus 25 años ¿Cuál consideras que fue la clave en tu formación?

No es un camino sencillo, sacrificas tiempo en el que podrías estar con tu familia, amigos; no me considero una persona aislada de la sociedad; como estudiante y ahora como profesionista procuro encontrar el equilibrio entre la diversión, la familia, el trabajo y el estudio, creo en el balance y en encontrar el mismo.

Desde pequeño me idealicé como una persona que lucha por sus metas y nunca he dejado de hacerlo.

Por las habilidades con las que cuentas ¿Has pensado en trabajar en el extranjero?

Sí me tienta la oportunidad de trabajar en el extranjero, para aprender cómo se hace ciencia de datos en otros países, buscar y conocer las cosas buenas y en el fututo traerlas a México.

No estoy en contra de que los profesionistas se vayan y ejerzan en otros países, siempre que se comprometan a regresar e implementar aquí lo aprendido, con el objetivo de mejorar nuestro país y la calidad de vida de sus habitantes. Me gustaría poder aportar a México, país que me ha dado tanto.

Para finalizar ¿Alguna experiencia que consideres que ha abonado a tu éxito?

Una parte muy importante en mi formación es la oportunidad de explorar el mundo de la docencia, soy maestro de Ciencia de Datos.

Mi primera experiencia en esta área fue a la mitad del año pasado (2019) para una comunidad que nació en España que se llama Saturdays.AI, esta comunidad se dedica a promover el conocimiento de la Ciencia de Datos y la Inteligencia Artificial, la primera generación de Guadalajara salió el año pasado y tuve la oportunidad de ser mentor, fue todo un reto ya que eran más de 50 personas, con edades desde 18 hasta 50 y tantos años, era un grupo bastante diverso, desde personas que eran ingenieros en sistemas hasta personas de administración.

Actualmente colaboro para una institución que imparte diplomados de distintos lenguajes de programación, Data Science, inglés y Marketing.

Disfruto mucho ser maestro porque es una relación bastante justa donde ganan ambas partes, tanto el alumno como el maestro.

El alumno aprende de la experiencia del maestro y el maestro gana reforzando su conocimiento; una cosa es tener un concepto vago de un tema y otra es entenderlo para poder explicarlo a 50 personas diferentes.