
¿El científico de datos debería aprender matemáticas?, ¿qué tan útiles son en su espacio de trabajo?, ¿cuánto valor aportan a la empresa? Esta letanía de cuestiones, que se debaten acaloradamente en espacios internáuticos poblados por eruditos en inteligencia de datos, es el equivalente al clásico “¿y para qué me sirve en la vida el trinomio cuadrado perfecto?”.
Ciertamente, no podrás auxiliar a alguien atragantándose con un taco resolviendo una ecuación de segundo grado, pero el punto no es el fruto directo del conocimiento de las matemáticas, sino cómo prácticamente toda nuestra odiada civilización es sostenida por estas (si las especies animales se organizaran para detenernos, les aconsejaría ir primero por los matemáticos).
La discusión sobre la utilidad “real” de las matemáticas es más antigua que los mismos símbolos que utilizamos para escribirlas. Cuenta una vieja anécdota que el mítico Euclides, hace más de 2300 años, fue abordado sobre esto por un alumno. Lo sucedido fue, más o menos, lo siguiente:
—¿Disculpe, teacher, pero todo esto qué beneficio práctico tiene? —se quejó un joven estudiante al atisbar las indescifrables figuras geométricas que impregnaban las tablillas de cera del catedrático egipcio.
—¿Beneficio? —inquirió el profesor, arqueando las cejas— Con solo escucharme ya ganaste, mi rey. Hortencio, dale unas monedas a este muerto de hambre, ya que necesita ganar algo de lo que aprende. Y luego, que se vaya.
Esta narración, tal vez, no es históricamente exacta, pero es verdad que se cuenta que cuando Euclides (un verdadero capo de las matemáticas) fue interrogado por un pupilo sobre los beneficios de sus enseñanzas, le pidió a un esclavo (un día normal en la clásica Grecia) que le diera unas monedas de oro para que pudiera obtener una ganancia de lo que aprende, y después le demandó que se marchara.
¿Cuántos energúmenos de estos invaden nuestros entornos en la llamada “era de los datos”?, ¿cuántas monedas hemos de darles para suscitar alguna migaja de interés?
Permítanme dotar de más contexto a la primera entrada de esta humilde bitácora.
Después de 9 caóticos años dedicado al volátil sector de la analítica de datos, donde he ejercido como analista y científico de datos, por fin he organizado mis tiempos, esfuerzos, y documentos para aplicar a un posgrado en Ingeniería y Ciencia de Datos.
Mi emoción por dedicar una porción de mi (a veces muy mal empleado) tiempo a la investigación científica es llanamente inmensa, pero, como era de esperarse, la academia tiene un enfoque bastante alejado al que adoptamos en la industria.
Si bien existe un intento continuo de implementación de técnicas esencialmente matemáticas para el incremento de los ingresos de las empresas, el rigor metodológico y el conocimiento sobre los fundamentos teóricos subyacentes es, en variadas ocasiones, prácticamente inexistente (en específico, diría que este último es un mito).
Por otro lado, el primer filtro para ser admitido en el posgrado en el mismo campo es un examen de demostraciones matemáticas en los siguientes rubros: álgebra lineal, cálculo, estadística y probabilidad.
Para quienes son versados en la ciencia de datos arcaica (llamémosle así a los que empezamos en esto cuando incluso Python no era el claro favorito, o los que aún desconfiamos en cierto grado del “vibe coding“ porque sabemos que el maldito GPT comete errores incluso en aritmética elemental) este temario no es sorpresa, pero ha gatillado mis pensamientos en que se trata solo del inicio de cuatro semestres casi exclusivamente dedicados a las matemáticas y la computación (no es queja).
Aquí volvemos al punto inicial: suena rimbombante, pero ¿cuál es la utilidad de todo esto en la chamba?
Tal vez lo es (mucho) más de lo que se puede vislumbrar, y trasciende con creces al escueto ámbito laboral.
Con la explosión de la “inteligencia artificial”, de forma más puntual, del aprendizaje de máquinas, es decir, el ajuste automático de parámetros de modelos mediante el procesamiento de datos, hemos visto suscitarse una creciente ola de interés por sus grandilocuentes aplicaciones en todo el ancho del mercado.
Tenemos este tipo de técnicas matemático-computacionales inmersas hasta las narices: en los negocios pequeños, medianos y grandes, inundando el software y hardware de casi cualquier dispositivo, y con ello hemos visto nacer una gigantesca manada de gurús emergentes “expertos” en el área.
La difusión de esta clase de algoritmos es mayor, pero con ello acaece también el malentendido terminológico y la poca atención a los detalles teóricos, lo cual supone el ensanchamiento de una abismal brecha de ignorancia sobre su funcionamiento básico. He visto a directores de departamentos de inteligencia de datos emitir pomposos discursos en LinkedIn al tiempo que confunden conceptos sustanciales como “algoritmo” y “modelo”. He presenciado a supuestas eminencias del área llamar “inteligencia artificial” a procesos simples de automatización que solo implican programación tradicional. Y, en el medio de este vertiginoso circo, las desvencijadas matemáticas se ven sepultadas, pocas veces invocadas, y casi completamente desconocidas.
¿Y para qué las quiero?, ¿no deseo las monedas de Euclides?
No lo sé, pienso que comprender los fundamentos teóricos sobre las que se alza casi toda la tecnología actual no solo te vuelve excepcionalmente más competitivo en ciencia de datos (y me parece trivial siquiera discutirlo), también creo que, al final, se trata de algo radicalmente más profundo.
Euclides tiró unas monedas al quejumbroso para que estuviera contento. Hoy en día, todos se sirven de cascadas de dinero a costa de los avances científicos que procrearon al aprendizaje de máquinas. Pero el conocimiento más esencial (y, por ende, el más vital para el progreso) se ha delegado gradualmente a los mismos siervos que son invocados a las labores: las máquinas.
Las máquinas procesan datos, los transforman, aprenden de ellos, y se vuelven sabias. El conocimiento comienza a ser exclusivamente apropiado y explotado por unos cuantos sistemas computacionales, y nadie se detiene a sopesar las consecuencias.
El día de mañana puede que no haya monedas, ni preguntas, ni nada.
En el momento en que la inteligencia artificial sepa más sobre su propio funcionamiento que nosotros mismos, podremos tener la certeza de que algo va muy mal. O tal vez no la tendremos, probablemente solo nos apagarán la luz, y nos percataremos de que no poseemos el conocimiento para encender un foco, o crear uno.
Entonces, las monedas de Euclides nos parecerán artefactos inútiles.
Y la oscuridad lo consumirá todo.
