'''Walter Sosa Escudero''' PRESENTACIÓN * Walter Sosa Escudero es economista pero le gusta definirse como econometrista ha llegado a los más altos cargos de la academia, de la investigación y la docencia a lo que le agrega una relevante agenda de divulgación científica. Yo rescato que Walter es un científico creativo, innovador, comprometido y apasionado con lo que hace. Concurrí a una clase en la que él enseñó a otros profesores el uso del PPT como herramieta pedagógica. Fue algo memorable. Walter es divertido, irónico, humilde, honesto y lo que hace es, disfrutable y útil. Estas cualidades se trasladan a sus tres libros publicados '''Que es (y que no es) la Estadística''' (Siglo XXI, Colección Ciencia Que Ladra) '''Big data. Breve manual para conocer la ciencia de datos que ya invadió nuestras vidas''' (Siglo XXI),y el último libro y del que conversaremos hoy''' Borges, Big Data y yo. Guía nerd (y un poco real) para perderse en el laberinto borgeano.''' Buenos Aires. Siglo XXI *Walter, antes de que Marta, Alejandro y Carlos inicien el intercambio con vos, me gustaría preguntarte si sabés por qué te llamás Walter que es un nombre de orígen germánico y la unión de dos palabras “wald-hari”, y cuya traducción significaría algo parecido a “Líder del ejército”, “Aquel que lidera al ejército”. ------ CURRÍCULUM Doctor en Economía por la Universidad de Illinois,y Lic. en Economía (UBA), se especializa en econometría y estadística aplicada a cuestiones sociales. Tiene un frondoso curriculum Profesor de la escuela de economía de la UdeSA, director del dpto de economía ASus trabajos de investigación se encuentran en publicaciones nacionales e internacionales de primer nivel. Es profesor de tiempo completo en la Universidad de San Andrés, en la cual ha dirigido su departamento de Economía y sus programas de maestría y licenciatura. Es profesor titular de Econometría en la Universidad Nacional de La Plata e investigador invitado del Centro de Estudios Distributivos, Laborales y Sociales (CEDLAS). Vista recurrentemente la Universidad de Illinois, donde dicta clases de grado y posgrado. l. '''BORGES, BIG DATA Y YO''' * PreambuloPrefacioPrologoIntroduccion ' Se habla * '''Diego Andrés Golombek''' "Somos producto del azar y el error pero con un destino que no será ni el error ni el azar" Ernesto Cardenal. fue un poeta, sacerdote, teólogo, escritor, traductor, escultor y político nicaragüense.​RESULTA MUY OPORTUNO QUE justamente CITARA ese poema El CALCULO INFINITESIMAL DE LAS MANZANAS DICE '''Y este planeta raro del sistema solar que girando, girando, se entendió a sí mismo. Adquirió mente y amor.''' * Es doctor en Ciencias Biológicas y divulgador científico argentino, especialista en cronobiología. Se desempeña como profesor titular regular de la Universidad Nacional de Quilmes y como investigador superior del CONICET. Que incluye un epígrafe de Ernesto Cardenal.El libro es como una caja de sorpresas, donde uno va encontrando a Borges, por supuesto, a la estadística y al big data, pero sobre todo uno disfruta de no saber qué nos depara el capítulo siguiente con subtítulos, ejemplos de lo más provocativos. '''INTRODUCCIÓN''' * Uno podría hablar del encuentro con Borges y con Manuela Carone. Borgesdata '''CAPÍTULO UNO''' * Borges y la Kryptonita de la ciencia de los datos. * Funes el memorioso * Del rigor en la ciencia '''Borges dice en su verso COSMOGONÍA:''' Ni tinieblas ni caos. La tiniebla requiere ojos que ven, como el sonido Y el silencio requieren el oido, y el espejo la forma que lo puebla Y vos decis, que big data requiere de una idea y una comunicación apropiada. ¿Cómo es eso? Pag.40 El trabajo de la estadística no es sólo numérico sino también social y comunicacional. ...La necesidad de construir consensos...tal vez el desafío que plantea la masividad de los datos es el de la construcción de convenciones útiles. '''CAPÍTULO DOS''' Cinco problemas para Jorge Luís Borges Evaristo Carriego Pierre Menard, el autor del Quijote y Emma Zunz PAG, 59. La idea de medir el paso del tiempo usando algo que no es justamente el tiempo es algo recurrente en la obra de Borges y además es un concepto fundamental en el análisis de datos. Borges propone dejar de medir la vida por cuánto tiempo transcurre y comenzar a tomar en cuenta la acumulación (la densidad permite medir cuánto se acumula en cualquier eje) ahora que comenzamos a hablar de edades líquidas ¿cómo es este concepto de Borges de dejar de medir la vida por el tiempo que transcurre? ¿Cómo lo explicarías? '''CAPÍTULO TRES''' Big Databorges La biblioteca de babel Pag 89. La información básica del traductor de Google fueron los documentos oficiales de Naciones Unidas que por regla tienen que ser traducidos a los seis idiomas oficiales de esa institución. ..y decís en tu libro: Los datos por sí solos no producen traducciones "por generación espontánea" sino que se basa en una búsqueda inteligente y enformada como la realizada por los expertos de la ONU. Pag 91. Vos citás a Borges que en la Biblioteca de Babel dice: la biblioteca produce una "extravagante felicidad y también una "una depresión excesiva" algo similar decis, ha ocurrido con internet y la explosión de los datos. Hay personas que hablan de un capitalismo de la vigilancia y ven a la tecnología como una herramienta del abuso de gobiernos autoritarios y otras que entienden el tema del Big data y los algoritmos como la fuente de la riqueza moderna y la solución de todos los problemas. ¿Cuál es tu análisis? Pag 92. El problema con la Biblioteca de Babel es que la búsqueda ciega es capaz de generar datos, pero no necesariamente información. Pag. 97. Correlaciones espúreas.La velocidad en la que uno tendria que leer Borges. También hablás del tema de releer a Borges, y quiero traerte una idea directa de Borges cuando hace referencia a su primer contacto con el Dante- La Divina Comedia: '''CAPÍTULO CUATRO''' Al infinito y más acá El jardín de los senderos que se bifurcan Pag. 105 En el laberinto del jardín de Borges no se sale por arriba como aconsejaba Leopoldo Marechal porque es un laberinto que no existe en el espacio sino en el tiempo y nos remite a los universos paralelos, a los multiversos, a las perturbadoras teorías de los mundos paralelos, horizonte de sucesos, est. Conceptos con los que se sienten más cómodos los que poetas como H.P.Lovecraft y Borges que los físicos, por ahora. Pag.107 "El Jardín" permite pensar en las relaciones causa efecto, un problema fundamental de la ciencia de los datos, podría decirse que la história de la ciencia es un esfuerzo épico (y existoso) de lidiar con esta delicada cuestión. Pag. 108. La falacia de la correlación. Falacia esun argunmento que parece válido pero no lo es. Correlación entre la cantidad de lluvias y la cantidad de familias que tienen un paraguas. En Buenos Aires llueve por la insistencia de los porteños en usar paraguas. Estamos convencidos del rol crucial de la educación como motor del bienestar, pero Pag. 113 El Nobel a Esther Duflo es también un merecido reconocimiento a las mujeres en la ciencia social, eternamente postergadas...¿Podrías ampliarlo? Pag. 115 La relación entre parte y todo cumple un lugar central en la matemática y la estadística. Es difícil la comparación entre censo y muestra. En apariencia, una muestra es una parte del censo y cuando está bien diseñada, parece ser un compromiso razonable entre lo extremo del censo y la nada. '''CAPÍTULO CINCO''' El idioma analítico de John Wilkins El Golem, Ajedrez El idioma analítico de John Wilkins, una lúcida reflexión sobre la posibilidad de ordenar el universo. Pag. 136 con la figura de "pantalones chupines de colores y barbas", para señalar a personas actuales y modernas quizás podrías sacar lo de la barba para incluir en la comparación a las mujeres. '''EPÍLOGO''' Un Aleph de 3 cm Pag. 164 Uno de los puntos del espacio que contiene todos los puntos.Ante la grandeza del Aleph solo se me ocurre escribir: leánlo. Te sentirías satisfecho si alguna persona lectora, gracias a este libro se anima a leer a Borges, yo, dice Walter no pude decírselo en vida a Manuela Carone. '''AGRADECIMIENTOS''' Me emocioné con el hecho de 30 años de profesor, y de vida académica en UdeSA y tu reconocimiento por el espíritu interdisciplinario y libre que allí se respira. Diego Golombek, a la cabeza de la colección Ciencia que ladra. ---- ENTREVISTAS A SOSA ESCUDERO. * Patricio Zunini- ¿Qué debe aprender Netflix de Borges? https://www.infobae.com/cultura/2020/12/20/que-debe-aprender-netflix-de-borges/ Borges, Big data y yo entra en una tradición de libros que aborda la relación entre Borges y las diferentes ramas de las ciencias formales: la antología Borges y la ciencia, compilada por Eudeba y con prólogo de María Kodama, Borges y las matemáticas, de Guillermo Martínez, Borges y la física cuántica, de Alberto Rojo. La lista, como cabe a una serie borgiana, podría extenderse hacia el infinito. Pero no deja de ser una característica muy llamativa, dado que el propio Borges había admitido que tenía rudimentarios conocimientos de matemática.En ‘La biblioteca de Babel’, Borges plantea una tremenda cantidad de preguntas acerca de la tensión entre lo finito y lo infinito, de la posibilidad de buscar y encontrar, de qué significa que una cosa sea más grande que la otra. Es el tipo de cosas que un científico pretende hacer; la tarea del científico no es dar respuestas sino generar preguntas”.Del rigor de la ciencia —Alguna vez Borges dijo que había dos clases de mentiras: la psicología y la estadística. ¿Cómo se puede leer esa frase a la luz de tu libro? —Qué tiene que ver la estadística con Borges: bueno, uno de los temas más recurrentes de Borges es la tensión entre la realidad y su representación. En “Funes el memorioso”, Borges dice: “Intentaré resumir con veracidad las muchas cosas que me dijo Ireneo”. Y resumir con veracidad es casi una descripción de la tarea de la estadística. Es algo aparentemente contradictorio resumir y ser veraz, porque toda vez que uno quiere resumir parece estar faltando a la verdad. Pero, justamente, el objetivo de la ciencia es quedarse con la verdad a través del resumen. Pensemos en el juego que hace Borges con “Del rigor en la ciencia”, donde un grupo de cartógrafos hace un mapa escala uno a uno. La ciencia ocurre con un propósito y, si uno se lo saca, termina representando al mundo en su forma más trivial. Yo creo que una de las cosas por las que te gusta tanto Borges es su pasión por el infinito. —En el libro digo que, si vos decís tres veces infinito, el espíritu de Borges empieza a flotar por donde estás. La estadística vive del infinito. Si pudiésemos lanzar una moneda infinitas veces, aprenderíamos que las chances de que salga cara o ceca son 0.5. Ese razonamiento, que se llama “Ley de grandes números”, pide a gritos la presencia del infinito. Y el resultado a partir del cual puedo aprender algo por replicarse infinitas veces tiene un nombre muy simpático: se lo llama “Teorema fundamental de la estadística”. Si veo cómo algo se replica entiendo su esencia. La estadística vive en esa esperanza de ver replicar las cosas infinitas veces. En la práctica no se da infinitas veces sino en un número lo suficientemente grande, pero es la esperanza del infinito lo que permite que la estadística viva. Big data te ofrece un montón de información que es interesante, pero que no es completa ¿Qué tiene que aprender Netflix de Borges? —Es un poco contradictorio lo que puede aprender Netflix del infinito y de Borges. Porque Netflix nos ve en los senderos del jardín que hemos visitado, pero no en los otros que no visitamos. Qué quiero decir: Netflix ve un enorme derrotero de lo que estoy haciendo, pero quizá mañana camino por otro sendero, y Netflix querría mantenerme eternamente cerca de donde yo ya estaba. Lo interesante es cómo señalarle a Netflix que existimos también en otros senderos, porque parte de la esencia del ser humano es saltar rápido a otros senderos del jardín. Ese es el problema de Netflix y los algoritmos: por un lado, tienden a pensar que somos las personas más conservadoras del mundo, pero por otro lado sabe que estamos dispuestos a pegar esos saltos. Esos saltos… borgianos, si se quiere. * TED-https://www.youtube.com/watch?v=hODwSUX0kT4 Las estadísticas nos rodean, están por todas partes. La econometría es una disciplina que se encarga del uso de métodos estadísticos, numéricos, computacionales y matemáticos en la economía pero en general en las ciencias sociales. En la estadística se hace hablar a la parte por el todo. Compara la estadística con el censo. El censo abarca toda la población, es decir el total del universo a medir lo cual es muy esforzado y caro. La estadística plantea un balance entre aquello que es útil pero impreciso y aquello que es preciso pero inabarcable. Hay estadísticas enormes, que manejan infirnidad de datos y otras que son sutiles. Una custionario estadístico bien diseñado tiene que poder iluminar aquello que por sus características no es evidente, como el delito, por ejemplo, o acciones que son perfectamente legales no tienen porqué pasar por las encuestas. Se tiene que poder medir la economía oculta en Argentina. El 24% de la economía argentina es oculta. Si no tuvieramos tolerancia al error no tendríamos información sobre el desempleo en Argentina. Ya que el desempleo se mide bien cada diez años. Comenta lo que describe Borges es su texto sobre el rigor en la ciencia, desarrollaron tal grado de pericia que llegaron a que el mapa tuviera el mismo tamaño del imperio. Las impreciosiones. Es una imprecisión que sucede porque es una simplifcación conveniente. Una simplificación útil. * ¿QUÉ ES EL BIG DATA? https://www.youtube.com/watch?v=xacxoydf5Z8 - Lo más trivial es decir que big data es muchos datos. * Pablo Mira Docente e investigador de la UBA- Comentario sobre su libro: borges, big data y yo. https://eleconomista.com.ar/2020-12-borges-big-data-y-walter-sosa-escudero/ Mágico libro de Walter Sosa Escudero: “borges, big data y yo” (sin mayúsculas en el original). * La tarea de decir algo atrayente sobre los involucrados no es sencilla. Jorge Luis Borges fue uno de los mejores escritores que hayan habitado el planeta, y un prologuista magistral. Walter Sosa Escudero, si bien algo más humano, es un prodigio intelectual que no para de incorporar nuevos intereses, y mejorar los que ya domina. * Casi sin proponérselo, Walter transfunde en cada ensayo una clase consumada acerca del significado del conocimiento científico, y este ejercicio metodológico virtual supera un nuevo límite al referirse a la inmensa figura de Borges. Tras leer el libro, se hace difícil comprender cómo a Don Jorge Luis le ha sido negado un Premio Nobel, incluso en la más modesta categoría de Literatura * https://www.youtube.com/watch?v=Qm-K1oZMYJc no somos tan inocentes brindamos datos, porque nos conviene. Están los algoritmos, la inteligencia artificial. También están las personas haciendo preguntas. Las personas que tienen la capacidad de hacer preguntas están contratadas por las compañias. Es cierto que los datos tienen dueño. Es cierto que hay alguien que tiene alguna ventaja pero posiblemente alguien con menos datos y más inteligencia puede tener un costado hacker que con inteligencia puede crear algo que el Estado no lo logra. Manuel Aristarain, creo un robot con preguntas que le permitían al ciudadano tener información útil. No se tiene claro quién tiene el poder. * Capitalismo de la vigilancia - Hay mercado de los comportamientos futuros. la profesora de Harvard Soshana Zuboff es considerada el Carlos Marx de nuestra época. https://www.youtube.com/watch?v=V1iKDuYhXn8 porqué hablar de vigilancia, porque son operaciones, herramientas y dispositivos que han sido diseñados para que sean indetectables, indescifrables que se ocultan en la retórica (el futuro es privado/ Queremos empoderar al individuo) con la intención de que sean incomprensibles. La persona que contesta no me importa que tomen mis datos, yo no tengo nada que ocultar, incurren en un error conceptual.. .los rastros digitales que dejamos, datos residuales que dejamos sin darnos cuenta. Es cierto que algunos los utilizan para mejorar los servicios. Pero, se utilizan realmente para comprender las pautas de comportamiento y una vez comprendidos esos modelos ver cómo se van modificando a lo largo del tiempo y predecir tu comportamiento futuro. Excedentes conductales, ellos piden más datos de los que necesitan para mejorar sus servicios. Y una vez que tenés toda esa información podés comenzar a descubrir cuáles son las preferencias de determinados grupos.Lo que importa no son las fotos sino los signos predictos que se consigen. Esta información residual y su utilización predictiva es vendida y se provee a las empresas y países. Por ejemplo, la profesora Soshana Zuboff afirma que se le han vendido con fines militares a países como China que los utiliza para controlar a la minoría de los vigures (un grupo musulman minoritario) en lo que se llaman cárceles al aire libre o prisiones a cielo abierto porque no los tienen que poner detrás de las rejas, ya que los tienen controlados electrónicamente a través del reconocimiento facial. O que ayudan a detectar a los defensores de la democracia en Hong Kong No especulan con nuestras fotos familiares sino con la '''información residual''' que ellas proveen. Cambridge Analytica- * LA REPREGUNTA: ¿Qué es el capitalismo de vigilancia? De Big Brother a Pokemon Go. Shoshana Zuboff, Doctor en Psicología Social. Entrevista con Luciana Vázquez https://www.youtube.com/watch?v=zRPuih415YQ Se necesitan varias cuestiones para que esto funcione.Primero se necesitan una gran cantidad de datos. * No estás dando algo gratis porque tenés beneficies. No estamos dando algo sin recibir. A veces se piensa que los datos que circulan hoy en día parecen poco relevantes, hay una masa de datos que importa conocer la relevancia. Hay ciertas cuestiones y datos, mediciones que vienen con ruído. La pregunta si esta tecnología se la tecnología de big data va a mejorar algo de lo que hacemos. El conocimiento relevante puede producirse pero yo no sería muy optimista. Si una se deja guiar por los telefonos celulares es información que está sesgada, se mide algo que no se sabe qué universo está representando. La información de big data es completamente espontánea. La información no es ni nada ni todo. No se puede interpretar los datos linealmente. El algoritmo va detrás de los datos, si aparecen los sesgos el algoritmo los detecta y los reproduce, son máquinas de buscar patrones, repeticiones. * El futuro es de los matemáticos, desarrolladores de softwear e ingenieros o de sociólogos y políticologos, en realidad es de quienes sean capaces de hacer preguntas correctas porque si no los datos te dicen lo que querés escuchar. Son importantes el estudio de la matemática, del derecho, es importante tener posturas filosóficas profundas, Porque ante el aluvión de datos y algoritmo el próximo desafío es hacer las preguntas correctas. * Charla de auot-ayuda estadística. Innovación Sin Humo Vol. 7 - Big Data: Walter Sosa Escudero Esto fue el Vol. 7 de Innovación Sin Humo, el miércoles 14 de agosto de 2019 en el Cultural San Martín, con el track de Big Data. https://www.youtube.com/watch?v=AYEFo4uNyCU Contarles una historia. Una chica que se llama Alice Wu, se vio envuelta en un escándalo mayor. Era estudiante de la universidad de Berkeley en California. Quería ver una manera de medir la discriminación contra las mujeres, es difícil de medir porque suele mimetizarse bastante bien. Cuando uno mira los espacios de la academia no es evidente la discriminación. Hizo algo bastante parecido a meterse en el baño y escuchar las conversaciones que tiene la gente cuando cree que no la están escuchando. Son chismes laborales. El primer ejercicio clasificar post: referido a hombres, referido a mujeres, sin referencia a un género, neutral. Ella entrenó un algoritmo para que ordene los post con este criterio. Luego preparó otro algoritmo aplicó un método predictivo¨cuáles son las tres palabras que mejor predicen que el aviso trata de un hombre: macro economía, tesis, director. Las tres palabras que mejor predice que el post se referira a una economista mujer: las tres palabras, histérica, embarazada, tetas. Un periodista lo tomó y se armó un escándalo. Harvard la tomó a Alice Wu. ¿Por que todos los componentes de big data están presentes en esta historia? Datos es cualquier cosa que es pasible de ser estudiada sistemáticamente. Son espontáneos, uno se mete en un blog a chusmear. * Entonces, tomar en cuenta los datos, los algoritmos, una idea, una forma de reproducirla, replicable, que no dependa de una opinión. La gran contribución de Alice Wu, fue que no dijo si hay o no discriminación, dijo hay discriminación y yo puedo medirla, reproducirla y monitorearla. No fue data, no fue algoritmo, fue una idea. Y el otro componente es que esto explota porque alguien comunica bien. * El tema de la visualización, el lenguaje escrito, forma parte de la ciencia de los datos. Tema de barbas y chupines, me parece una analogía un poco sesgada que por lo de la barba deja afuera a las mujeres. * primero hay dato, luego hay un algoritmo que predice, luego hay dos cosas que son importantes: a alguien se le ocurrió que se puede medir, y la puede comparar, que sea replicable. * Siempre que hubo una revolución de datos después vino una revolución de ideas.25.28 * ¿Cómo se retroalimentan las encuestas con el Big Data? las encuestas se hacen por el teléfono de línea.En mi teléfono de línea habla mi madre, mi suegra y Rodriguez Larreta. En el futuro, big data puede informar muy bien acerca de la heterogenidad de las personas.La criptonita de una encuesta es la heterogeneidad. * La escaces puede pasar por las ideas, por el plano ético. Cuando llueve sopa la persona que gana es la que tiene la cuchara lista. En ecología hay una ley que es la ley del mínimo que dice que lo que importa para la evolución de un organismo es el recurso más escaso. Vos tenés una planta y no podés compensar con más luz la escasez total de agua.La próxima analogía estará gobernada por esa analogía ecológica tenemos que ponernos a pensar cuál va a ser el recurso escaso. Cuando yo comencé a estudiar, dice Sosa Escudero, en la estadística era la falta de datos y la lentitud de las computadoras. El recurso escaso son las ideas seminales, la magnitud de la pobreza, o ese tipo de temas piden a gritos herramientas analíticas, pero las cuestiones estratégicas están todavía un poco ajenas a la revolución de los datos. Tenemos que buscar donde es está el factor de escasez, a mi juicio, dice Sosa Escudero, no sabemos dónde están los límites éticos de esto, no sabemos cómo regularlo, y el que puede ganar con big data el que tiene ideas de cómo usarlos. * El tema de la regulación de los datos, implica que las cosas se queden más o menos quietas. Yo no me baño porque me voy a ensuciar de vuelta. Andar regulando en el medio de una revolución es complejo. * Los que toman aspirinas tienen la temperatura más alta entonces el big data puede entender que la aspirinas levanta la temperatura. * Me gusta más que hablar de big data hablar de New data. * Google Earth es un experimento que comenzó y financió la CIA