Escalar es el problema - TechDataTalk
Bienvenido a la newsletter de TechDataTalk, en esta newsletter vamos a hablar de datos, programación, negocios, ciencia y lo que vaya surgiendo la verdad
Antes de nada contarte como va a estar estructurada la newsletter, aunque muy posiblemente esto vaya variando con el tiempo
Tema del día: Siempre hablaré sobre algún tema o de lo que vaya surgiendo la verdad, siempre relacionado con datos, programación….
Paper Of The Week - aquí dejaré un paper que me haya parecido interesante y que esté chulo
This is F*ucking Science - aquí hablare sobre alguna noticia, paper o lo que sea de ciencia
Biblioteca - aquí pondré varios posts, podcast, libros… que me hayan gustado o tenga guardados y sean interesantes (no tienen porque ser “actuales”)
Así que sin más dilación vamos con el tema que quería tratar hoy, y es que hace 10 días o así publiqué este tweet y quería desarrollarlo un poco más

El problema por ejemplo en programación no es hacer un notebook con Python que clusterize 500 kws con BERT y usando los modelos de Hugging Face
Lo verdaderamente difícil es conseguir hacer eso en producción, que se puedan clusterizar millones de kws/textos en cuestión de segundos, para esto existen disciplinas como el MLOps
Con esto no quiero decir que los notebooks o cosas similares no sirven para nada, todo lo contrario, es como mejor se aprender y es la mejor manera de probar y equivocarte
Pero al final, a lo que quiero llegar, es que en lo segundo, cuando se escala, es cuando se nota la diferencia entre desarrolladores normales y gente que es capaz de hacer absolutas locuras
Al final ocurre lo mismo con disciplinas como la ingeniería de datos, donde hay mucha gente capaz de hacer pipelines que transformen y manejen datos, pero hacer pipelines que consigan datos de calidad, evitando problemas como la concurrencia… hay mucha menos
👨🎓 Paper Of The Week
DensePose From WiFi: https://arxiv.org/abs/2301.00250
Es un paper que me ha parecido muy interesante y habla sobre como gracias a las señales WiFi son capaces de reconstruir cuerpos y objetos en una sala por ejemplo
Fuente: https://twitter.com/aibreakfast/status/1613550599144091650
Últimamente se habla mucho de IAs generativas como es lógico, pero hay muchas otras áreas donde también se investiga y donde también se siguen haciendo avances
Una de estas áreas es CV o Computer Vision, básicamente, a partir de un vídeo/imagen detectar cierto tipo de patrones(personas, coches, casas…)
🧪 This is F*ucking Science
La conjetura de Poincaré - https://metode.es/revistas-metode/monograficos/la-conjectura-de-poincare.html
La conjetura de poincaré es el único problema del siglo que ha sido resuelto, fue resuelto en 2003 por el matemático ruso Grigori Perelman, que no recogió el premio de un millón de dólares ni su Medalla Fields
Es un problema relacionado con la topología, una de las áreas mas abstractas de las matemáticas relacionada con la geometría y que estudia las propiedades de objetos que se pueden deformar, doblar…
Si quieres saber más te recomiendo leer el artículo, no es mal plan para empezar la semana 🤯🤯😂
📚 Biblioteca
Para terminar voy a dejar por aquí varios posts que me han parecido bastante interesantes:
Ponencia de Cesar Aparicio en el SEO Plus de 2017 sobre Pagerank y Cadenas de Markov
Estudio de la visibilidad de los medios en la lotería de 2022, no es porque lo hayamos hecho en Keytrends, pero es la ostia, sinceramente
Web Scraping a gran escala por Zenrows, una startup muy chula de proxies
Pushear elementos HTML de forma recursiva, dependiendo el click, a GTM
Documental sobre la final de Wimbledon 2008, se lo vi a @Recuenco, y trata temas como la gestión de la presión, CPS…
Hasta aquí la newsletter de hoy, espero que te haya gustado y la semana que viene nos vemos con más y mejor!