Visión de negocio y desarrollo - Tech Data Talk
Muy buenas y bienvenido a la cuarta edición de Tech Data Talk!
Hoy me apetece hablar de un tema que no es muy común pero que me parece absolutamente clave y es la visión de negocio en desarrollo o programación
Siempre hablamos de que hay que buscar impactar a negocio en áreas como el SEO, SEM, ASO… lo cual es lógico y obvio, pero pocas veces hablamos de esto en desarrollo
Aunque esta responsabilidad suele caer sobre los Product Manager, los cuales se suelen encargar de priorizar y delegar(entre otras muchas cosas), y después los desarrolladores solo se dedican a ejecutar
Y bajo mi punto de vista, hacer que un desarrollador sea una máquina de cerrar tickets y desarrollar, es un fallo bastante grande, tampoco es que tengan que hacer el roadmap de producto, pero si al menos saber qué están haciendo y como va a impactar al negocio
Mucha gente cuando sale de la universidad, bootcamps, FPs… saben programar en x número de lenguajes o saben montar unas infraestructuras de la hostia (otras veces veces no tiene ni idea….) pero muchas veces aunque todo esto quede muy bonito, lo único que va a hacer es que el producto no mejore
Un claro ejemplo es el testing y la metodología TDD, hacer testing es necesario y prácticamente obligatorio, pero en una primera fase si te lías a hacer unit testing, end2end tests… entre que lo haces y no, la competencia te ha comido
Y por mucho que no nos guste(a mi el primero) el 95% de las veces no necesitas 800 microservicios, 4 tipos de BBDD y tener APIs sin latencia, básicamente, porque no tienes todavía ni un comprador
Además todo esto NO impacta a negocio ni a producto, lo hará en una fase más tardía donde no te puedes permitir caídas, latencia… pero no al principio
De todas estas cosas parten muchas discusiones con los equipos de IT y el hecho de priorizar ciertas cosas sobre, por ejemplo, arreglar los hreflang de una web multidioma que está haciendo que se canibalice el contenido
Y seguramente, arreglar esos hreflang va a impactar mucho más a negocio que refactorizar una parte del código
Por eso es que muchas de estas “discusiones” se solucionarían explicando desde el minuto 0, empezando por la educación, a los desarrolladores que hay que buscar un impacto en negocio, priorizar ciertas cosas sobre otras… y no tener un código perfecto
👨🎓 Paper Of The Week
Megatron LM - https://arxiv.org/abs/1909.08053
Megatron ML es uno de los papers más influyentes que ha habido en todo lo que respecta a los Large Language Models, fue creado por NVIDIA y publicado en 2020
Si alguna vez te has preguntado como han sido capaces de entrenar modelos como GPT-3 o T5 de Google, aquí está la respuesta
Obviamente, los equipos de Google, Open AI… no usan exactamente esto, pero si nos ayuda a entender como han sido capaces de entrenar modelos con billones de parámetros sin arruinarse
El “truco” al final está en paralelizar el entrenamiento y en ser capaces de escalar todo estos con GPUs muy potentes, en este paper hacen experimentos con varios corpus hasta el trillón de parámetros
Megatron es un tipo de transformer que es capaz de paralelizar el entrenamiento y escalar las GPUs de una manera bastante óptima y económica, eso no quita que cueste centenas de millones de dólares 😄😅
También te digo, mucho escalar pero para un trillón de parámetros han necesitado 3072 GPUs y tirar del supercomputador de NVIDIA
🧪 This is F*cking Science

Para esta sección no he traído ninguna fórmula ni nada, si no que hoy prefiero traer un pequeño hilo recordatorio que considero que a mucha gente le vendría bien
Y es que tanto el Machine Learning, internet, las webs… funcionan gracias a las matemáticas, y modelos como BERT o T5x no se hacen por arte de magia
Que nosotros, los mortales, podamos usarlos haciendo una simple llamada a una API Rest no significa que entiendas esos modelos
Para hacer todos estos modelos ha habido gente con doctorados en matemáticas, física.. que le ha hecho más horas que un reloj para poder desarrollador estos modelos, por ejemplo
Lo mismo es aplicable a modelos como Midjourney o sistemas de recomendación como Algolia
📚 Biblioteca
Para terminar como siempre voy a dejar algunos posts, podcast… que son bastante interesantes la verdad:
GSC + Big Query, como truco, si mezclas GSC + Airbyte + Big Query puedes hacer maravillas 😉
Mega Guía de Análisis de Logs para SEO, una de las mejores que he leído
Manejo de Arrays gigante en Google, punto clave para los modelos de ML con muchos parámetros
Design Docs en Yotube, una vez más, la importancia de la documentación
Como diseñar un modelo de datos, un punto clave para los equipos de data
Hasta aquí la newsletter de hoy, espero que te haya gustado y si has llegado hasta aquí, podrías dejarme un comentario o un mensaje dando tu opinión y que te gustaría ver en las próximas newsletters