Visión de negocio y desarrollo - Tech Data Talk

Feb 06, 2023

Muy buenas y bienvenido a la cuarta edición de Tech Data Talk!

Hoy me apetece hablar de un tema que no es muy común pero que me parece absolutamente clave y es la visión de negocio en desarrollo o programación

Siempre hablamos de que hay que buscar impactar a negocio en áreas como el SEO, SEM, ASO… lo cual es lógico y obvio, pero pocas veces hablamos de esto en desarrollo

Aunque esta responsabilidad suele caer sobre los Product Manager, los cuales se suelen encargar de priorizar y delegar(entre otras muchas cosas), y después los desarrolladores solo se dedican a ejecutar

Y bajo mi punto de vista, hacer que un desarrollador sea una máquina de cerrar tickets y desarrollar, es un fallo bastante grande, tampoco es que tengan que hacer el roadmap de producto, pero si al menos saber qué están haciendo y como va a impactar al negocio

Mucha gente cuando sale de la universidad, bootcamps, FPs… saben programar en x número de lenguajes o saben montar unas infraestructuras de la hostia (otras veces veces no tiene ni idea….) pero muchas veces aunque todo esto quede muy bonito, lo único que va a hacer es que el producto no mejore

Un claro ejemplo es el testing y la metodología TDD, hacer testing es necesario y prácticamente obligatorio, pero en una primera fase si te lías a hacer unit testing, end2end tests… entre que lo haces y no, la competencia te ha comido

Y por mucho que no nos guste(a mi el primero) el 95% de las veces no necesitas 800 microservicios, 4 tipos de BBDD y tener APIs sin latencia, básicamente, porque no tienes todavía ni un comprador

👨‍🎓 Paper Of The Week

Megatron LM - https://arxiv.org/abs/1909.08053

Megatron ML es uno de los papers más influyentes que ha habido en todo lo que respecta a los Large Language Models, fue creado por NVIDIA y publicado en 2020

Si alguna vez te has preguntado como han sido capaces de entrenar modelos como GPT-3 o T5 de Google, aquí está la respuesta

Obviamente, los equipos de Google, Open AI… no usan exactamente esto, pero si nos ayuda a entender como han sido capaces de entrenar modelos con billones de parámetros sin arruinarse

El “truco” al final está en paralelizar el entrenamiento y en ser capaces de escalar todo estos con GPUs muy potentes, en este paper hacen experimentos con varios corpus hasta el trillón de parámetros

Megatron es un tipo de transformer que es capaz de paralelizar el entrenamiento y escalar las GPUs de una manera bastante óptima y económica, eso no quita que cueste centenas de millones de dólares 😄😅

También te digo, mucho escalar pero para un trillón de parámetros han necesitado 3072 GPUs y tirar del supercomputador de NVIDIA

🧪 This is F*cking Science

𝐒𝐫𝐢𝐧𝐢𝐯𝐚𝐬𝐚 𝐑𝐚𝐠𝐡𝐚𝐯𝐚 ζ(1/2 + i σₙ )=0 @SrinivasR1729

𝐖𝐡𝐚𝐭'𝐬 𝐭𝐡𝐞 𝐫𝐨𝐥𝐞 𝐨𝐟 𝐦𝐚𝐭𝐡𝐞𝐦𝐚𝐭𝐢𝐜𝐬 𝐢𝐧 𝐀𝐫𝐭𝐢𝐟𝐢𝐜𝐢𝐚𝐥 𝐈𝐧𝐭𝐞𝐥𝐥𝐢𝐠𝐞𝐧𝐜𝐞? A small thread: Mathematics plays a crucial role in the development and advancement of Artificial Intelligence (AI). 1/n

Para esta sección no he traído ninguna fórmula ni nada, si no que hoy prefiero traer un pequeño hilo recordatorio que considero que a mucha gente le vendría bien

Y es que tanto el Machine Learning, internet, las webs… funcionan gracias a las matemáticas, y modelos como BERT o T5x no se hacen por arte de magia

Que nosotros, los mortales, podamos usarlos haciendo una simple llamada a una API Rest no significa que entiendas esos modelos

Para hacer todos estos modelos ha habido gente con doctorados en matemáticas, física.. que le ha hecho más horas que un reloj para poder desarrollador estos modelos, por ejemplo

Lo mismo es aplicable a modelos como Midjourney o sistemas de recomendación como Algolia

📚 Biblioteca

Para terminar como siempre voy a dejar algunos posts, podcast… que son bastante interesantes la verdad:

GSC + Big Query, como truco, si mezclas GSC + Airbyte + Big Query puedes hacer maravillas 😉
Case Study de SEO Internacional
Mega Guía de Análisis de Logs para SEO, una de las mejores que he leído
Manejo de Arrays gigante en Google, punto clave para los modelos de ML con muchos parámetros
Design Docs en Yotube, una vez más, la importancia de la documentación
Analizar el crawling con Diagramas de Venn en DS
Como diseñar un modelo de datos, un punto clave para los equipos de data

Hasta aquí la newsletter de hoy, espero que te haya gustado y si has llegado hasta aquí, podrías dejarme un comentario o un mensaje dando tu opinión y que te gustaría ver en las próximas newsletters

Tech Data Talk

Visión de negocio y desarrollo - Tech Data Talk

👨‍🎓 Paper Of The Week

🧪 This is F*cking Science

📚 Biblioteca

Discussion about this post