Vanity Metrics y Bullshit Data - TechDataTalk #10
Muy buenas y bienvenido a la décima edición de Tech Data Talk!
Si, la semana pasada no hubo newsletter, como excusa puedo decir que tenía tres exámenes y estaba bastante reventado después del SEO Talks
Antes de empezar, decir, que en la próxima newsletter hablaré sobre como pasar de la teoría a la práctica cuando hablamos de Machine Learning
Eso ya será la semana, hoy vengo con un tema bastante importante, y que se hila bastante bien con lo que he comentado en newsletters pasadas, vanity metrics y bullshit data
Lo primero que tenemos que hacer cuando nos llega un nuevo proyecto, es hacer una buena definición de objetivos (de esto hablaremos otro día), después de esto hay que montar KPIs junto con métricas
Todo estos nos va a permitir permitan saber que tal lo estamos haciendo y donde podemos mejorar en nuestra estrategia de SEO, SEM…
Si no sabes las diferencias entre que es un KPI y qué es una métrica, aquí te dejo un post donde se habla de ello
https://agencyanalytics.com/blog/kpi-vs-metric
A parte de esto podríamos definir a las vanity metrics como:
Métricas o KPIs fáciles de medir y que parecen asombrosas dando una sensación de crecimiento, pero que en verdad lo único que hacen es cumplir el sesgo de confirmación
Llevándolo a nuestro terreno, en el SEO podríamos definir a las vanity metrics a cosas métricas tan “simples” como:
Sesiones
Tasa de Rebote
Nu. de Páginas vistas
….
Son métricas muy fáciles de medir, que aunque consigamos que mejoren, no tienen porque tener un impacto final en el negocio y por lo tanto en el ROI
Lo único que hacen es darnos una falsa impresión de que estamos haciendo un buen trabajo, cuando no tiene por que ser así
También lo podríamos llevar a otras áreas como el desarrollo, el CRO, el SEM…
También tenemos que tener en cuenta que aunque elijamos unos buenos objetivos, KPIs… tenemos que tener mucho cuidado con la calidad de los datos que estamos usando
Y sin irnos mucho más lejos, quién no ha visto una implementación de GA o GA4 donde se están duplicando las conversiones o las sesiones
Esto en implementaciones relativamente sencillas puede ser fácil de controlar, pero cuando ya empezamos a tratar con equipos de data engineering o datos de BI, estar seguro de los datos puede ser como jugar a la ruleta
Prompt: image of a data analyst playing the roulette with their data in a casino, data, casino, lucky, data analyst --v 5
De esto hablaba en la última edición, donde comentaba que no siempre podemos guiarnos por los datos, e intentar tomar decisiones 100% racionales
Esto a veces solo puede suponer pegarnos un tiro en el pie, y tomar decisiones en datos falsos
Esto también lo hemos visto en las últimas semanas con la conexión de GSC y BQ, donde Lino ha visto como se perdían hasta un 80% de los datos desde la API
https://www.mecagoenlos.com/Posicionamiento/exporta-todos-tus-datos.php
👨🎓 Paper Of The Week
Neural Graph Reasoning: Complex Logical Query Answering Meets Graph Databases → https://arxiv.org/abs/2303.14617
Sí, hay 500 papers sobre IA que han sido publicados esta semana, y cada uno de ellos mejor que el anterior
Pero como hay tantísimo ruido y ya hay mucha gente hablando sobre todo esto, yo prefiero venir con algo diferente, además de útil
Los grafos están por todos los lados, y son estudiados a partir de la teoría de grafos, un área preciosa de las matemáticas dedicada a estudiar este tipo de estructuras
https://www.britannica.com/topic/graph-theory
Para almacenar este tipo de datos, necesitamos unas bases de datos especiales que sean optimas cuando vayamos a hacer consultas para obtener subgrafos o aplicar algoritmos, tenemos BBDD como:
Nebula
AWS Neptune
Neo4j
….
Este tipo de estructuras también tiene una gran influencia en el Machine Learning, aunque de esto hablaremos otro día, solamente te tiene que quedar que a veces hay que hacer queries muyy complejas
Prompt: image of a backend developer inside a graph database applying machine learning models to the data, machine learning, graph theory, backend developer --v 5
Bueno, pues varios investigadores de Standford, junto con Intel y la Universidad de Montreal, han creado un nuevo tipo de base de datos, llamadas Neural Graph Database
Donde hacer este tipo de queries y aplicar algoritmos sobre grafos incompletos, grafos en n dimensiones… es posible de una manera mucho más rápida
Ya para terminar con esta sección, mi charla del Brighton va a tener mucha relación con esto 😉
🧪 This is F*cking Science
Encuentran efectos antidepresivos en la ketamina → https://pubmed.ncbi.nlm.nih.gov/10686270/
Bajo mi punto de vista, uno de los temas más interesantes que existen en la medicina es el área de la neurología, para esto recomiendo este podcast de The Wild Project
Dentro de esta área no podemos negar que (algunas) drogas alteran la consciencia y que posiblemente puedan ser usadas para curar enfermedades mentales
Tal y como demuestra este paper, la ketamina (con dosis controlada) tiene efectos muy positivos contra la depresión, de hecho ya se está comercializando en España
Aquí también podemos meter otras drogas como el MDMA, LSD o el DMT, el cual es un componente de la Ayahuasca
Simplemente como conclusión, algún día dejaremos de tener tabús sobre estos temas y empezaremos a invertir recursos en investigación que seguramente nos lleven más lejos que la cancelación
Prompt: doctor using ketamine for cure depression in a patient --v 5
📚 Biblioteca
Para terminar como siempre voy a dejar algunos posts, podcast… que son bastante interesantes la verdad:
How to be successful, post muy interesante del CEO de OpenAI
Cómo Slack usa Terraform, algún día haré una newsletter sobre IaC
El rol del EEAT en Ecommerce, charlón como siempre de Lily Ray
Como todos los años, Pickaso nos trae su guía sobre factores ASO
La importancia de la orquestación en los negocios, post muy chulo de Recuenco
Hasta aquí la newsletter de hoy, espero que te haya gustado y si has llegado hasta aquí, podrías dejarme un comentario o un mensaje dando tu opinión y que te gustaría ver en las próximas ediciones