PI-Whatsapp: lee tus conversaciones, transcribe los audios y te resume lo que importa
El canal donde más trabajo se mueve es también el más difícil de gestionar.
PI-Whatsapp es uno de los productos propios que desarrollamos en nuestro Laboratorio. Conecta WhatsApp con cualquier módulo de inteligencia artificial compatible con MCP: lee conversaciones, descarga y transcribe mensajes de voz, procesa imágenes y adjuntos, y entrega una síntesis accionable en lenguaje natural.
El problema
WhatsApp es el canal de trabajo real de la mayoría de los ejecutivos en la región. Ahí viven los proyectos, los acuerdos informales, las consultas urgentes. El problema es que revisarlo sistemáticamente toma un tiempo que no siempre está disponible: hay múltiples grupos activos, conversaciones individuales que se acumulan, y mensajes de voz que requieren abrir la aplicación y escucharlos uno por uno.
El resultado es que información importante queda enterrada. Un mensaje clave llega en medio de un hilo de treinta, o en un audio que nadie tuvo tiempo de reproducir. La carga de procesar ese canal recae sobre la persona, en los momentos en que ya tiene suficiente carga encima.
Cómo funciona
Desde una sesión de Claude Code se puede preguntar: ¿Qué mensajes nuevos tenemos del cliente X? o Resumime el grupo Proyecto Y de los últimos dos días. PI-Whatsapp lee las conversaciones indicadas, identifica lo relevante y presenta una síntesis accionable. No hay que abrir WhatsApp, no hay que desplazarse entre grupos ni conversaciones.
Los mensajes de voz reciben el mismo tratamiento que el texto. PI-Whatsapp los descarga, los transcribe automáticamente y los incorpora al resumen junto con el resto de la conversación. Lo mismo ocurre con imágenes y archivos adjuntos: se procesan y se integran al resultado. La síntesis es completa independientemente del formato original de cada mensaje.
El servicio también permite registrar un nombre legible para cada número de teléfono, lo que hace las consultas más naturales y los resultados más fáciles de interpretar. Y permite buscar en el historial de conversaciones por términos o frases cuando se necesita localizar algo específico.
Notas técnicas
PI-Whatsapp implementa el Model Context Protocol (MCP), un estándar abierto que define cómo los módulos de inteligencia artificial invocan herramientas y fuentes de datos externas. El servidor expone herramientas para leer chats, descargar medios, buscar en el historial y gestionar alias. Cualquier agente de IA compatible con MCP puede conectarse al mismo servidor: PI-Whatsapp no está acoplado a Claude Code ni a ningún modelo específico.
El stack: Python con FastMCP como framework de servidor MCP. La conexión con WhatsApp se realiza a través de un bridge propio que gestiona la autenticación y el acceso a los mensajes. Para la transcripción de audios, el servicio delega en Google Cloud Speech-to-Text a través de nuestro servicio STT interno, también disponible como MCP en la misma infraestructura. El almacenamiento local de mensajes usa SQLite. El servicio corre como unidad systemd con transporte SSE, Toda la información permanece dentro de nuestra red local.