Open Hardware · Linux · Superagente IA Intercambiable · Audio HiFi
Cubo
Inteligente
Gadget open source para el superagente, interactúa con la red con alta fidelidad.
112 dB
SNR Audio
10 W
Amplificación
<75°C
Temp. máx
~€210
Coste BOM
Scroll
01
Arquitectura
System OverviewEl Cubo Inteligente es el hogar físico de un superagente de IA. Corre Linux y aloja un agente intercambiable — como Cowork, OpenClawd u otros — que se conecta a la nube para pensar, hablar y actuar. Interactúas con él por voz, pantalla táctil, o desde tu móvil vía WhatsApp y Telegram. El agente puede ir sumando funcionalidades de software (plugins, skills, integraciones) y de hardware (sensores, periféricos) con el tiempo.
Entrada
Voz · Táctil · Chat
Micrófonos MEMS, pantalla táctil, WhatsApp, Telegram
Base
Linux · CM4
RPi OS Lite, Docker, PipeWire — el sistema anfitrión
Cerebro
Superagente IA
Cowork / OpenClawd — intercambiable, modular, con plugins expandibles
Audio
DAC + Amp HiFi
PCM5122 → MAX98357A → 2× Full-Range 3″
Salida
Voz · Pantalla · Chat
Respuesta por audio HiFi, display táctil y mensajería móvil
02
Superagente
IA ModularEl corazón del Cubo es un superagente de IA que vive dentro de Linux. Es intercambiable — eliges qué cerebro usar — y evoluciona contigo, sumando capacidades de software y hardware con el tiempo.
Motor Intercambiable
Plug & Play
Cambia entre agentes como Cowork, OpenClawd u otros. Cada uno trae sus propias capacidades. Swap por config YAML o desde la pantalla.
WhatsApp · Telegram
Chat Nativo
Habla con tu Cubo desde cualquier lugar. El agente responde, ejecuta tareas y te mantiene informado por chat desde tu móvil.
Plugins Expandibles
∞ Módulos
Calendario, domótica, música, noticias, rutinas… Añade skills al agente como apps. Ecosistema open source.
Crece con el Tiempo
SW + HW
Actualizaciones OTA de software. Conecta sensores, relés o cámaras vía GPIO/I2C/USB y el agente aprende a usarlos.
03
Especificaciones
HardwareRaspberry Pi CM4
4 GB / 32 GB
BCM2711 Quad Cortex-A72 @ 1.5GHz. RAM LPDDR4, eMMC onboard. WiFi 5 + BT 5.0
IPS Rectangular
5″ 800×480
Panel IPS, interfaz DSI. Táctil capacitivo I2C. Brillo 400 nits. Ángulo visión 178°
DAC + Amp Clase D
112 dB · 10 W
PCM5122 → MAX98357A. 2× drivers full-range 3″. Cámara sellada interna.
Array MEMS I2S
2× ICS-43434
SNR 65dB, -26dBFS sensibilidad. AEC + beamforming por software (SpeexDSP)
WiFi + Ethernet
802.11ac
Siempre conectado. WiFi 5 dual-band integrado + puerto Ethernet Gigabit en IO Board
Nogal CNC
200×120×180
Nogal americano, pared 8mm, juntas a inglete. Acabado aceite tung. Sin bordes redondeados.
Disipación Pasiva
< 75°C
Disipador aluminio 40×40mm con pad térmico. Ventilación natural por rendijas traseras.
USB-C PD
15 W typ
5V/3A estándar. Sin batería — alimentación permanente. LED de estado en panel trasero.
04
Dimensiones
MecánicoAncho exterior
200 mm
Pared 8mm × 2 + cavidad 184mm
Profundidad
120 mm
Zona electrónica 55mm + zona acústica 57mm
Altura
180 mm
Display 5″ frontal superior + grille inferior
Espesor pared
8 mm
Nogal americano, junta a inglete 45°
Peso estimado
~1.2 kg
Con electrónica y drivers montados
Pantalla
5″ · 800×480
IPS, interfaz DSI, táctil capacitivo
05
Bill of Materials
Coste Estimado| Componente | Referencia | Cant. | Fuente | € Unit. | € Total |
|---|---|---|---|---|---|
| SoC — Compute Module 4 | CM4104032 | 1 | Farnell | 75,00 | 75,00 |
| IO Board para CM4 | CM4IO | 1 | Farnell | 35,00 | 35,00 |
| Display 5″ IPS DSI táctil | WF50BTIAGDNG0 | 1 | Waveshare | 32,00 | 32,00 |
| DAC I2S — PCM5122 | PCM5122-HiFiBerry | 1 | Mouser | 12,00 | 12,00 |
| Amplificador Clase D | MAX98357A-BOB | 1 | Adafruit | 6,00 | 6,00 |
| Altavoz full-range 3″ | FR-3X-4OHM | 2 | AliExpress | 5,00 | 10,00 |
| Micrófono MEMS I2S | ICS-43434-BOB | 2 | Adafruit | 6,50 | 13,00 |
| Disipador aluminio 40×40 | HS-4040-AL | 1 | Amazon | 3,00 | 3,00 |
| Fuente USB-C 5V/3A | PSU-15W-PD | 1 | Amazon | 8,00 | 8,00 |
| Madera nogal + mecanizado CNC | WNT-200×120×180 | 1 | Local CNC | ~15,00 | ~15,00 |
| Total estimado BOM | ~€ 209 | ||||
06
Stack Software
Agente + LinuxSistema Base (Linux)
OS
Raspberry Pi OS Lite (64-bit Bookworm)
Audio
PipeWire 0.3+ con WirePlumber
Display
Cage (Wayland) + WebView (WebKitGTK)
Containers
Docker — cada agente corre aislado
Init
systemd — auto-login, servicio al boot
Superagente IA
Runtime
Python 3.11 + asyncio
Agente
Cowork / OpenClawd (intercambiable)
STT
Whisper API (cloud)
LLM
GPT-4o / Claude / otros (configurable)
TTS
ElevenLabs / OpenAI TTS API
Plugins
Skills modulares — domótica, rutinas, música…
Conectividad + Mensajería
WhatsApp
API Business / Baileys — chat bidireccional
Telegram
Bot API — comandos, notificaciones, media
Config
mDNS + portal web local para setup WiFi
OTA
Actualización remota via SWUpdate
API
REST local para integración y expansión HW
07
Roadmap
10 SemanasFase 1 · Semanas 1–2
Electrónica + Validación
Montaje CM4 + IO Board sobre protoboard — flash Raspberry Pi OS Lite 64-bit.
Conexión display DSI — verificar resolución 800×480, táctil I2C.
Cableado DAC PCM5122 (I2S) + amplificador MAX98357A — test tone 1kHz.
Micrófonos ICS-43434 I2S — grabación estéreo, validar SNR.
Conexión display DSI — verificar resolución 800×480, táctil I2C.
Cableado DAC PCM5122 (I2S) + amplificador MAX98357A — test tone 1kHz.
Micrófonos ICS-43434 I2S — grabación estéreo, validar SNR.
Fase 2 · Semanas 3–4
Linux + Infraestructura del Agente
Configurar PipeWire con perfiles I2S para DAC y micrófonos.
Instalar Docker — crear estructura de contenedores para agentes intercambiables.
UI en WebView (Cage/Wayland): pantalla de estado, selector de agente, widgets.
Integrar SpeexDSP para AEC y beamforming en el array de micrófonos.
Instalar Docker — crear estructura de contenedores para agentes intercambiables.
UI en WebView (Cage/Wayland): pantalla de estado, selector de agente, widgets.
Integrar SpeexDSP para AEC y beamforming en el array de micrófonos.
Fase 3 · Semanas 5–6
Superagente + Mensajería
Desplegar primer agente (Cowork / OpenClawd) en contenedor Docker.
Pipeline de voz completo: mic → STT cloud → agente → TTS → altavoces HiFi.
Integrar bot WhatsApp (Baileys / Business API) + bot Telegram — chat bidireccional.
Sistema de plugins: definir API de skills, primeros módulos (hora, clima, notas).
Pipeline de voz completo: mic → STT cloud → agente → TTS → altavoces HiFi.
Integrar bot WhatsApp (Baileys / Business API) + bot Telegram — chat bidireccional.
Sistema de plugins: definir API de skills, primeros módulos (hora, clima, notas).
Fase 4 · Semanas 7–10
Ensamblaje + Acabado + Publicación
Mecanizado CNC carcasa nogal — verificación de tolerancias y ajuste térmico.
Integración electrónica en carcasa — gestión de cables, montaje drivers.
Calibración EQ PipeWire — prueba de escucha real 4h. Test agente + mensajería 48h.
Lija 220 → aceite tung → curado 48h. Publicación OSHW: KiCad + FreeCAD + scripts.
Integración electrónica en carcasa — gestión de cables, montaje drivers.
Calibración EQ PipeWire — prueba de escucha real 4h. Test agente + mensajería 48h.
Lija 220 → aceite tung → curado 48h. Publicación OSHW: KiCad + FreeCAD + scripts.

