← volver a /talk

🧬 TUNIX Blueprint

Dashboard de ingeniería · arquitectura · estándares ideales · roadmap a la perfección

1 Arquitectura general

TUNIX es un solo agente con 3 modos:

┌──────────────────────────────────┐ │ Patricio habla por audífonos │ └───────────────┬──────────────────┘ │ ┌───────────────▼──────────────────┐ │ GEMINI LIVE (voz + ruteo) │ │ 21 tools whitelist directa │ │ ~2-3s respuesta típica │ └───────────────┬──────────────────┘ │ delega cuando complejo ┌────────────────────┼──────────────────────┐ │ │ │ ┌──────────▼─────┐ ┌───────────▼──────┐ ┌───────────▼──────┐ │ Haiku 4.5 │ │ Sonnet 4.6 │ │ Opus 4.7 │ │ ~3-8s │ │ ~8-15s │ │ ~30-90s │ │ 15 bypass + │ │ 30 MCP forge + │ │ 30 MCP forge + │ │ MCP forge │ │ MCPs nativos │ │ MCPs nativos │ └────────────────┘ └──────────────────┘ └──────────────────┘ │ ┌───────────────▼──────────────────┐ │ Supabase (60+ tablas) + APIs │ │ Gmail, Drive, Calendar, WSP, etc │ └──────────────────────────────────┘
Filosofía: Gemini es VOZ + RUTEO, no cerebro. Delega TODO lo complejo. Los modelos Anthropic son los que razonan, ejecutan tools complejas, redactan. Gemini solo verbaliza y enruta.

2 Instant Layer — respuestas <2s

Capa de tools agregadoras pre-cocinadas que Gemini llama directo sin delegar. Permiten respuestas instantáneas a preguntas frecuentes.

3 etapas de evolución (de lo simple a lo brutal)

EtapaCómo funcionaLatenciaFrescuraEstado
1. Promise.all paralelo1 tool hace N queries SQL en paralelo, devuelve JSON combinado300-500msReal-timeACTIVA
2. Materialized snapshotsCron actualiza tabla forge_instant_snapshots cada 5min, tool solo SELECT50-100ms5min stale OKPRÓXIMA
3. Pre-cocción narrativaSonnet/Haiku genera texto pre-armado cada hora, Gemini solo lee50-100ms1h stale OKFUTURO

Tools Instant Layer activas hoy

ToolQué devuelveTriggers de voz
sync_forge_now Tareas pendientes + reuniones 48h + audios WSP + agentes corriendo + estado emocional + recent talks "qué hay ahora", "dame el estado", "ponte al día", "qué pasa"

Candidatas próximas (cuando data telemetría lo justifique)

⚠️ Límite duro: Gemini whitelist directo NO debe pasar de 30 tools (hoy 21). Cada tool nueva ocupa ~200 tokens. A 30 tools = ~7K tokens catálogo. Más allá, la latencia primer token sube fuerte.

3 Whitelist Gemini directo (21 tools)

Tools que Gemini puede invocar SIN delegar a Haiku/Sonnet/Opus. Definidas en api/gemini-live-config.js constante GEMINI_DIRECT_WHITELIST.

ToolTipoLatencia
query_reminderscero-args~200ms
query_meetings_todaycero-args~200ms
query_meetings_upcomingcero-args~200ms
query_taskscero-args~200ms
query_recent_wsp_audioscero-args~200ms
recent_channel_eventscero-args~300ms
calendar_todaycero-args~700ms
check_code_sessioncero-args~150ms
sync_forge_now INSTANTcero-args~500ms
recall(query, hours_back?)1-2 args~1.5s
memory_librarian(query)1 arg~6s
quick_via_haiku(task)brain delegate~3-8s
quick_via_sonnet(task)brain delegate~8-15s
delegate_to_claude_max(task)brain delegate~30-90s
run_in_background(task, ...)bg async~100ms ack
compare_models(task, models)Sonnet+Opus //~max(s,o)
publish_planUI~50ms
update_plan_stepUI~50ms
send_to_codepuente~200ms
recent_talk_sessionspuente~150ms
respond_to_approvalapproval~200ms
Identidad/perfil Patricio: NO es tool — está inyectado como bloque en el system prompt. Responde directo en 1-2s sin llamar nada. Triggers: "¿quién soy?", "¿quién es Natalia/Seba/Nico?", stack, holding.

4 Bypass pre-execute (15 patterns)

Cuando Gemini delega a quick_via_haiku o quick_via_sonnet, el backend intercepta primero con regex matching y ejecuta la tool Forge ANTES de llamar al modelo. El resultado va cocinado en el prompt. Modelo solo verbaliza.

Cómo funciona internamente

Patricio: "búscame mails de Sebastián" │ ▼ Gemini: quick_via_sonnet(task="búscame mails de Sebastián") │ ▼ Backend tunix-tool-exec.js: 1. Regex match "mails (?:de|sobre)\s+(.+)" → tool=gmail_search, args={q:"Sebastián"} 2. EJECUTA gmail_search → resultado en JSON 3. Pasa a Sonnet: "Aquí están los mails ya buscados: {...}. Verbalízalo natural" 4. Sonnet solo formatea respuesta natural Total: ~5-8s en vez de 12-15s (sin pasar por loop SDK)

Patrones activos

💡 Ventaja: Patrones bypass crecen sin costo de tokens (viven en regex backend, Gemini no los ve). Solo aumentan velocidad.

5 Memoria conversacional — 3 capas

CapaToolLatenciaCuándo
1. Auto-recencia(inyectada al prompt)0msÍndice 5 sesiones 72h, siempre disponible
2. Vector directorecall(query, hours_back?)~1.5s"qué te dije sobre X", "te acuerdas cuando…"
3. Síntesis Sonnetmemory_librarian(query)~6s"hazme un resumen de todo lo de X esta semana"

Estática (canon documental):

6 MCP forge en Búnker (30 tools)

Catálogo consolidado de tools que Sonnet/Haiku/Opus pueden invocar nativo via MCP server stdio (scripts/tunix-claude-agent/forge-tools-mcp.mjs). Refactorizado 64→30 tras análisis Opus 26-may.

Familias consolidadas

FamiliaToolsArgs clave
Memoriamemory_search, memory_readmode: recent|synthesis|entities|lessons|broad|wsp
Queriesquery_forge_datatype: tasks|reminders|meetings_today|meetings_upcoming|wsp_audios
Calendarcalendar_query, create, update, deleterange: today|week|month
Gmailgmail_search, read, send, modifyq, id, body
Drivedrive_search, drive_readtext, folders_only, id
Accionescreate_task, mark_task_done, create_reminder, cancel_meeting, save_person_notetitle, when_text, etc
WSPsend_wsp_text, send_wsp_audioDESTRUCTIVE confirmar siempre
Brain delegatedelegate_to_brainmodel: haiku|sonnet|opus
Sistemasync_forge_now, recent_pc_activity, recent_channel_events, check_code_session, send_to_codecero o pocos args
Backgroundrun_in_background, respond_to_approval, tunix_self_improvetask, request_token
PCdelegate_to_pctask

7 Cuándo delega Gemini (framework 7 criterios)

Para que una tool nueva entre al whitelist directo Gemini, debe cumplir TODOS los 7 criterios:

  1. Determinístico — cero-args o args triviales
  2. Read-only — nunca escribir/borrar/enviar a terceros
  3. Fail-safe — error claro y recuperable
  4. Latencia <2s típica
  5. Verbalizable directo — sin razonamiento extra
  6. Alta frecuencia — ≥5 calls/sem proyectadas
  7. NO requiere creatividad — no es redactar/analizar/sintetizar

Si una tool falla un criterio → delegar a Sonnet/Opus/Haiku.

Documentado en _core/feedback_gemini_delegate_framework.md.

8 Cheatsheet — Cómo preguntarle a TUNIX por voz

🚀 Respuestas instantáneas (1-2s, Instant Layer)

"TUNIX, ¿qué hay ahora?" → estado completo: tareas + reuniones 48h + audios + agentes
"TUNIX, dame el estado" → idem ↑
"TUNIX, ponete al día" → idem ↑ (alias)
"TUNIX, ¿quién soy?" → lee perfil Patricio del system prompt
"TUNIX, ¿quién es Sebastián?" → ejecutivo del holding

⚡ Respuestas rápidas (~200ms, cero-args)

"TUNIX, ¿qué reminders tengo?" → query_reminders
"TUNIX, reuniones de hoy" → query_meetings_today
"TUNIX, tareas pendientes" → query_tasks
"TUNIX, audios WSP recientes" → query_recent_wsp_audios

🧠 Memoria conversacional (1.5-6s)

"TUNIX, ¿recuerdas que hablamos de X?" → recall (Capa 2)
"TUNIX, hazme un resumen de lo de Emabel esta semana" → memory_librarian (Capa 3)

🟡 Delegación a Haiku/Sonnet (3-15s)

"TUNIX, buscame mails de Sebastián" → quick_via_sonnet (bypass gmail_search)
"TUNIX, ¿qué hay en la carpeta Drive Economía?" → quick_via_haiku (bypass drive_search+list)

🔴 Análisis profundo (30-90s, Opus)

"TUNIX, analizá profundo X" → delegate_to_claude_max
"TUNIX, comparame Sonnet y Opus sobre X" → compare_models

🤝 Modo Reunión (3 capas progresivas)

"TUNIX, ¿qué opinas?" → 3 capas (2s puente + 8s Sonnet + 60s Opus)
"TUNIX, analizá profundo, sin apuro" → background mode (te aviso cuando termine)

9 Sistema de aprobaciones (panel rojo)

Decisión 25-may: aprobaciones destructivas NUNCA por voz (riesgo "sí" accidental). Siempre por botón manual rojo en pantalla.

Flujo típico:

Búnker: bunker_request_approval.sh "git push --force" "fix bug" "plan"
        ↓ insert en tunix_bridge_queue
TUNIX Talk: voz Aoede lee el pedido informativo + muestra panel rojo
        ↓ Patricio tap APROBAR
respond_to_approval → tunix_approval_decide → script Búnker exit 0
Búnker hace el push.

10 Telemetría path

Tabla forge_tunix_tool_audit + columna path registra cómo se ejecutó cada tool:

PathSignificado
directGemini whitelist directo (~200ms-2s)
bypassPre-execute pattern match → cocido para Haiku/Sonnet (~3-8s)
mcpSDK Anthropic loop con MCP forge (~8-30s)
cacheCache hit (CACHEABLE_TOOLS, TTL variable)

Query útil para análisis:

SELECT path, count(*) AS calls, ROUND(AVG(duration_ms)::numeric, 0) AS avg_ms
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
GROUP BY path ORDER BY calls DESC;
💡 Decisiones basadas en data: en 1-2 semanas vas a tener números reales. Si bypass domina = bypass patterns valen oro. Si mcp domina = tools complejas, considerar Tool Retrieval (Etapa 3). Si direct domina = filosofía instant funciona.

11 Sistema IDEAL vs estado ACTUAL

Comparación brutal honesta por área. Objetivo: que TUNIX trabaje en cada dimensión al estándar "espectacular" sin latencia. Verde = en el ideal · Amarillo = aceptable, mejorable · Rojo = gap importante.

A. Latencias objetivo

Tipo respuestaIdealActualEstado
Identidad/quién soy<1s~1-2sOK
Snapshot Instant Layer<500ms~500msOK
Queries datos cero-args<300ms~200msOK
Memoria capa 2 (recall)<1.5s~1.5sOK
Memoria capa 3 (librarian)<6s~6sOK
Bypass quick_via_haiku<5s~8-15sMEJORABLE
Análisis profundo Opus30-60s~30-90sVARIABLE
Pre-cocción narrativa (futuro)<100msN/ANO IMPLEMENTADO

B. Catálogo de tools

CapaIdealActualEstado
Gemini whitelist directo25-30 max21EN MARGEN
Instant Layer tools8-121 (sync_forge_now)GAP IMPORTANTE
Bypass pre-execute patterns25-3015CRECER
MCP forge Búnker consolidado30-3530PERFECTO
Materialized snapshots (cron)10-150NO IMPLEMENTADO
Pre-cocción narrativa Sonnet3-50NO IMPLEMENTADO
Tools sin uso 30d00 (post limpieza)LIMPIO

C. Telemetría y observabilidad

MétricaIdealActualEstado
Distribución path (direct/bypass/mcp/cache)40/30/20/10Datos en construcción (1-2 sem)RECIÉN MIDIENDO
Cache hit rate tools cacheables>50%~25% observadoSUBIR
Fail rate por tool<5%3 tools post-fix (verificar 7d)A MEDIR
P50 latencia turno completo<1sNo medidoFALTA INSTRUMENTAR
P95 latencia turno completo<8sNo medidoFALTA INSTRUMENTAR
Tokens promedio/turno<3KNo medidoFALTA

D. Memoria y embeddings

ÁreaIdealActualEstado
Capa 1 (recencia) en system promptSiempre cargada✅ cargada 5 sesiones 72hOK
Capa 2 (recall) latencia<1.5s~1.5sOK
Capa 3 (librarian) latencia<6s~6sOK
Embeddings actualizados post-turn<1hBackground, ~minutosOK
forge_memory ↔ _core/ syncContinuoManual al guardarMEJORABLE

E. Modo Reunión

FeatureIdealActualEstado
Diarización por nombre (no Speaker N)>85% accuracy0% (voice profiles vacíos)ENTRENAR VOZ
Auto-save cada 60s + beforeunloadFuncional✅ deployadoOK
Frase puente (capa 1)<2s~2sOK
Sonnet primera lectura (capa 2)<10s~8-15sVARIABLE
Opus profundo (capa 3)60-90s~60-90sOK
Modo background (bg)Funcional✅ con wake phrasesOK

F. APK Android (Capacitor)

FeatureIdealActualEstado
Celu bloqueado + BT funciona>30min sin cortes✅ Patricio confirmó 26-mayOK
APK con WakeLock+WifiLock nativoRefuerzo extraFrontend OK, APK rebuild pendienteBONUS PENDIENTE
WebView mic estable0 NotReadableError✅ bypass ForgeRecording pluginOK

G. Voice identity

FeatureIdealActualEstado
Voice profile Patricio entrenado60s muestra limpia0 (sin entrenar)P0
Voice profiles 3-5 contactos claveSebastián, Nicolás, etc0PRÓXIMO
WeSpeaker model on-deviceCargado al activar reunión✅ código deployadoOK

H. Búnker MCP (post-fix 26-may)

FeatureIdealActualEstado
MCP forge custom visible al SDK64 tools listadas✅ 64 forge_match (canUseTool)RESUELTO
OAuth Max activo (no 401)Sin expiración✅ activoOK
Container always-onRestart auto✅ docker restart=alwaysOK
MCPs nativos (Supabase, GitHub, etc)5+ activos✅ 6 connectedOK

12 Roadmap de evolución (por prioridad)

🔴 P0 — esta semana (alto impacto, esfuerzo bajo)

  1. Entrenar voice profile Patricio (60s) → diarización por nombre activa en próxima reunión. acción tuya
  2. Brief profundo Sebastián con Opus para reunión 7 PM. esperando OK
  3. Validar fixes en uso real: reunión Seba hoy + identidad directa + Instant Layer.
  4. Entrenar voice profile Sebastián cuando llegue (1 min).

🟡 P1 — próximas 2 semanas

  1. APK rebuild WakeLock nativo cuando GitHub Actions vuelva (refuerzo bonus, frontend ya cubre).
  2. Crear primer materialized snapshot (Etapa 2 Instant Layer):
    • Tabla forge_instant_snapshots(slug, data, refreshed_at, ttl_min)
    • Cron 5min: holdings_health_snapshot (KPIs Emabel + TensorMed)
  3. Tool retrieval con Haiku classifier — clasificador rápido decide qué grupo cargar al MCP → catálogo efectivo Sonnet/Opus baja de 30 a 8-10 tools por turno. Reduce 3-4s primer token.
  4. Telemetría P50/P95 por tool + per-path: agregar columna p50_ms, p95_ms a tablas o vista materializada.
  5. Aumentar bypass patterns: agregar 5-10 nuevos basados en datos de delegate frecuentes.

🟢 P2 — 1-2 meses

  1. Pre-cocción narrativa Sonnet (Etapa 3 Instant Layer): cron cada hora genera narrativas listas (briefing matutino, estado holdings, focus diario). Gemini solo lee.
  2. Hook auto-grabación memoria: TUNIX detecta lección/preferencia importante → auto-save a forge_memory sin pedir.
  3. Outbox queue terceros approval batch: agrupar mensajes WSP/email pendientes en una revisión visual.
  4. Briefing matutino con narrativa pre-cocinada: cron Sonnet 06:25 genera texto, Gemini lo lee 06:28.
  5. Voice profiles 3-5 contactos clave: Sebastián, Nicolás Luna, otros frecuentes.

🔵 P3 — 3-6 meses (estratégico)

  1. TUNIX Búnker 90% paridad con Code: Opus profundo always-on en VPS con todas las capacidades de Claude Code (memoria viva, sub-agentes, etc).
  2. Voice Lab dashboard: A/B testing voces, sliders calidad, cloning Patricio mejor.
  3. Diarización avanzada Picovoice Eagle: alternativa más robusta a WeSpeaker on-device.
  4. Tool composition workflows reales: DAGs predefinidos para flows recurrentes (ej. "preparar reunión cliente X").
  5. Agents-as-tools selectivos: research_agent, code_review_agent, content_writer_agent — solo para casos complejos puntuales.

13 Métricas clave a monitorear

Queries SQL útiles para revisar el pulso del sistema. Correlas semanalmente en Supabase SQL Editor.

Salud general (1 vista panorámica)

SELECT
  path,
  count(*) AS calls,
  ROUND(AVG(duration_ms)::numeric, 0) AS avg_ms,
  ROUND(percentile_cont(0.5) WITHIN GROUP (ORDER BY duration_ms)::numeric, 0) AS p50_ms,
  ROUND(percentile_cont(0.95) WITHIN GROUP (ORDER BY duration_ms)::numeric, 0) AS p95_ms,
  ROUND(100.0 * count(*) FILTER (WHERE success=false) / count(*), 1) AS fail_pct
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
GROUP BY path
ORDER BY calls DESC;

Top tools más usadas (detecta candidatos a bypass/instant)

SELECT tool_name, count(*) AS calls,
  ROUND(AVG(duration_ms)::numeric, 0) AS avg_ms,
  count(*) FILTER (WHERE path='direct') AS direct,
  count(*) FILTER (WHERE path='bypass') AS bypass,
  count(*) FILTER (WHERE path='mcp') AS mcp,
  count(*) FILTER (WHERE path='cache') AS cache
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
GROUP BY tool_name
ORDER BY calls DESC LIMIT 20;

Tools con fail rate alto (intervenir)

SELECT tool_name, count(*) AS calls,
  count(*) FILTER (WHERE success=false) AS fails,
  ROUND(100.0 * count(*) FILTER (WHERE success=false) / count(*), 1) AS fail_pct
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
GROUP BY tool_name
HAVING count(*) FILTER (WHERE success=false) > 0
   AND count(*) >= 3
ORDER BY fail_pct DESC;

Cache hit rate por tool (subir hits = bajar latencia)

SELECT tool_name,
  count(*) FILTER (WHERE path='cache') AS hits,
  count(*) FILTER (WHERE path!='cache') AS misses,
  ROUND(100.0 * count(*) FILTER (WHERE path='cache') / count(*), 1) AS hit_pct
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
GROUP BY tool_name
HAVING count(*) > 5
ORDER BY hit_pct DESC;

Latencia por modelo brain delegate

SELECT
  CASE
    WHEN tool_name = 'quick_via_haiku' THEN 'Haiku'
    WHEN tool_name = 'quick_via_sonnet' THEN 'Sonnet'
    WHEN tool_name = 'delegate_to_claude_max' THEN 'Opus'
    ELSE 'Other'
  END AS model,
  count(*) AS calls,
  ROUND(AVG(duration_ms)::numeric, 0) AS avg_ms,
  ROUND(percentile_cont(0.95) WITHIN GROUP (ORDER BY duration_ms)::numeric, 0) AS p95_ms
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '7 days'
  AND tool_name IN ('quick_via_haiku','quick_via_sonnet','delegate_to_claude_max')
GROUP BY model ORDER BY calls DESC;
💡 Cuándo escalar una tool delegada al whitelist directo Gemini: si una tool aparece con ≥20 calls/semana via bypass, considerá agregarla al whitelist directo o crear un Instant Snapshot que la cubra. Los 7 criterios de framework aplican.

14 Anti-patrones a evitar

Cosas que romperían la eficiencia del sistema. Revisar antes de cualquier cambio estructural.

Anti-patrónPor qué es maloQué hacer en cambio
Agregar tools al whitelist Gemini "por las dudas" Cada tool +200 tokens system prompt. Gemini se confunde eligiendo entre muchas. Aplicar los 7 criterios estrictos. Si dudás, NO escalar.
Flexibilizar Regla #0 con frases vagas ("usá tu criterio") Modelo nunca usa criterio bien — delega incorrectamente o resuelve directo cuando no debería. Excepciones nominales con triggers exactos (ej. "qué hablamos de X → recall").
Hacer tools write (create/delete) en Instant Layer Instant Layer es solo lectura por diseño. Writes requieren confirmación, no instant. Writes siempre via wrapper Sonnet/Haiku + approvals si tercero.
No instrumentar telemetría path Optimizar a ciegas. Decisiones basadas en intuición no en data. Ya activo. Correr queries de sección 13 semanal.
Pasar de 30 tools en Gemini whitelist Catálogo >7K tokens → latencia primer token sube exponencial. Si llegás a 30, consolidá familias o pasá tools al bypass.
Llamar bypassPermissions en SDK Claude Code corriendo root SDK lo bloquea con exit code 1 (caso real 26-may). Usar canUseTool callback en su lugar (ya implementado).
Push notifs con curl directo en bash Windows Rompe UTF-8 (tildes/ñ → ?). SIEMPRE python scripts/forge_push.py.
Usar argentinismos en regex de detección de frases Patricio habla chileno, no coincide con "resumime" sino con "hazme un resumen". Regex con vocabulario chileno + argentinismos como fallback compat.
Modificar SWARM V10 sin safe_put_workflow Sin backup auto + verify, puedes romper producción sin rollback. SIEMPRE scripts/lib/n8n_safe.py con verify_callback.
Inyectar audio Gemini Live en modo reunión LISTEN Gemini interpreta + responde rompiendo el prompt "callate". NO enviar audio a Gemini en LISTEN/THINK/SPEAK (solo a Deepgram).
Aprobar destructivos por voz "Sí" accidental puede disparar git push --force u otra acción irreversible. SIEMPRE botón manual rojo en pantalla. Voz solo informa.
⚠️ Regla de oro: antes de cualquier cambio importante al sistema, lee este dashboard primero. Si el cambio cae en algún anti-patrón, replantear. Si cae en el ideal (sección 11) sin gap, no tocar. Si llena un gap del roadmap (sección 12), avanzar.

15 💰 Costos en vivo + ahorros vs OpenAI

Cálculo automático con tu data real de forge_tunix_talk_sessions + forge_tunix_tool_audit. Pricing 2026 verificable.

📊 Snapshot en vivo

cargando…

💡 Análisis: por qué Gemini Live es la mejor decisión

OpenAI cobra audio nativo a precio premium (procesa speech-to-speech end-to-end). Gemini Live Native Audio es misma arquitectura speech-to-speech pero ~20x más barato porque Google está agresivo capturando market share contra OpenAI.

📋 Pricing 2026 comparado

ModeloInput audio /MOutput audio /MTu uso 30d aprox
Gemini 2.5 Flash Live Native Audio ✅ actual$0.50$2.00~$18/mes
OpenAI gpt-realtime-mini (Cedar voice, lo que usabas)$10$20~$213/mes
OpenAI gpt-realtime (premium)$32$64~$680/mes

🧱 Stack TUNIX completo · costos mensuales

ComponenteCostoNotas
Gemini Live (voz)~$18Variable según uso real
Anthropic Claude Pro (OAuth Max)$100Plan Pro · Sonnet+Haiku+Opus con cuota generosa
Vercel Pro$20Functions + bandwidth
Supabase$0Plan FREE (500MB DB, 50K MAU, suficiente hoy)
VPS Bunker MK4$20Self-hosted container always-on
Embeddings Gemini 768d$0Dentro free tier
Google APIs (Gmail/Calendar/Drive)$0Cuenta personal, free
Deepgram (diarización reuniones)~$1-3Solo cuando uses Modo Reunión
TOTAL~$158/mesStack completo
📉 Costo real $158/mes (no $284 como decía antes — Patricio aclaró el 26-may que el plan Anthropic es Pro $100 y Supabase está en free).

💎 Ahorro real con tu uso ACTUAL

MensualAnualizado
vs OpenAI mini (lo que usabas)$195/mes~$2.340/año
vs OpenAI premium (si hubieras escalado)$662/mes~$7.944/año

📈 Proyecciones si escalás Talk

EscenarioVoz GeminiVoz OpenAI miniVoz OpenAI premiumAhorro vs premium
Actual (5h/mes)$18$213$680$662/mes
3x más (15h/mes)$54$639$2.040$1.986/mes
5x más (25h/mes)$90$1.065$3.400$3.310/mes
10x más (50h/mes)$180$2.130$6.800$6.620/mes

⚖️ Claude Pro $100 break-even

Pagás $100/mes flat por Anthropic Claude Pro. Para que valga la pena al 100%, necesitás usar más de $100 en pay-per-use equivalente.

Tu uso REAL Anthropic actual (calls Haiku + Sonnet + Opus equivalente sin Max):
  • Haiku: ~$3-10/mes
  • Sonnet: ~$8-20/mes
  • Opus: ~$20-40/mes
  • Total equivalente: ~$30-70/mes (depende de la semana)
Hoy aprovechás Claude Pro al ~30-50% aprox. El sistema te avisa por push si la utilización baja del 70% — vas a ver el alert semanal automático cada lunes.

Para llenar el plan: necesitás sumar ~30-60 calls Opus extra al mes. Eso es ~1-2 calls Opus diarias más. La sección 16 abajo tiene 10 proyectos paralelos para llenar el Pro de manera estratégica.

🔔 Alertas automáticas activadas

🛠️ SQL útil para auditar manualmente

-- Costo Gemini Live aproximado últimos 30d
SELECT
  count(*) AS sessions,
  ROUND(SUM(duration_sec)/60.0, 1) AS minutos_voz,
  ROUND(SUM(duration_sec) * 100 * 0.50 / 1e6, 2) AS cost_input_audio_usd,
  ROUND(SUM(duration_sec) * 70 * 2.00 / 1e6, 2) AS cost_output_audio_usd
FROM forge_tunix_talk_sessions
WHERE started_at > now() - interval '30 days' AND duration_sec > 30;

-- Anthropic equivalent sin Max
SELECT
  count(*) FILTER (WHERE tool_name='quick_via_haiku') * 0.10 AS haiku_usd,
  count(*) FILTER (WHERE tool_name='quick_via_sonnet') * 0.30 AS sonnet_usd,
  count(*) FILTER (WHERE tool_name='delegate_to_claude_max') * 1.50 AS opus_usd
FROM forge_tunix_tool_audit
WHERE created_at > now() - interval '30 days';
💬 Filosofía Patricio (26-may): "Gemini es brutal viejo, demasiado barato comparado con OpenAI, excelente en voz/velocidad/precisión. Vamos a seguir con Gemini hasta que aparezca un modelo más preciso todavía." Por eso este dashboard rastrea los costos automático — si Gemini sube precio o aparece alternativa, podemos pivotar con data.

16 🚀 Plan para llenar Claude Pro $100/mes con agentes paralelos

Patricio: "necesito crear más proyectos paralelos para llegar al tope del Pro, que vaya orquestando y dirigiendo".

Objetivo: pasar de **~30-50% utilización** a **80-100%**, generando valor real con cada llamada Opus/Sonnet en background. Si llenás el Pro consistentemente 3 meses seguidos, conviene migrar a plan Team $200.

📋 10 proyectos paralelos automatizables

Cada uno suma ~$8-20/mes equivalente. Eligiendo 5-7 llegás al tope del Pro.

#ProyectoModeloFreq$/mes equivValor que genera
1 Morning briefing rico con narrativa Sonnet Diario 06:25 ~$9 30 narrativas/mes pre-cocidas con análisis del día: agenda + prioridades + clientes + estado holdings + clima emocional. Pre-cocción Etapa 3 Instant Layer.
2 Análisis semanal holdings (Emabel + TensorMed) Opus Lunes 09:00 ~$6 4 análisis profundos/mes: KPIs, churn risk clientes, oportunidades cross-sell, gaps operativos. Push notif con recomendaciones accionables.
3 Auto-redacción WSP drafts para clientes pendientes Sonnet 3x/día ~$27 ~90 drafts/mes pre-armados para cada conversación WSP sin responder >2h. Patricio solo revisa + aprueba o ajusta. Mucho más rápido que redactar desde cero.
4 Análisis post-reunión automático Opus Cada reunión grabada ~$8 Insights brutales después de cada reunión Sebastián/clientes/prospects: temas tratados, decisiones tomadas, action items, próximos pasos, riesgos detectados.
5 Code review nocturno de commits Sonnet Diario 02:00 ~$15 Revisión de commits del día con sugerencias mejora (perf, seguridad, anti-patrones). Reporte matutino. Acumula deuda técnica visible.
6 Research swarms (DEVIX/GOJAN/TRUNKS en paralelo) Opus + Sonnet On-demand ~$15 Cuando pidas investigar tema (ej. "investigá competencia TensorMed"), spawn 3 agentes paralelos: market research, competitive intel, deep tech. ~10 swarms/mes.
7 Auto-generación contenido marca (Tungsteno YouTube + posts) Opus 2x/semana ~$12 8 piezas/mes (script video, post LinkedIn, hilo Twitter) ajustadas a tu voz. Pre-cocidas para que solo revises y publiques.
8 Análisis prospectos B2B (Emabel) Opus Por prospect ~$8 Antes de cada reunión con cliente nuevo: investiga LinkedIn, web, contexto industria, propone ángulo de venta. ~5-8 prospects/mes.
9 Memory consolidation nocturna profunda (REM) Opus Diario 03:00 ~$12 Reemplazar REM con Haiku actual por Opus 1x semana: análisis profundo de patrones, detección lecciones nuevas no obvias, actualización Memory Forge. Sistema aprende solo.
10 Auto-mejora código proactiva (tunix_self_improve) Opus Semanal ~$10 4 auto-mejoras/mes: TUNIX detecta gaps en su propio código, propone refactor, aplica con tu OK. Sistema se vuelve más fluido solo.
📊 Total potencial: si activás los 10 = ~$122/mes equivalente. Si activás 5-6 estratégicos = ~$70-90/mes. Vas a quemar el Pro de forma orgánica con valor real, no llamadas vacías.

🎯 Implementación por prioridad

FaseProyectosEsfuerzoCuándo
🔴 Fase 1 (esta semana) #1 Briefing rico · #4 Análisis post-reunión · #9 REM con Opus ~3-4 hs total Activable ahora, solo cron + prompt
🟡 Fase 2 (próx 2 semanas) #2 Semanal holdings · #5 Code review · #10 Auto-mejora ~6-8 hs total Requiere tablas + crons + prompts diseñados
🟢 Fase 3 (próx mes) #3 WSP drafts · #8 Prospects · #6 Research swarms · #7 Contenido marca ~12-15 hs total Más complejos, requieren UI de revisión + approval batch
💡 Orquestación que pediste: cada proyecto genera output que vos revisas. No es Opus trabajando "solo en la nada" — es Opus produciendo entregables (drafts, análisis, recomendaciones, briefings) que TÚ orquestás y diriges. El sistema te muestra qué generó cada día, vos decidís qué usar/aprobar/descartar.

🎛️ Cómo controlar la utilización

⚠️ Cuándo conviene escalar a Team $200/mes: si en 3 meses seguidos el equivalente pay-per-use supera $100 (es decir, estás quemando el Pro al 100%+ con valor real), entonces el Team $200 te conviene (más cuota + más miembros si en algún momento sumas a alguien al holding).

🧬 TUNIX Blueprint v4 · actualizado 26-may-2026 · también ver /forge-help
Este dashboard se actualiza con cada cambio mayor al sistema. Vení a chequear el estado real.