Entrena tu Modelo

┌─ CORPUS DE ENTRENAMIENTO ─┐

· eliminá los archivos corruptos (borde rojo) · cuidado: algunos tienen versiones obsoletas 5 CORRUPTOS RESTANTES

01 · CURACIÓN DE CORPUS

SOLTAR AQUÍ

█

esperando
corpus…

0/3ÉPOCA

—LOSS

0kTOKENS

3e-4LR

procesando corpus…

LR 1.0×

MODELO BASE GENERADO

arrastrá model_raw.pkl de vuelta
a la red para definir la constitución

model_raw.pkl

⚑ modelo sin alinear — constitución y fine-tuning pendientes

[ CONSTITUCIÓN DE EP-1 ]

estos principios van a guiar el comportamiento del modelo — activá o desactivá cada uno

[ CONSTITUCIÓN FIRMADA · ARCHIVOS EN LA RED ]

RLAIF

Reinforcement Learning from AI Feedback

En lugar de anotadores humanos, la IA usa la constitución que firmaste para evaluar sus propias respuestas. Genera un borrador, lo contrasta contra cada principio, y se auto-corrige. Ese ciclo de feedback constitucional es lo que ajusta el modelo.

01 · genera borrador → 02 · contrasta con constitución → 03 · revisa y mejora → 04 · modelo actualizado

MODELO ALINEADO

arrastrá model.pkl + runtime.py
a la red para activar inferencia

model.pkl

runtime.py

model.pkl

runtime.py

╔══ EP-1 · CERT. DE ENTRENAMIENTO ══╗

PUREZA DATASET—

ARCHIVOS BUENOS—

VERSIONES OBSOLETAS—

ÉPOCAS3/3

LOSS FINAL—

MÉTODO—

ALINEACIÓN—

CONSTITUCIÓN—

╠══════════════════════════════════════╣

CALIDAD ESTIMADA

░░░░░░░░░░

—/100

╚══════════════════════════════════════╝

EP-1 · online

modelo activo · iniciá la conversación