← Lab EP-LAB · ENTRENA TU MODELO
01·CUR 02·PRE 03·BASE 04·CONST 05·FT 06·ALN 07·CERT 08·EP1
CORPUS
┌─ CORPUS DE ENTRENAMIENTO ─┐
· eliminá los archivos corruptos (borde rojo) · cuidado: algunos tienen versiones obsoletas 5 CORRUPTOS RESTANTES
01 · CURACIÓN DE CORPUS
SOLTAR AQUÍ
esperando
corpus…
0/3ÉPOCA
LOSS
0kTOKENS
3e-4LR
procesando corpus…
LR 1.0×
MODELO BASE GENERADO
arrastrá model_raw.pkl de vuelta
a la red para definir la constitución
model_raw.pkl
⚑ modelo sin alinear — constitución y fine-tuning pendientes
[ CONSTITUCIÓN DE EP-1 ]
estos principios van a guiar el comportamiento del modelo — activá o desactivá cada uno
[ CONSTITUCIÓN FIRMADA · ARCHIVOS EN LA RED ]
RLAIF
Reinforcement Learning from AI Feedback
En lugar de anotadores humanos, la IA usa la constitución que firmaste para evaluar sus propias respuestas. Genera un borrador, lo contrasta contra cada principio, y se auto-corrige. Ese ciclo de feedback constitucional es lo que ajusta el modelo.
01 · genera borrador 02 · contrasta con constitución 03 · revisa y mejora 04 · modelo actualizado
MODELO ALINEADO
arrastrá model.pkl + runtime.py
a la red para activar inferencia
model.pkl
+
runtime.py
model.pkl
runtime.py
╔══ EP-1 · CERT. DE ENTRENAMIENTO ══╗
PUREZA DATASET
ARCHIVOS BUENOS
VERSIONES OBSOLETAS
ÉPOCAS3/3
LOSS FINAL
MÉTODO
ALINEACIÓN
CONSTITUCIÓN
╠══════════════════════════════════════╣
CALIDAD ESTIMADA
░░░░░░░░░░
—/100
╚══════════════════════════════════════╝
EP-1 · online
modelo activo · iniciá la conversación
EP-LAB · CLICKEÁ LOS ARCHIVOS CORRUPTOS PARA ELIMINARLOS DEL CORPUS estudioprompt.com/lab