Panel del TERMINATOR I - T3 con modelos BSC/ALIA.
Para usar modelos Ollama localmente:
ollama pull gemma4:e2b && ollama serve
Para modelos HuggingFace (Salamandra, Latxa, etc.) necesitas una HF API Key gratuita en huggingface.co/settings/tokens
🎬 VideoGenerate API
Generación de vídeo con modelos open source. Basado en el repositorio yoqer/VideoGenerate. Soporta Pika 1.0, SVD, Kling, Runway Gen-4 y modelos locales.
👁️ RobofloWision Local
Visión y reconocimiento con YOLO 26 open source. Detecta objetos, personas, texto y responde en tiempo real. Basado en yoqer/RobofloWision.
🤖 Avatar en directo API
Conecta el avatar de la IA con Google Meet, Zoom o cualquier app de mensajería. El avatar responde en tiempo real con voz y expresiones faciales animadas.
📹 Cámara + YOLO Local
Activa la cámara web y aplica detección en tiempo real con YOLO. Reconoce objetos, personas y contexto para que la IA responda sobre lo que ve.
💬 Mensajería API
Conecta TERMINATOR I con WhatsApp (Baileys), Telegram Bot API, Discord o cualquier plataforma de mensajería para enviar y recibir mensajes automáticamente.
🎭 Hunyuan3D Avatar API
Genera avatares 3D realistas con Hunyuan3D-2.0 de Tencent. Soporta formatos GLB, VRM, FBX. Integra con Live2D para animación en tiempo real.
🎙️ Configuración de Voz — STT/TTS
El sistema detecta automáticamente el idioma en la primera interacción y luego usa el modelo correspondiente para todas las respuestas.
🎤 STT Multilingüe (Recomendado)
ES, CA, GL, EU · 2.700h · Conformer-Transducer · Con puntuación
🔊 HuBERT ES/GL
Español y gallego · 2.000h · Activado con reconocimiento de voz
🐱 Whisper Catalán
Catalán · 4.700h · Faster-Whisper Large v3
🌊 Whisper Valenciano
Valenciano · CV21 · Faster-Whisper
🏝️ Whisper Balear
Balear · Faster-Whisper Large v3
🦅 STT Euskera
Euskera · 1.366h · Conformer-Transducer
🗣️ TTS — Texto a Voz
Selecciona la voz de respuesta. Para español se usa la API del navegador (Web Speech API) o Coqui TTS local. Para gallego, los modelos Nos TTS.
🗣️ Español — Mujer (Navegador)
Web Speech API · Sin instalación · ES
🗣️ Español — Hombre (Navegador)
Web Speech API · Sin instalación · ES
🗣️ Sabela — Gallego ♀
Nos TTS · Coqui VITS · GL
🗣️ Iago — Gallego ♂
Nos TTS · Coqui VITS · GL
⚙️ Configuración de HuggingFace
Para usar los modelos de voz BSC/ALIA necesitas desplegarlos en HuggingFace Spaces o usar la Inference API.
pip install transformers torch torchaudio
# STT Multilingüe
from transformers import pipeline
asr = pipeline("automatic-speech-recognition",
model="BSC-LT/stt_los_conformer_transducer_large_punctuated")
result = asr("audio.wav")
print(result["text"])
O despliega en HuggingFace Spaces con el app.py incluido en el ZIP.
📖 Inicio rápido — Modelos locales (Ollama)
# 1. Instalar Ollama curl -fsSL https://ollama.ai/install.sh | sh # 2. Descargar Gemma 4 E2B (más pequeño, ~3 GB) ollama pull gemma4:e2b # 3. Iniciar servidor ollama serve # 4. Endpoint disponible en: # http://localhost:11434/v1
🤗 Modelos BSC/ALIA — HuggingFace Inference API
Los modelos Salamandra, Latxa, Aitana, etc. requieren una HF API Key gratuita.
# 1. Obtener API Key en: https://huggingface.co/settings/tokens
# 2. En el panel: pegar la key en el campo "API Key"
# 3. Seleccionar el modelo BSC/ALIA del sidebar
# 4. Pulsar "Conectar"
# Ejemplo Python:
from huggingface_hub import InferenceClient
client = InferenceClient(
model="BSC-LT/salamandra-7b-instruct",
token="hf_TU_TOKEN"
)
response = client.chat_completion(
messages=[{"role":"user","content":"Hola, ¿qué puedes hacer?"}]
)
print(response.choices[0].message.content)
⚡ vLLM — Servidor de alto rendimiento
# Instalar vLLM pip install vllm # Iniciar servidor con Salamandra 7B python -m vllm.entrypoints.openai.api_server \ --model BSC-LT/salamandra-7b-instruct \ --port 8080 # Endpoint: http://localhost:8080/v1 # En el panel: seleccionar backend "vLLM" y poner este endpoint
🔧 llama.cpp — Modelos cuantizados GGUF
# Instalar llama.cpp git clone https://github.com/yoqer/llama.cpp cd llama.cpp && make # Descargar ALIA-40b GGUF (cuantizado) # https://huggingface.co/BSC-LT/ALIA-40b-instruct-2601-GGUF # Iniciar servidor ./llama-server -m alia-40b-q4_k_m.gguf --port 8080 # Endpoint: http://localhost:8080/v1
🗄️ Base de datos MySQL — Historial de conversaciones
El backend FastAPI guarda todas las conversaciones en MySQL. Configura las credenciales en .env:
# .env (NO subir a git) DB_HOST=localhost DB_PORT=3306 DB_NAME=terminatori DB_USER=terminatori_user DB_PASS=TU_CONTRASEÑA_SEGURA JWT_SECRET=TU_JWT_SECRET_LARGO HF_TOKEN=hf_TU_TOKEN_HUGGINGFACE # Iniciar backend cd backend && pip install -r requirements.txt uvicorn api.main:app --host 0.0.0.0 --port 8001