Amazon Bedrock

Amazon Bedrock es un servicio administrado que ofrece acceso a Foundation Models (FM) de IA generativa de los principales proveedores, a través de una API unificada, sin gestionar infraestructura.

Arquitectura RAG con Bedrock

¿Qué son los Foundation Models?

Modelos de IA entrenados con enormes cantidades de datos que pueden adaptarse a múltiples tareas: generación de texto, imágenes, código, embeddings y más.

Proveedores y modelos disponibles

Proveedor	Modelos	Capacidades
Anthropic	Claude 3 Haiku, Sonnet, Opus	Texto, análisis, código, visión
Amazon	Titan Text, Titan Embeddings	Texto, embeddings, imágenes
Meta	Llama 3 (8B, 70B)	Texto, código
Mistral AI	Mistral 7B, Mixtral 8x7B	Texto, multilingüe
Stability AI	Stable Diffusion XL	Generación de imágenes
Cohere	Command, Embed	Texto, embeddings empresariales

Conceptos clave

Invocación de modelos

Se envía un prompt mediante API y se recibe la respuesta generada. Dos modos:

Síncrono: respuesta completa de una vez
Streaming: respuesta en tiempo real (token a token)

Agentes de Bedrock

Permiten que el modelo ejecute tareas multi-paso de forma autónoma:

Recibe una instrucción en lenguaje natural
Planifica los pasos necesarios
Invoca herramientas y APIs externas
Entrega el resultado consolidado

Knowledge Bases (RAG)

Conecta el modelo a documentos propios usando Retrieval Augmented Generation:

Pregunta del usuario
       ↓
Búsqueda semántica en documentos indexados
       ↓
Contexto relevante + Pregunta → Modelo → Respuesta fundamentada

Ideal para chatbots que deben responder sobre documentación interna.

Guardrails

Filtros de seguridad configurables:

Bloquear contenido inapropiado o dañino
Restringir temas sensibles
Redactar datos personales (PII)
Evitar alucinaciones con grounding checks

Fine-tuning

Permite ajustar un modelo base con datos propios para mejorar su comportamiento en tareas específicas del negocio.

Comparación de modelos Claude 3

Modelo	Velocidad	Capacidad	Caso de uso
Haiku	Muy rápido	Básica	Tareas simples, alto volumen
Sonnet	Rápido	Alta	Balance ideal para producción
Opus	Más lento	Máxima	Tareas complejas de razonamiento

Modelo de precios

Se paga por tokens procesados (entrada + salida). No hay costo de infraestructura ni mínimos comprometidos.

Casos de uso

Asistentes conversacionales sobre documentación interna
Generación y revisión de código
Resumen y análisis de documentos extensos
Búsqueda semántica sobre bases de conocimiento
Generación de imágenes y contenido multimedia
Automatización de flujos de trabajo con agentes IA

¿Qué son los Foundation Models?​

Proveedores y modelos disponibles​

Conceptos clave​

Invocación de modelos​

Agentes de Bedrock​

Knowledge Bases (RAG)​

Guardrails​

Fine-tuning​

Comparación de modelos Claude 3​

Modelo de precios​

Casos de uso​