For companies
  • Hire developers
  • Hire designers
  • Hire marketers
  • Hire product managers
  • Hire project managers
  • Hire assistants
  • How Arc works
  • How much can you save?
  • Case studies
  • Pricing
    • Remote dev salary explorer
    • Freelance developer rate explorer
    • Job description templates
    • Interview questions
    • Remote work FAQs
    • Team bonding playbooks
    • Employer blog
For talent
  • Overview
  • Remote jobs
  • Remote companies
    • Resume builder and guide
    • Talent career blog
Arc Exclusive
Arc Exclusive

GenAI Engineer

Location

Remote restrictions apply
See all remote locations

Salary

US$50K - 60K

Min. experience

5+ years

Required skills

PythonRAGLangchainGenerative AIAI

Full-time role
Posted 3 hours ago
Apply now
Actively recruiting / 3 applicants

Sobre Creai

En Creai, nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a los clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de IA de vanguardia.

Descripción del puesto

Como Senior Generative AI Software Engineer en Creai, serás responsable de diseñar, implementar y mantener soluciones empresariales complejas basadas en Inteligencia Artificial Generativa, Large Language Models (LLM) y Retrieval-Augmented Generation (RAG). Este rol requiere expertise técnico profundo en el ciclo completo de vida de proyectos GenAI, desde el discovery inicial hasta el despliegue en producción y optimización continua.

Serás el guardián de la calidad y robustez de nuestras soluciones GenAI, liderando la implementación de nuestra metodología estandarizada y asegurando que cada sistema entregue valor real de negocio mientras mantiene los más altos estándares de precisión, seguridad y eficiencia de costos. Trabajarás directamente con clientes enterprise para traducir problemas de negocio complejos en arquitecturas GenAI escalables y confiables.

Este puesto exige

Arquitectura y Diseño de Soluciones GenAI: Diseñar arquitecturas end-to-end para sistemas RAG, agentes conversacionales, sistemas multi-agente y soluciones de generación de contenido. Tomar decisiones críticas sobre approach técnico (prompt engineering, RAG, fine-tuning o combinaciones), selección de modelos LLM, vectorstores, y estrategias de retrieval basándose en requisitos específicos de cada proyecto.

Implementación de Sistemas RAG Complejos: Construir pipelines completos de RAG incluyendo document loaders, estrategias de chunking óptimas, enrichment de metadata, embeddings, vectorstores, hybrid search, re-ranking, y generation con LLMs. Optimizar cada componente para maximizar relevancia, groundedness y performance.

Prompt Engineering Avanzado: Diseñar, iterar y optimizar prompts complejos aplicando técnicas avanzadas como few-shot learning, chain-of-thought, ReAct patterns, y self-consistency. Implementar guardrails robustos para control de alucinaciones, incluyendo grounding explícito, citation enforcement, y post-processing validation.

Gestión y Procesamiento de Conocimiento: Diseñar e implementar pipelines de ingesta, procesamiento y estructuración de fuentes de conocimiento diversas (documentos, bases de datos, APIs). Implementar estrategias avanzadas de chunking, metadata extraction, deduplication, y data governance con control de acceso role-based y protección de PII.

Evaluación y Validación Sistemática: Implementar frameworks de evaluación exhaustivos combinando métricas automáticas (model-based), métricas de retrieval (context precision/recall, MRR, NDCG), benchmarks con referencias, y evaluación humana. Diseñar test datasets representativos y realizar análisis de failure modes para mejora continua.

Integración con LLMs y Plataformas Cloud: Implementar integraciones robustas con modelos como GPT-4, Claude, Gemini, Llama, y Mistral usando APIs, function calling, structured outputs, y output parsing. Gestionar deployments en plataformas cloud (AWS Bedrock, SageMaker, Azure OpenAI, Vertex AI) optimizando para latencia, costo y escalabilidad.

Desarrollo de Agentes Autónomos: Implementar agentes GenAI capaces de razonamiento, toma de decisiones, y ejecución de acciones mediante tool integration (APIs, bases de datos, code interpreters). Diseñar arquitecturas de agentes (ReAct, Plan-and-Execute, Multi-Agent) con memory management, error handling, y retry logic robusto.

Observabilidad y Monitoreo de Producción: Implementar sistemas de monitoreo continuo para métricas de calidad (relevancia, precisión factual, groundedness), experiencia de usuario (satisfacción, task success rate), y eficiencia operacional (latencia, costos de tokens, performance). Configurar alertas, dashboards, y feedback loops para mejora iterativa.

Optimización de Costos y Performance: Analizar y optimizar continuamente el consumo de tokens, estrategias de caching, model routing, y uso de recursos computacionales. Implementar técnicas de cost efficiency como prompt compression, semantic caching, y selección dinámica de modelos según complejidad de query.

Seguridad, Privacidad y Compliance: Implementar medidas de seguridad robustas incluyendo defense contra prompt injection, data leakage prevention, sanitización de inputs, y rate limiting. Asegurar compliance con GDPR y regulaciones locales mediante PII protection, data residency, audit logging, y encryption.

Testing de Robustez y Red Teaming: Realizar testing exhaustivo incluyendo adversarial testing (jailbreak attempts, prompt injection), edge cases, load testing bajo alta concurrencia, y validación de error handling. Ejecutar ejercicios de red teaming regular para identificar vulnerabilidades.

Colaboración con Stakeholders Técnicos y de Negocio: Comunicar decisiones arquitectónicas complejas, trade-offs técnicos, limitaciones de GenAI, y recomendaciones a audiencias diversas desde developers hasta ejecutivos. Liderar sesiones de discovery con clientes para entender requisitos y definir métricas de éxito en dimensiones de calidad, UX, y negocio.

Mejora Continua y Adopción de Emerging Technologies: Mantenerse actualizado con últimos avances en GenAI/LLM, evaluar nuevas técnicas y modelos, y proponer innovaciones que mejoren la efectividad de nuestras soluciones. Contribuir a la evolución de mejores prácticas y metodologías internas.

Documentación Técnica Exhaustiva: Crear documentación arquitectónica detallada, diagramas de sistemas, especificaciones técnicas, guías de implementación, y runbooks operacionales que permitan la ejecución exitosa y mantenimiento sostenible de soluciones GenAI.

Requisitos y competencias

Experiencia Profunda en GenAI/LLM: 3+ años de experiencia práctica diseñando e implementando soluciones de producción basadas en Large Language Models, incluyendo sistemas RAG, agentes conversacionales, y generación de contenido. Experiencia comprobada llevando proyectos GenAI desde discovery hasta producción.

Dominio de Frameworks y Herramientas GenAI: Experiencia avanzada con frameworks como LangChain, LlamaIndex, o similares. Conocimiento profundo de plataformas de LLM (OpenAI API, Anthropic Claude, Google Gemini) y sus capacidades de function calling, structured outputs, y JSON mode.

Expertise en Sistemas RAG: Experiencia sólida implementando arquitecturas RAG completas incluyendo document processing, chunking strategies, embedding models (OpenAI, sentence-transformers), vectorstores (Pinecone, Chroma, Weaviate, pgvector), retrieval strategies (semantic search, hybrid search, re-ranking), y generation patterns.

Prompt Engineering Avanzado: Habilidad comprobada diseñando y optimizando prompts complejos usando técnicas avanzadas (few-shot, chain-of-thought, ReAct). Experiencia implementando guardrails efectivos contra alucinaciones, incluyendo grounding, citation enforcement, y validation post-processing.

Familiaridad con frameworks de agentes multi-agente como AutoGen, CrewAI, o LangGraph para orquestar workflows complejos.

Desarrollo de Software y Arquitectura: Sólidas habilidades de programación en Python con experiencia en desarrollo de aplicaciones escalables. Conocimiento de patrones arquitectónicos (microservicios, event-driven), APIs RESTful, y mejores prácticas de ingeniería de software (testing, CI/CD, version control).

MLOps y Despliegue en Producción: Experiencia implementando pipelines de ML en producción incluyendo model serving, monitoring, logging, y continuous evaluation. Familiaridad con containerización (Docker), orchestration (Kubernetes), e infrastructure as code (Terraform).

Plataformas Cloud y Servicios de IA: Experiencia práctica con servicios cloud de AI/ML en AWS (Bedrock, SageMaker), Google Cloud (Vertex AI), o Azure (OpenAI Service). Conocimiento de compute, storage, networking, y managed services.

Data Engineering y Procesamiento: Experiencia procesando datos no estructurados (PDFs, documentos, HTML), estructurados (bases de datos, APIs), y semi-estructurados. Conocimiento de ETL/ELT, data pipelines, y herramientas de procesamiento (pandas, Apache Spark).

Evaluación y Testing de Sistemas GenAI: Experiencia implementando frameworks de evaluación para sistemas GenAI usando métricas automáticas, evaluación humana, y benchmarking. Conocimiento de métricas de retrieval (precision, recall, MRR, NDCG) y métricas de generación (BLEU, ROUGE, BERTScore).

Seguridad y Compliance: Conocimiento de security best practices en GenAI incluyendo prompt injection defense, PII protection, access control, y audit logging. Familiaridad con regulaciones de privacidad (GDPR, CCPA) y su aplicación en sistemas de IA.

Habilidades de Comunicación Técnica: Capacidad excepcional para comunicar conceptos técnicos complejos a audiencias diversas, presentar arquitecturas y trade-offs a stakeholders ejecutivos, y crear documentación técnica clara y comprensiva.

Mentalidad de Producto y Foco en Negocio: Capacidad para traducir requisitos de negocio en soluciones técnicas, definir métricas de éxito alineadas con objetivos empresariales, y optimizar soluciones para maximizar ROI y valor del cliente.

Experiencia Trabajando con Clientes: Experiencia en consultoría técnica o roles customer-facing, con habilidad para realizar discovery sessions, manejar expectativas, y comunicar riesgos y oportunidades de manera transparente.

Inglés Avanzado: Capacidad para comunicarse efectivamente en inglés técnico, tanto verbal como escrito, para colaboración con equipos internacionales y lectura de documentación técnica.

Habilidades deseables

Experiencia con modelos open-source (Llama 3, Mistral, Falcon) y self-hosted deployments usando vLLM, TGI, o Ollama.

Conocimiento profundo de técnicas avanzadas de RAG como HyDE (Hypothetical Document Embeddings), query decomposition, multi-query retrieval, parent document retrieval, y contextual compression.

Experiencia con fine-tuning de LLMs usando técnicas eficientes como LoRA, QLoRA, o PEFT para adaptar modelos a dominios específicos.

Experiencia implementando GraphRAG o Knowledge Graph-augmented RAG para razonamiento sobre relaciones complejas entre entidades.

Conocimiento de técnicas de model compression, quantization (GGUF, GPTQ), y optimization para reducir latencia y costos.

Experiencia con herramientas de observabilidad especializada para GenAI como LangFuse, LangSmith, Weights & Biases (W&B), Arize, o Phoenix.

Certificaciones en cloud platforms (AWS Solutions Architect, Google Cloud Professional ML Engineer) o certificaciones específicas de GenAI/LLM.

Background en research de NLP/ML con publicaciones o contribuciones a proyectos open-source de GenAI.

Experiencia implementando responsible AI practices incluyendo fairness testing, bias detection, explainability, y AI governance frameworks.

Conocimiento de técnicas avanzadas de prompt optimization como DSPy, automatic prompt engineering, o prompt compression.

Experiencia con multimodal LLMs (GPT-4 Vision, Gemini Pro Vision, Claude 3) para procesar imágenes, audio, o video junto con texto.

Beneficios

  • 💻 Trabajo 100% remoto con horario alineado a CST.
  • 🏖️ PTO ilimitado: Confiamos en que gestionarás tu tiempo de manera efectiva.
  • 🎓 Presupuesto anual para desarrollo: Acceso a cursos, certificaciones y conferencias.
  • 🛠️ Presupuesto para equipamiento: Configura tu espacio de trabajo remoto ideal.
  • 🩺 Beneficio de salud: Acceso a cobertura médica privada o subsidios para seguro médico.
  • 🚀 Oportunidades de crecimiento: Plan de carrera y mentoría con expertos en IA y tecnología.
  • 🚀 Ambiente de startup dinámico y flexible: Autonomía para tomar decisiones y proponer ideas, con un enfoque en resultados en lugar de horas trabajadas.
  • ⚖️ Balance vida-trabajo: Cultura que prioriza la flexibilidad y el bienestar, permitiéndote gestionar tu tiempo sin sacrificar tu vida personal.

**¡**Te invitamos a postularte!

Incluso si no cumples con todos los requisitos, valoramos experiencias y perspectivas diversas. Si te apasiona el reclutamiento y quieres crecer en una empresa enfocada en datos e IA, ¡nos encantaría conocerte!

Unlock all Arc benefits!

  • Browse remote jobs in one place
  • Land interviews more quickly
  • Get hands-on recruiter support
PRODUCTS
Arc

The remote career platform for talent

Codementor

Find a mentor to help you in real time

LINKS
About usPricingArc Careers - Hiring Now!Remote Junior JobsRemote jobsCareer Success StoriesTalent Career BlogArc Newsletter
JOBS BY EXPERTISE
Remote Front End Developer JobsRemote Back End Developer JobsRemote Full Stack Developer JobsRemote Mobile Developer JobsRemote Data Scientist JobsRemote Game Developer JobsRemote Data Engineer JobsRemote Programming JobsRemote Design JobsRemote Marketing JobsRemote Product Manager JobsRemote Project Manager JobsRemote Administrative Support Jobs
JOBS BY TECH STACKS
Remote AWS Developer JobsRemote Java Developer JobsRemote Javascript Developer JobsRemote Python Developer JobsRemote React Developer JobsRemote Shopify Developer JobsRemote SQL Developer JobsRemote Unity Developer JobsRemote Wordpress Developer JobsRemote Web Development JobsRemote Motion Graphic JobsRemote SEO JobsRemote AI Jobs
© Copyright 2026 Arc
Cookie PolicyPrivacy PolicyTerms of Service