Junior Data Scientist Python, hibrido
6 hours ago
Madrid
En PROCESIA construimos soluciones donde la IA deja de ser un buzzword y se convierte en asistentes, buscadores inteligentes, sistemas de ayuda y herramientas que entienden el lenguaje humano. Trabajamos en proyectos de alto impacto, con equipos donde conviven perfiles muy técnicos y otros muy funcionales, y donde cada persona puede aportar su mirada a cómo debe comportarse la IA. No buscamos “un perfil de datos más”, buscamos a quien se pregunte constantemente: “¿de verdad este modelo está entendiendo lo que el usuario quiere decir?”. Te mueves con naturalidad entre Python, pandas, numpy, scikit‑learn, y no tienes miedo a abrir un notebook y explorar datos textuales desde cero. Has pasado varios años construyendo soluciones de NLP (clasificación, extracción de entidades, búsqueda semántica, resúmenes, etc.), no solo leyendo papers. Disfrutas explicando resultados a gente no técnica, buscando ejemplos claros y visualizaciones que “cuenten la historia” del modelo. ¿Formarás parte de un equipo donde también hay Consultores Python, arquitectos y otros Data Scientists, con los que co‑diseñarás soluciones end‑to‑end. En la práctica, te ocuparás de: Diseñar y entrenar modelos de NLP, tanto clásicos como basados en Transformers, para resolver problemas concretos (búsqueda, clasificación, extracción, resumen, etc.). Preparar y entender los datos textuales: limpieza, normalización, anotación, definición de etiquetas y métricas que tengan sentido para negocio. Trabajar mano a mano con el equipo de desarrollo para que tus modelos se integren en APIs y servicios que funcionan en Kubernetes y entornos CI/CD. Documentar de forma clara lo que hace el modelo, sus límites y cómo evolucionarlo, ayudando a que el conocimiento no se quede solo en el código. Lo que necesitamos de tu experiencia Este, no es un rol junior ; vas a tomar decisiones que definen cómo se comportan soluciones de IA clave. Al menos 7 años de experiencia en proyectos TI y 5 años trabajando en soluciones de datos o inteligencia artificial a gran escala. Varios años de práctica real en NLP y ciencia de datos con Python (pandas, numpy, scikit‑learn, visualización con matplotlib, seaborn y notebooks). Experiencia demostrable trabajando con IA generativa, LLMs y arquitecturas RAG, más allá de pruebas puntuales. Valorable experiencia con Kubernetes, orquestación de contenedores, observabilidad y bases de datos vectoriales, trabajando en equipo con perfiles de MLOps y backend. ¿Proyecto estable, de gran visibilidad y con una fuerte carga tecnológica e innovadora en servicios de inteligencia artificial. ~ Modalidad hibrida con 33% de presencialidad ( Pozuelo de Alarcón / Zona norte) ~ Contrato indefinido, jornada completa, modelo híbrido/remoto y horarios flexibles para que conciliar sea algo real, no un deseo. ~ Clases de inglés desde el primer día, soporte para certificaciones técnicas y un plan de carrera personalizado pensado para que tu perfil arquitecto siga creciendo cada año. ~3 meses de jornada intensiva en verano y jornada intensiva todos los viernes, además de no trabajar Nochebuena ni Fin de Año. ~ Seguro médico privado sin copagos, entorno cercano y positivo, café y té gratis en oficina y un modelo de Management 3.0 donde tu criterio pesa y se escucha. ~ Salario competitivo, alineado con tu experiencia y potencial.