Actividades

Filtrar por categoría

Resultados de la evaluación del chatbot prevenIA

Seminario de Informática ‘Mirian Andrés’. Métodos para mejorar la seguridad de las respuestas en un chatbot que proporciona información sobre suicidio en castellano

19 Sep 2025
19 Sep 2025

10:00 horas
Seminario Mirian Andrés
Complejo Científico-Tecnológico (CCT)
Entrada libre

Programa


10:00 horas

Métodos para mejorar la seguridad de las respuestas en un chatbot que proporciona información sobre suicidio en castellano

César Domínguez Pérez
Grupo PSYCOTRIP
Universidad de La Rioja

Nota: La charla es una prueba de tiempo de la ponencia que presentará César en el XLI Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural que se celebrará en Zaragoza del 23 al 26 de septiembre. 

Resumen

Los chatbots tienen un gran potencial para proporcionar información valiosa en campos sensibles como la salud mental. Sin embargo, garantizar la fiabilidad y la seguridad de estos sistemas es fundamental y representa un paso crucial antes del despliegue de los chatbots.

En esta charla, presentamos nuestro trabajo orientado a mejorar la seguridad de un chatbot en español basado en el modelo Retrieval-Augmented Generation (RAG) y diseñado para ofrecer información sobre el suicidio. A través de un proceso de validación en múltiples etapas, identificamos y clasificamos las respuestas inseguras del chatbot utilizando modelos de clasificación de red-teaming y mediante una validación manual por parte de expertos. Este proceso nos permitió descubrir varias fuentes de respuestas inseguras y aplicar estrategias específicas para mitigarlas.

Como resultado, menos del 1 por mil de las preguntas formuladas por los usuarios y menos del 5 por mil de las preguntas de red-teaming fueron clasificadas como inseguras. Las acciones propuestas se centraron en mejorar los componentes clave del chatbot (incluyendo la base de datos de documentos, el diseño del prompt y el modelo de lenguaje) y pueden extrapolarse para mejorar la seguridad de otros chatbots similares basados en RAG.

Seminario Mirian Andrés

El Seminario se lleva celebrando en la Universidad de La Rioja desde el año 2008 con el nombre de Seminario Mirian Andrés, y desde el año 2001 como Seminario de Informática. Generalmente las charlas tienen lugar en el Complejo Científico-Tecnológico (CCT) de la UR  y en horario de mañana.

Listado de charlas del Seminario Mirian Andrés

Mirian Andrés (1979-2008) fue compañera y participante en este Seminario durante el tiempo que trabajó en la Universidad de La Rioja.

Para quién

Público en general.
Entrada libre hasta completar el aforo.

Contacto

Jónathan Heras Vicente
Beatriz Pérez Valle
Departamento de Matemáticas y Computación
Universidad de La Rioja

Dirección

Jónathan Heras Vicente
jonathan.heras@unirioja.es

Beatriz Pérez Valle
beatriz.perez@unirioja.es
Departamento de Matemáticas y Computación
Universidad de La Rioja

© Imagen destacada de
Christina @wocintechchat

Buscar actividades

Próximas actividades