Descripción
Este curso está diseñado como una introducción práctica al uso de las principales bibliotecas de Procesamiento de Lenguaje Natural (PLN) en Python: NLTK, spaCy y Stanza. A través de una orientación basada en la resolución de problemas reales en PLN (tokenización, análisis sintáctico, extracción de información, normalización, etc.), el alumnado aprenderá a aplicar estas herramientas en distintos contextos, reconociendo las ventajas, limitaciones y particularidades de cada una. Asimismo, se explorarán aspectos más avanzados como la personalización de pipelines y el uso de modelos preentrenados.
El curso combina fundamentos teóricos con ejercicios prácticos y comparativos entre las bibliotecas, fomentando una visión crítica y estratégica del uso de herramientas en PLN.
Objetivos
Al finalizar el curso, el alumnado será capaz de:
- Comprender los conceptos fundamentales del Procesamiento de Lenguaje Natural.
- Identificar los principales problemas del PLN y las técnicas utilizadas para resolverlos.
- Implementar soluciones básicas y avanzadas a tareas de PLN utilizando NLTK, spaCy y Stanza.
- Comparar y evaluar estas bibliotecas según el problema, la precisión, el rendimiento y la facilidad de uso.
- Construir pipelines personalizados y utilizar modelos preentrenados para tareas específicas.
Contenidos
- Introducción al Procesamiento de Lenguaje Natural (PLN) y herramientas en Python.
- Problemáticas generales del PLN.
- Bibliotecas principales: Natural Language Toolkit (NLTK), spaCy y Stanza.
- Instalación y configuración de entornos de trabajo.
- Revisión rápida de Python para tareas de PLN.
- Tareas fundamentales del PLN.
- Tokenization, lematización y stemming.
- Part-of-Speech (POS) tagging.
- Análisis sintáctico.
- Named Entity Recognition (NER).
- Resolución de correferencias.
- Representaciones semánticas del lenguaje.
- Term Frequency–Inverse Document Frequency (TF-IDF).
- Embeddings estáticos vs embeddings contextuales.
- Modelos de representación semántica: Word2Vec, BERT, entre otros.
- Representación de oraciones y documentos.
- Aplicaciones prácticas del PLN.
- Extracción de información
- Análisis de sentimiento.
- Clasificación de texto.
- Personalización de pipelines y componentes.
- Diseño, modificación e integración de componentes en pipelines de procesamiento.
Duración y organización
El curso consta de 20 horas.
Las sesiones online síncronas que se impartirán de 18.00 a 20.00 horas (hora de Madrid) los siguientes días:
- Del 29 de septiembre al 3 de octubre
- Del 6 al 10 de octubre
Profesorado
Juan Consuegra Ayala
Investigador del Centro de Inteligencia Digital
Universidad de Alicante
Robiert Sepúlveda Torres
Investigador del Grupo de Procesamiento del Lenguaje y Sistemas de Información
Universidad de Alicante
Para quién
Estudiantes de Doctorado, Máster y últimos cursos de Grado.
Personal Docente e Investigador
Profesionales relacionados con el área.
Inscripción
Para participar en este curso, hay que realizar la inscripción. Se atenderá según orden de llegada hasta cubrir las plazas ofertadas.
Fin de plazo de inscripción/matrícula: 25/09/2025
La actividad podrá ser cancelada en el caso de no alcanzar un número mínimo de inscripciones, a determinar por la organización.
No se harán devoluciones de matrícula salvo por causas imputables a la organización, incluida la cancelación del curso por decisión de la Universidad.
Matrícula
Matrícula ordinaria: 200 €
Miembros de la Comunidad Universitaria de la Universidad de La Rioja: 100 €
Estudiantes de ediciones anteriores del Máster de Procesamiento del Lenguaje e Inteligencia Artificial (Universidad de La Rioja): 100 €
Segunda o sucesivas matriculaciones en los cursos formativos de especialización, dentro del marco del Proyecto ‘Economía Digital del Lenguaje e Inteligencia Artificial’: 100 €
Para inscripciones grupales de empresas o instituciones, contactar con la dirección académica del curso: ecodigleng@unirioja.es
Certificado
Se emitirá un certificado de realización del curso a las personas que hayan asistido con aprovechamiento al menos al 75% de las sesiones. La obtención del certificado estará sujeta a la participación activa en las sesiones y la realización de los ejercicios planteados por el profesorado del curso.
El profesorado podrá requerir la conexión al aula virtual por vídeo.
Acceso en modalidad asíncrona
El alumnado podrá acceder a las grabaciones de las sesiones a través del aula virtual del curso. Para el cumplimiento del requisito de asistencia y participación será necesario asistir a las sesiones de manera síncrona. No se certificarán cursos en los que más del 25% de las sesiones del curso se haya realizado en modalidad asíncrona.
El material del curso estará disponible en el aula virtual durante los tres meses siguientes a la finalización del curso.
Coordinadores académicos
Javier Martín Arista
Ana Elvira Ojanguren López
Universidad de La Rioja
ecodigleng@unirioja.es
Plan de Transformación
Economía Digital del Lenguaje e Inteligencia Artificial
Universidad de La Rioja
Etiquetas
Categorías
Noticias relacionadas
“Con la Inteligencia Artificial entramos en una nueva era, como cuando empezó Internet. Esto es una nueva imprenta"
El rector de la UR afirma que Dialnet será una “palanca para el desarrollo de La Rioja, España y Latinoamérica”
Actividades relacionadas