Universidad Veracruzana

Saltar a contenido principal

Curso_Minería de Texto y Análisis de Lenguaje Natural

  • Fecha / Hora de inicio: 14 noviembre, 2025 18:30
  • Fecha / Hora fin: 13 diciembre, 2031 13:00
  • Lugar: Virtual
  • Costo: $ 3500.00

 

 

Descripción:

En la era del Big Data, la minería de texto y el análisis del lenguaje natural son herramientas clave para extraer conocimiento de datos no estructurados. Este curso ofrece una introducción integral a sus fundamentos, técnicas y aplicaciones prácticas, combinando enfoques teóricos y computacionales con una perspectiva aplicada para resolver problemas reales.

Los estudiantes aprenderán a procesar, limpiar y analizar textos mediante metodologías de procesamiento del lenguaje natural (PLN) y herramientas como Python, NLTK y spaCy. Se abordarán temas como preprocesamiento de datos, extracción de información, análisis de sentimientos, clasificación de textos, clustering, generación de resúmenes, modelado de tópicos y representación vectorial del lenguaje. También se discutirán aspectos éticos y legales, como el manejo de datos personales, sesgos algorítmicos y transparencia en los modelos.

El curso enfatiza la práctica con corpus reales de distintos ámbitos (educación, redes sociales, medios, salud, entre otros), permitiendo a los estudiantes diseñar proyectos aplicables para descubrir patrones y mejorar la toma de decisiones. Al finalizar, estarán preparados para emplear estas competencias en entornos académicos, empresariales o de investigación.


Video

 


Objetivo

Proporcionar a los participantes herramientas, habilidades y conocimientos fundamentales para diseñar e implementar sistemas inteligentes que permitan optimizar procesos, extraer valor de grandes volúmenes de información y mejorar la toma de decisiones en entornos reales.


Dirigido a
Estudiantes, investigadores y profesionales de disciplinas como ciencias de datos, lingüística computacional, inteligencia artificial, informática, comunicación y educación, entre otras áreas afines. Este curso está diseñado para quienes desean desarrollar habilidades para el procesamiento, análisis e interpretación de grandes volúmenes de datos textuales mediante técnicas avanzadas de minería de texto y procesamiento del lenguaje natural.

Costo: $ 3,500.00 (Tres mil quinientos pesos 00/100 M/N)
Importe y fecha:

1er. Pago: $ 1,831.00 del 10 al 14 de nov. de 2025 

2do. Pago: $ 1, 669.00  del 28 de nov. al 02 de diciembre de 2025 


Modalidad
Línea


Horarios y sesiones

Del 14 de nov. al  13 de diciembre de 2025

  • Viernes 14, 21 y 28 de noviembre, 05 y 12 de diciembre 2025 en horario de 18:30 a 21.30 hrs.
  • Martes 18 y 25 de noviembre 2025 en horario de 18:30 a 21 hrs.
  • Sábados 15, 22 y 29 de noviembre, 06 y 1 3 de diciembre 2025 en horario de 09:00 a 13:00 hrs.

 

Unidad 1: Fundamentos del Procesamiento de Lenguaje Natural (PLN)

1.1. Introducción al Procesamiento de Lenguaje Natural
1.2. Evaluación de Desempeño en Tareas de PLN
1.3. Herramientas y Tecnologías en PLN
1.4. Preprocesamiento de Texto
    1.4.1. Expresiones Regulares y su Aplicación
    1.4.2. Normalización y Limpieza de Textos
    1.4.3. Cálculo de Distancia de Edición
    1.4.4. Identificación de Palabras Vacías
    1.4.5. Técnicas de Lematización y Stemming
    1.4.6. Etiquetado de Partes de Discurso (POS Tagging)
    1.4.7. Análisis Sintáctico y Estructural
    1.4.8. Desambiguación Semántica de Términos

Unidad 2: Extracción y Análisis de Información

2.1. Reconocimiento de Entidades Nombradas (NER)
    2.1.1. Fuentes de Datos para NER
    2.1.2. Uso de Diccionarios y Reglas
    2.1.3. Enfoques de Aprendizaje Automático para NER
2.2. Extracción de Relaciones entre Entidades
    2.2.1. Creación y Uso de Corpora de Datos
    2.2.2. Técnicas para Extracción de Relaciones
    2.2.3. Extracción de Expresiones Temporales

Unidad 3: Representación y Modelado de Documentos

3.1. Modelos de Representación de Texto
    3.1.1. Modelo de Espacio Vectorial
    3.1.2. Modelos Probabilísticos y Estadísticos
    3.1.3. Modelos Semánticos Vectoriales
3.2. Técnicas de Ponderación de Términos
3.3. Selección y Reducción de Características (Feature Selection)

Unidad 4: Métodos de Clustering y Clasificación

4.1. Introducción a Técnicas de Clustering
4.2. Algoritmos de Clustering y su Aplicación
4.3. Estrategias de Clasificación de Textos
4.4. Herramientas y Librerías para Análisis de Clustering y Clasificación

Unidad 5: Aplicaciones Prácticas en Minería de Texto
5.1. Análisis de Sentimientos y Minería de Opiniones
5.2. Detección de Tendencias en Datos Textuales
5.3. Implementación de Proyectos de Minería de Texto en el Mundo Real

Unidad 6: Avances y Futuro de la Minería de Texto

6.1. Innovaciones Recientes en PLN
6.2. Desafíos Actuales en Minería de Texto
6.3. Futuras Tendencias en Procesamiento de Lenguaje Natural


Liga de preinscripción
Da Click aquí:

https://forms.gle/Qz5wbHVvcrxj4h449


Mtro.: René García Reyes

Profesional con más de 14 años de experiencia en los sectores tecnológico y eléctrico, con un enfoque especializado en la gestión de proyectos estratégicos de infraestructura energética renovable y sistemas avanzados de medición eléctrica (AMI). Se ha caracterizado por una constante búsqueda de soluciones innovadoras que integren tecnologías emergentes para optimizar procesos en el sector energético.

Actualmente, doctorando en el área de Inteligencia Computacional y Ciencia de Datos en el Centro Nacional de Investigación y Desarrollo Tecnológico (CENIDET), se encuentro desarrollando un modelo descentralizado para la gestión de grandes volúmenes de datos en sistemas de alumbrado público telemedido mediante la implementación de tecnologías disruptivas como IPFS, LZ4 y Blockchain. Esta investigación busca mejorar la eficiencia y seguridad en la gestión de datos en entornos públicos, particularmente en el sector energético.

Su experiencia abarca desde la supervisión de proyectos de infraestructura eléctrica de gran escala hasta el diseño y ejecución de sistemas tecnológicos avanzados. En su rol como Director de Proyectos en el Grupo O Ingeniería, lideró la implementación de soluciones innovadoras en el sector eléctrico, estableciendo relaciones estratégicas con clientes y coordinando equipos multidisciplinarios para cumplir con los objetivos de alto impacto. Asimismo, ha desarrollado habilidades en la gestión de relaciones comerciales y la negociación con proveedores, optimizando recursos y gestionando proyectos con un fuerte enfoque en la sostenibilidad ambiental.

Como docente e investigador, he impartido materias y diseñados programas educativos en diversas instituciones de educación superior, enfocados en el diseño y evaluación de proyectos de energías renovables, así como en la innovación tecnológica aplicada a sistemas de energía y datos. Su perfil se complementa con una formación académica continua en áreas clave como Machine Learning, Blockchain, y Big Data, buscando siempre combinar sus conocimientos técnicos con una visión estratégica y sostenible para la resolución de los retos más complejos del sector energético y tecnológico.

Apasionado por las tecnologías limpias y la sostenibilidad, su objetivo es contribuir al desarrollo de soluciones que permitan la transición hacia un modelo energético más eficiente, seguro y sostenible, aprovechando su experiencia técnica y capacidad para liderar proyectos innovadores en el ámbito de la infraestructura energética y la gestión descentralizada de datos.

 


 

LPyRRPP. Mara Patricia Ruíz Moreno
coordest5@uv.mx

tel. 228 8 42 17 00  ext. 11562

L.A.E. Jesus Efrén Martínez Rojas

efmartinez@uv.mx

tel. 228 8 42 17 00  ext. 11667


Programa registrado y autorizado por el Departamento de Educación Continua de la Dirección de Desarrollo Académico e Innovación Educativa de la Universidad Veracruzana.

CLAVE ACADÉMICA: CEC- 172-0525

“La Universidad Veracruzana se reserva el derecho de cancelar o posponer el presente
programa académico de educación continua, si no se cubre el cupo mínimo requerido”.