PLN y diseño de materiales didácticos de inglés para fines específicos

Paloma Blasco
29 mayo 2026
Colaboraciones, Lingüística

Como ya hemos visto en publicaciones anteriores del blog, no elegimos al azar las
palabras que usamos cuando hablamos de nosotros mismos en contextos profesionales:
detrás de muchos perfiles de LinkedIn o textos de marca personal hay patrones que se
repiten. El proyecto que estamos desarrollando parte precisamente de este punto y
pretende explorar cuáles son las estructuras y el vocabulario más frecuentes en este tipo de
discursos, es decir, qué utilizamos cuando nos presentamos al mundo a través de nuestra
marca personal.

Para ello, hemos seguido un proceso basado en distintas etapas propias del
Procesamiento del Lenguaje Natural (PLN), que han permitido organizar y estudiar el corpus
de forma automática y semiautomática.

En primer lugar, se llevó a cabo la compilación del corpus, compuesto por textos
reales relacionados con la marca personal, como perfiles de LinkedIn, secciones About me
o portafolios profesionales, que posteriormente fueron anonimizados. Todos los textos
fueron adaptados y convertidos a formato .txt con el objetivo de facilitar su procesamiento.

A continuación, se llevó a cabo el análisis del corpus mediante la herramienta
Stanford CoreNLP, que permite aplicar diferentes niveles de análisis lingüístico de forma
automática como la tokenización (segmentación del texto en palabras), la lematización
(reducción a la forma base) y el etiquetado morfosintáctico, que asigna a cada palabra su
categoría gramatical (verbo, sustantivo, adjetivo, etc).

Una vez llevado a cabo este análisis, procedimos a la extracción de la información
relevante. Por un lado, se identificaron los verbos más frecuentes, con especial atención a
aquellos relacionados con la acción y la experiencia profesional. Por otro, se analizó el
léxico predominante, centrándose en sustantivos y adjetivos vinculados al ámbito laboral.
También se observaron expresiones y estructuras recurrentes que aparecen de forma
sistemática en este tipo de discursos.

Además, parte del análisis fue desarrollado de forma paralela a partir de un código
proporcionado en el marco del proyecto desarrollado por Paloma, lo que permitió contrastar
los resultados obtenidos mediante diferentes procedimientos. Esta combinación de
enfoques (manual, automático y semiautomático) ha contribuido a obtener una visión más
completa y fiable de los patrones lingüísticos presentes en el corpus.

Este análisis constituye el punto de partida y gran parte del desarrollo del proyecto, ya que
permite transformar datos lingüísticos en recursos didácticos aplicables y, así, convertir el
lenguaje en una herramienta práctica al servicio de la comunicación profesional.

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Comentario *

Nombre *

Correo electrónico *

Web

Responsable: PALOMA BLASCO FERNÁNDEZ (CANIDO CONSTRUYENDO CONOCIMIENTOS)
Finalidad: moderar y responder a los comentarios y opiniones de los usuarios
Legitimación: El consentimiento de los usuarios.
Destinatarios: Uso interno de la información y sin realizar cesiones a terceros.
Derechos: Se podrán ejercer los derechos de acceso, rectificación, limitación y supresión de los datos en el correo construyendocanido@hotmail.com, así como el derecho a presentar una reclamación ante la autoridad de control competente en Agencia Española de Protección de Datos | AEPD
Información adicional: En la Política de Privacidad el usuario podrá encontrar información adicional sobre el uso y recopilación de información con datos personales realizados por la responsable.

He leído y acepto la Política de privacidad *

Este @ño *