ABSTRACT

El objetivo del presente capítulo es sentar las bases metodológicas de la investigación basada en corpus presentada en este volumen. Con este fin, se introducen las principales premisas teóricas y metodológicas de la lingüística de corpus para justificar por qué se ha elegido este paradigma en concreto para explorar las peculiaridades discursivas del discurso especializado y de la divulgación. Seguidamente, se presenta WebLesp, un corpus electrónico que reúne textos representativos de la comunicación digital especializada en español en cuatro ámbitos del saber: ciencias ambientales, derecho, economía y medicina. El diseño y la compilación del corpus responden al objetivo de la investigación, es decir, explorar las dinámicas de recontextualización del conocimiento especializado, con un foco especial en la comunicación divulgativa que se realiza en la web para poner conocimientos especializados a disposición de un público lego.

Después de ilustrar las premisas teóricas en que se sustenta el diseño del corpus, se describen su estructura, los métodos utilizados para su etiquetado y las herramientas que permiten su consulta. En la segunda parte del capítulo se propone una serie de aplicaciones prácticas del corpus, disponible en una plataforma abierta de interrogación que utiliza el programa NoSketch Engine: utilizando las principales herramientas de análisis proporcionadas por la lingüística de corpus (listados de frecuencia, colocaciones, concordancias, keywords), se ilustran las potencialidades del corpus para el análisis del discurso especializado y divulgativo.