Secció de Ciències i Tecnologia

Semàntica de les paraules del català: teoria i aplicacions clíniques / [Convocatòria IEC 2023]

Direcció

Antoni Hernández-Fernández
Institut d'Estudis Catalans - Universitat Politècnica de Catalunya

Ponent

Ramon López de Mántaras i Badia
Institut d'Estudis Catalans -

Codirectors:
 
Isabel Gómez-Ruiz (Hospital General de l’Hospitalet de Llobregat)
Iván González Torre (Universidad Politécnica de Madrid i Universidad del País Vasco/Euskal Herriko Unibertsitatea)
 

Col·laboradors: 

Jaume Baixeries I Juvillà (Universitat Politècnica de Catalunya)
Alejandro Cano Villagrasa (Clínica de Logopèdia Fundació Lluís Alcanyís, Universitat de València)
Neus Català Roig (Universitat Politècnica de Catalunya)
Faustino Diéguez-Vide (Universitat de Barcelona)
Ramon Ferrer i Cancho (Universitat Politècnica de Catalunya)
Beatriz Gómez Gutiérrez (Hospital General de l’Hospitalet de Llobregat)
Lucas Lacasa (IFISC, Universitat Illes Balears-CSIC)
Bartolomé Luque Serrano (Universidad Politécnica de Madrid)
Elisenda Reig Puig (Hospital General de l’Hospitalet de Llobregat)
Mónica Romero Ferrón (Universidad Politécnica de Madrid)
Vicent Rosell Clarí (Clínica de Logopèdia Fundació Lluís Alcanyís, Universitat
de València)
Judith Valderrey Cenador (Hospital General de l’Hospitalet de Llobregat)
Berta Vallès Paüls (Hospital General de l’Hospitalet de Llobregat)
Maite Zaragoza Cortés (Universitat de Barcelona)

 

Síntesi

L’estudi de les lleis lingüístiques ha permès en els darrers anys determinar patrons estadístics i models generals en les llengües amb potencials aplicacions, així com també la millora de tecnologies lingüístiques basades en sistemes computacionals. El català no pot quedar al marge de la recerca en aquests camps, en especial en les possibilitats futures que pot presentar en l’àmbit de la salut. En el cas de la pràctica clínica, a un estudi previ es van comparar les dades provinents de corpus de subjectes sans amb dades procedents de persones amb neuropatologies, el que va permetre obtenir un marcador per a la detecció precoç de la demència d’Alzheimer i del deteriorament cognitiu lleu, partint simplement de l’anàlisi de distribució de les pauses en la parla (Pastoriza et al, 2022).

Amb aquest precedent esperançador, aquest projecte se centra en les aplicacions clíniques de la lingüística quantitativa, en dos nivells:
  • Un nivell teòric previ, en què s’estudiïn els models matemàtics que permetin caracteritzar la semàntica, i de retruc la sintaxi, dels mots del català, partint de dades de corpus coneguts (CTILC, Glissando...) i del Diccionari normatiu (DIEC2).
  • Un nivell experimental, per a estendre les aplicacions clíniques de l’estudi estadístic del català al cas de les afàsies, demències o altres patologies.
Els objectius generals d’aquest projecte són:
  • Comparar l’anàlisi semàntica i sintàctica dels corpus orals i escrits ja estudiats del català, amb l’anàlisi semàntica i sintàctica de la base de dades obtinguda a partir dels enregistraments i transcripcions de persones catalanoparlants amb afàsia o altres malalties, feta amb la col·laboració d’investigadors d’hospitals i centres de logopèdia.
  • Establir les característiques estadístiques bàsiques dels mots del català pel que fa a la seva semàntica, basada en les definicions del diccionari normatiu.
  • Publicar els resultats obtinguts en revistes internacionals d’impacte.
  • Generar una base de dades i de programari pública de tot l’estudi, accessible a la comunitat científica, un cop obtinguts els pertinents permisos dels comitès d’ètica d’investigació clínica.

 

Abstract 
 
In recent years the study of linguistic laws has made it possible to determine statistical patterns and general models in languages, with potential applications, as well as the improvement of linguistic technologies based on computational systems. Catalan cannot be left out of research in these fields, especially in future possibilities it may arise in Health. In the case of clinical practice, a previous study compared data from corpora of healthy subjects with data from people with neuropathologies, which made it possible to obtain a marker for the early detection of Alzheimer's dementia and of mild cognitive impairment, simply starting from the analysis of the distribution of pauses in speech (Pastoriza et al, 2022).
 
With this hopeful precedent, this project focuses on the clinical applications of quantitative linguistics, at two levels:
• A previous theoretical level, in which mathematical models are studied that allow the semantics, and in short the syntax, of Catalan words to be characterized, based on data from well-known corpora (CTILC, Glissando...) and the Normative Dictionary (DIEC2).
• An experimental level, to extend the clinical applications of the statistical study of Catalan to the case of aphasia, dementia or other pathologies.

 

Paraules clau

Lingüística quantitativa, lleis lingüístiques, corpus lingüístics del català (textuals i orals), lingüística clínica, afàsia, demència, corpus CTILC, corpus Glissando.

 

Inici del projecte

2022 -

 

Antecedents

Aquest projecte es fonamenta en un projecte anterior sobre Lingüística Quantitativa del català (2019-2020), amb publicacions disponibles a: https://futur.upc.edu/24251874, prorrogat el 2021 per a explorar les potencials aplicacions de la lingüística quantitativa (publicacions disponibles a: https://futur.upc.edu/30546321). 

La xarxa de col·laboradors generada en aquests projectes previs s’ha ampliat a dos centres de salut que permetran l’obtenció de dades experimentals a València i Hospitalet de Llobregat, per tal d’explorar les potencials aplicacions clíniques de la lingüística quantitativa en el català, tema sobre el qual ja hi ha el precedent positiu de l’estudi de pauses en la malaltia d’Alzheimer fruit del projecte anterior:
 
Pastoriza, P.  et al. (2022).  Speech pause distribution as an early marker for Alzheimer's disease. Speech communication,  vol. 136, p. 107-117. https://doi.org/10.1016/j.specom.2021.11.009
 

 

Resultats

Torre, I.G.; Debowski, L.; Hernández-Fernández, A. (2022). Considering Menzerath and Menzerath-Altmann’s law as a criterion of complexity in communication.  CCS 2022 - Conference on Complex Systems 2022, Palma de Mallorca, 17-21 d’octubre de 2022. 

Torre, I.G.; Debowski, L.; Hernández-Fernández, A. (2022). Menzerath and Menzerath-Altmann's law as a criterion of complexity in communication. XXIII Congreso de Física Estadística, FisEs’22, Zaragoza, 12-14 de maig de 2022. 
 
Zaragoza M. et al. (2022). Adaptació de la Bateria d'Afàsies Western al català. Quadern d'estímuls en català. https://futur.upc.edu/34265370 
 
Zaragoza M. et al. (2022). Adaptació de la Bateria d'Afàsies Western al castellà. Quadern d'estímuls en castellà-grup control. (pendent de publicació en línia)
 

Altres resultats
 
Durant el 2022 s’han realitzat els informes oportuns per a l’obtenció del vistiplau dels comitès d’ètica de la recerca clínica (CSI-IDIBELL) i de la Universitat Politècnica de Catalunya, incloent-hi l’Avaluació d’Impacte de Protecció de Dades (AIPD).

 

Més informació

 Més informació al web del projecte: https://futur.upc.edu/32847767

 

 

Àrea geogràfica


Pàgines Web

https://futur.upc.edu/32847767


 


Amb el suport de

 

Departament d’Empresa i Coneixement de la Generalitat de Catalunya

Departament de Cultura de la Generalitat de Catalunya

i la col·laboració de

Departament de Justícia

Ministerio de Ciencia e Innovación

Ministerio de Educación, Cultura y Deporte