Constitució d’un corpus textual per a una gramàtica del català modern (Gcm) i III

Direcció

Josep Martines Peres
Institut d'Estudis Catalans - Universitat d'Alacant

Col·laboradors:

Antoni Ferrando (membre de la SF de l’IEC; Universitat de València, ISIC-IVITRA)
Vicent Martines (membre de la SF de l'IEC; Universitat d’Alacant, ISIC-IVITRA)
Joan Miralles (membre de la SF de l’IEC; Universitat de les Illes Balears, ISIC-IVITRA)
Manuel Pérez-Saldanya (membre de la SF de l’IEC; Universitat de València, ISIC-IVITRA)
Jordi M. Antolí Martínez (Universitat d’Alacant, ISIC-IVITRA)
Vicent Beltran Calvo (Universitat d’Alacant, ISIC-IVITRA)
Maria Àngels Fuster Ortuño (Universitat d’Alacant, ISIC-IVITRA)
Josep Vicent Garcia Sebastià (Universitat d’Alacant, ISIC-IVITRA)
Maria Isabel Guardiola Savall (Universitat d’Alacant, ISIC-IVITRA)
Caterina Martínez Martínez (Universitat d’Alacant, ISIC-IVITRA)
Sandra Montserrat Buendia (Universitat d’Alacant, ISIC-IVITRA)
Jaume Pons Conca (Universitat d’Alacant, ISIC-IVITRA)
Ramon Ruiz Guardiola (Universitat d’Alacant, ISIC-IVITRA)
Elena Sánchez López (Universitat d’Alacant, ISIC-IVITRA) 
Carles Segura Llopes (Universitat d’Alacant, ISIC-IVITRA)
Andreu Sentí (Universitat d’Alacant, ISIC-IVITRA)
 
Síntesi

L’Institut d’Estudis Catalans (IEC) i l’Institut Superior d’Investigació Cooperativa-IVITRA (ISIC-IVITRA, Universitat d’Alacant) treballen en la constitució d’un corpus textual de la llengua catalana dins el període comprès des dels primers textos fins al fins al 1833 (data presa com a referència de l’inici de la Renaixença i del procés de codificació del català contemporani).

Es desenvolupen i apliquen eines informàtiques que permeten la lematització d’aquest corpus i en faciliten l’aprofitament per a l’elaboració de la Gramàtica del català modern (1601-1833) i completar la Gramàtica del català antic (fins al segle XVI).
 
La magnitud de la producció escrita en català durant el període 1601-1833 i la necessitat de disposar d’un corpus suficientment representatiu de la variació territorial, funcional i cronològica han fet veure la necessitat de continuar la recerca. 
 
Els objectius d’aquesta darrera fase seran: 
  • Cloure la constitució d’un corpus textual de la llengua catalana dins el període comprés des del s. XVII (data en què es va tancar el corpus de català antic) fins al 1833 (data presa com a referència de l’inici de la Renaixença i del procés de codificació del català contemporani). 
  • Revisar l’aplicació de les eines informàtiques desenvolupades ad hoc per al projecte quant a la lematització i l’etiquetatge d’aquest corpus.
 
Abstract
The aim of this project is to develop a computerized corpus of Modern Catalan (1601-1833), designed to facilitate research on grammar, and also to carry out the necessary task that will allow the computerized recovery of information and will facilitate syntagmatic research. To achieve this goal we have the suport of the institutional project of the University of Alicante IVITRA > the ISIC-IVITRA (Higher Cooperative Research Institute IVITRA (http://www.ivitra.ua.es). This corpus constitutes the basis of the development of the Modern Catalan Grammar. The corpus comprises texts that span from the 17th century to 1833.
 
 

 

Paraules clau

Corpus textual informatitzat, català antic, català modern (1601-1833), gramàtica, lexicologia, semàntica, morfologia, lingüística diacrònica

 

Inici del projecte

2018 -

 

Antecedents

 a) La constitució del corpus del català antic, fonamental per a l’elaboració de la Gramàtica del català antic, i centrada en la descripció de l’evolució (sobretot de la sintaxi i la morfologia) de la llengua catalana des dels primers textos fins al s. XVI. Obra que està en procés avançat de redacció. (PT2008-S0406-MARTINES0) 

b) La constitució d’una primera fase del corpus del català modern centrat en el període que abasta des de 1601 fins a 1833 i que servirà de fonament per a la redacció de la Gramàtica del català modern. (PT2012-S0406-MARTINES
 
c) La constitució d’una segona fase del corpus del català modern que conté un corpus que inclou 5.732.894 mots i 243 textos. (PT2015-S04-MARTINES)
 
 

 

Resultats

Corpus textual accessible en línia
Organització i participació en trobades científiques
Publicacions de llibres i d’articles 

 

 

Més informació

 

 

 

 

 

Secció Filològica - Projectes de recerca

Àrea geogràfica


Pàgines Web

 

 

 

 

 

Institut d'Estudis Catalans. Carrer del Carme, 47; 08001 Barcelona.
Telèfon +34 932 701 620. Fax +34 932 701 180. informacio@iec.cat - Informació legal


Amb el suport de

Departament d’Empresa i Coneixement de la Generalitat de Catalunya Departament de Cultura de la Generalitat de Catalunya

i la col·laboració de

Ministerio de Educación, Cultura y Deporte        Ministerio de Educación, Cultura y Deporte

Inici

Institució

Recerca

 

Llengua

 

Publicacions

Arxiu

Serveis

Serveis lingüístics

Transparència