Continuació del Corpus Textual Informatitzat de la Llengua Catalana (CTIL2), fase inicial

Direcció

Joaquim Rafel i Fontanals
Institut d'Estudis Catalans -

1 Coordinador General 
3 Tècnics
1 Documentalista (amb dedicació del 50%)

 
Síntesi

El projecte de continuació del CTILC s’articula en dues fases: una fase inicial que té com a objectiu l’establiment de tots els elements, protocols de treball, etc. necessaris per al desenvolupament del projecte; i una fase executiva en què es desenvoluparà el corpus pròpiament dit, juntament amb tots els elements necessaris per a garantir-ne l’accessibilitat i l’explotació, tant per a usos interns com externs.

L’objectiu general del projecte és acomplir la fase inicial del CTILC2 que gira a l’entorn de tres aspectes bàsics, els dos primers dels quals es desenvoluparan paral·lelament:
  • La selecció de textos que hauran de formar part del corpus.
  • La planificació detallada, la integració de les diferents eines de constitució i la implementació dels processos per al desenvolupament de la fase executiva dels treballs de constitució del corpus.
  • L’inici dels treballs de constitució del nou corpus de manera experimental, introduint una part dels textos seleccionats, i l’establiment d’un sistema d’accés a les dades textuals.  

 

Abstract

This project is the continuation of the Corpus Textual Informatitzat de la Llengua Catalana (CTILC), the reference corpus of the contemporary Catalan Language. CTIL2 project seeks to achieve the following objectives: to select the texts which will be included in the Corpus, to develop the Corpus itself and to create an access system of textual data.

 

Paraules clau

Recursos lingüístics escrits, corpus lingüístics, lexicografia, lexicografia computacional

 

Inici del projecte

2015 -

 

Antecedents

Entre els recursos lingüístics constituïts per l’IEC, el CTILC ha estat i continua essent un element fonamental en la realització d’una gran part dels projectes lingüístics de l’IEC. Un ús especialment destacable és la redacció del Diccionari descriptiu de la llengua catalana (DDLC), que l’ha pres com a font d’informació exclusiva per a la descripció lèxica del català contemporani; però el CTILC també ha estat un recurs de primer ordre en la realització d’altres projectes lexicogràfics (com ara la segona edició del DIEC, o la segona edició del Diccionari manual de l’IEC, en curs d’elaboració) i fins i tot en el procés d’elaboració de la Gramàtica normativa, en què ha servit en moltes ocasions per a l’extracció de dades corresponents a fenòmens lingüístics de diversa mena.

 
Més enllà d’aquests usos, el CTILC constitueix una peça fonamental per a la realització dels projectes futurs de l’IEC en els quals destaca, particularment, l’elaboració del “Nou diccionari normatiu”.
 
Aquestes utilitzacions futures, juntament amb el manteniment de la funció que desenvolupa el corpus en l’àmbit dels professionals de la llengua i de la recerca lingüística, fan palesa la necessitat d’actualitzar aquest recurs amb nous textos posteriors a 1988, seleccionats a partir dels mateixos criteris d’equilibri i representativitat.
 
Ateses totes aquestes circumstàncies, la Secció Filològica va acordar que calia procedir a l’ampliació d’aquest corpus mitjançant la incorporació de textos més recents, i que calia considerar aquesta acció com a estratègica i prioritària entre els projectes de l’IEC. Per aquest motiu, hom aprovà un dictamen en què s’estableixen les línies bàsiques del disseny del futur CTILC, a partir de criteris de classificació i de selecció textuals similars als aplicats en la part ja constituïda del corpus.
 
Es tracta d’un projecte propi de l’IEC, que en principi es portarà a terme de manera independent d’altres institucions (universitats i centres de recerca) però que, si cal, podrà comptar amb col·laboracions externes. 

 

Resultats

En el moment de concloure aquesta fase inicial, hom preveu disposar de la llista del conjunt d’obres a incorporar al CTILC, i del disseny detallat de l’estructura, la definició de les fases i del pla de treball del procés de constitució del corpus, així com el conjunt integrat d’aplicacions informàtiques que s’utilitzaran.

Finalment, aquesta fase inicial produirà una primera versió, limitada quantitativament, del corpus de continuació accessible mitjançant l’aplicació de consulta constituïda en el projecte. 

Aquests resultats, en conjunt, permetran escometre amb plena eficiència la fase executiva del projecte.
 
 
Altres resultats

 

 

Més informació

 

 

 

 

 

Secció Filològica - Projectes de recerca

Àrea geogràfica


Pàgines Web

 

 

 

 

 

Institut d'Estudis Catalans. Carrer del Carme, 47; 08001 Barcelona.
Telèfon +34 932 701 620. Fax +34 932 701 180. informacio@iec.cat - Informació legal


Amb el suport de

Departament d’Empresa i Coneixement de la Generalitat de Catalunya Departament de Cultura de la Generalitat de Catalunya

i la col·laboració de

Ministerio de Educación, Cultura y Deporte        Ministerio de Educación, Cultura y Deporte

Inici

Institució

Recerca

 

Llengua

 

Publicacions

Arxiu

Serveis

Serveis lingüístics

Transparència