Corpus oral de la llengua catalana (COLC)

Direcció

Pere J. Quetglas Nicolau
Institut d'Estudis Catalans - Universitat de Barcelona

Investigadors:

Lluís de Yazaguirre i Maura, UPF
 
Síntesi

El projecte Corpus Oral de la Llengua Catalana (COLC) té com a objectius la conservació, la informatització, l’accessibilitat, la difusió i la valoració dels corpus orals enregistrats. Això comporta necessàriament la participació de lingüistes, informàtics i analistes de dades, especialistes en mitjans audiovisuals i en emmagatzematge de dades. Es tracta, per tant, d’un projecte molt transversal i d’ampli abast.

En vistes al seu desenvolupament caldrà tenir en compte els precedents existents de corpus orals d’altres llengües, com són: en el cas del francès el projecte Corpus de Langue Parlée en Interaction (CLAPI), el projecte Phonologie du Français Contemporain (PFC), o en el cas de la comparativa lingüística el C-ORAL-ROM,  que fa comparacions de llenguatge espontani en quatre llengües romàniques: francès, italià, portuguès i espanyol. Però, d’altra banda, caldrà tenir molt en compte, per tal d’optimitzar els recursos, els projectes previs desenvolupats en el si de les universitats de l’àmbit de la llengua catalana com:  
En una primera part el projecte se centrarà en les representacions del llenguatge formal i les dimensions que caldrà representar:
  1. Dimensió territorial
  2. Àmbits d’ús general més usuals
 
La planificació del projecte es dividirà en tres fases:
  1. Anàlisi dels models existents i tria del més adient a les necessitats del projecte. Inclou la fixació dels requeriments i de les normes de transcripció i codificació.
  2. Inici de les tasques d’enregistrament o d’incorporació d’enregistraments aliens. Trasllat i tractament dels enregistraments a una plataforma operativa i interactiva que permetrà la intervenció i execució de motors de cerca i la recuperació de la informació emmagatzemada. 
  3. Aplicació sistemàtica del model a alguns dels àmbit d’ús més generals, preferentment en l’àmbit mediàtic.
 
Abstract
The project Corpus Oral de la Llengua Catalana (COLC) have as objectives the conservation, computerization, accessibility, dissemination and evaluation of oral corpus recorded. This necessarily involves the participation of linguists, computer scientists and data analysts, specialists in audiovisual media and in data storage. It is, therefore, a very transversal and wide-ranging project.
In the first part, the project will focus on the representations of formal language and the dimensions that will need to be represented:
1. Territorial dimension
2. Most commonly used areas of use

 

Paraules clau

Recursos lingüístics orals, corpus lingüístics orals

 

Inici del projecte

2017 -

 

Antecedents

La creació de corpus textuals és una de les tasques que la Secció Filològica de l’IEC ha desenvolupat com a suport per a l’elaboració de la Gramàtica de la llengua catalana  i de l’Ortografia catalana, com posem de manifest els projectes de Constitució d’un Corpus Textual per a una Gramàtica del Català Modern (GCM) o la constitució del Corpus Textual Informatitzat de la Llengua Catalana (CTILC2).  Independentment que calgui continuar la implementació de corpus com els esmentats, una vegada assolida la fita de la publicació de la Gramàtica i de l’Ortografia de l’IEC, és el moment de plantejar-se altres fites que vagin més enllà del que és un corpus textual pensat bàsicament per desenvolupar pràctiques descriptives i prescriptives.

Si partim de la consideració nuclear que una llengua abans de ser fixada en forma escrita és un fenomen de parla, i que en l’acte de parlar a més de fenòmens suprasegmentals com l’entonació, l’èmfasi, les vacil·lacions i dubtes, o les particularitats fòniques, s’hi fan presents elements propis del llenguatge no verbal com és la gestualitat que acompanya el discurs i la postura dels partícips en l’acte, la seva forma d’escoltar i de fer-se escoltar, la seva forma de vestir, etc., veurem que hi ha molts aspectes que no poden ser captats a partir de corpus textuals escrits. Així mateix, no es pot defugir la realitat que la gent corrent parla molt més que no escriu, i que una llengua retratada només a partir de l’escriptura ha d’oferir necessàriament una imatge borrosa. I si, d’altra banda, els comportaments actitudinals evolucionen i canvien de generació en generació, és evident que una de les responsabilitats de l’IEC és la de salvar aquest patrimoni, al mateix temps que ha de poder posar a l’abast dels investigadors elements que vagin més enllà de projectes particulars i amb objectius més concrets. 
 

 

 

Resultats

Creació d’una plataforma web.

Organització de simposis
Articles científics i de divulgació
 

 

Més informació

 

 

 

 

 

Secció Filològica - Projectes de recerca

Àrea geogràfica


Pàgines Web

 

 

 

 

 

Institut d'Estudis Catalans. Carrer del Carme, 47; 08001 Barcelona.
Telèfon +34 932 701 620. Fax +34 932 701 180. informacio@iec.cat - Informació legal


Amb el suport de

Departament d’Empresa i Coneixement de la Generalitat de Catalunya Departament de Cultura de la Generalitat de Catalunya

i la col·laboració de

Ministerio de Educación, Cultura y Deporte        Ministerio de Educación, Cultura y Deporte

Inici

Institució

Recerca

 

Llengua

 

Publicacions

Arxiu

Serveis

Serveis lingüístics

Transparència