CORPORART – corpus comparável PT/IT de especialidade no domínio da Arte Pública

 

Descrição

O CORPORART – PT/IT é um corpus bilingue, comparável, do domínio da Arte Pública. É composto por dois subcorpora contemporâneos de Português Europeu e Italiano, período de 2000 a 2018, compreendendo tipos de texto e subdomínios representativos da produção de textos de especialidade num domínio altamente interdisciplinar.

Os critérios de seleção (determinação dos tipos de texto, especificação e seleção de subdomínios) e consequente representatividade foram validados por especialistas no domínio, tendo como resultado um corpus de especialidade bilingue equilibrado e representativo.

Mais sobre o corpus:
Barbero, C. (2019). CORPORART – um corpus de arte pública para a extração de léxico: representatividade e comparabilidade em corpora de especialidade. Revista da Associação Portuguesa de Linguística, n.º 5, 09/2019, pp. 43-57, https://doi.org/10.26334//2183-9077/rapln5ano2019a4

Acesso

Os ficheiros dos corpora e respetiva documentação (ficheiros de meta dados) são disponibilizados sob a licença internacional Attribution-NonCommercial-NoDerivatives 4.0 International da Creative Commons.
Os ficheiros dos corpora estão em formato .txt, comprimidos; os ficheiros de meta dados e as listas de palavras estão em formato .xlsx.
Para aceder aos ficheiros do CORPORART, por favor preencha e assine esta declaração e envie-a para: sec.clunl@fcsh.unl.pt

Aceda aos meta dados:
CORPORART_PT_data
CORPORART_IT_data

Aceda às listas de palavras:
CORPORART_PT_wdlist
CORPORART_IT_wdlist

Equipa

Chiara Barbero
Prof.ª Raquel Amaro (coordenação)
Prof.ª Rita Ochoa (consultoria de especialidade), Universidade da Beira Interior

O CORPORART foi compilado por Chiara Barbero, no âmbito do seu projeto de doutoramento, para a extração de léxico de especialidade. O trabalho foi financiado pela FCT – Fundação para a Ciência e a Tecnologia – bolsa de doutoramento KRUse (PD/BD/128131/2016).