Recursos em linha


Corpora

CORPORART – corpus comparável PT/IT de especialidade no domínio da Arte Pública
O CORPORART – PT/IT é um corpus bilingue, comparável, do domínio da Arte Pública. É composto por dois subcorpora contemporâneos de Português Europeu e Italiano, período de 2000 a 2018, compreendendo tipos de texto e subdomínios representativos da produção de textos de especialidade num domínio altamente interdisciplinar.
Endereço: https://clunl.fcsh.unl.pt/recursos-em-linha/corpora/corporart-corpus-comparavel-pt-it-de-especialidade-no-dominio-da-arte-publica/

Corpus de Literatura Portuguesa para Distant Reading
O Corpus de Literatura Portuguesa para Distant Reading é um corpus literário de obras não canónicas de autores portugueses, datadas de 1840 a 1920.
Endereço: https://github.com/COST-ELTeC/ELTeC-por

MIGRANTE.PT
Resultado do projeto EXPRIMI, o MIGRANTE.PT é um corpus para fins específicos, com cerca de 1,5 milhões de palavras do Português Europeu, constituído por textos institucionais e compilado a partir de sites e materiais de acesso aberto relacionados com a integração de migrantes em Portugal e direcionados a esses mesmos migrantes.
Endereço: https://clunl.fcsh.unl.pt/recursos-em-linha/corpora/migrante-pt/

Parallel sense-annotated corpus ELEXIS-WSD 1.0
ELEXIS-WSD é um corpus paralelo de sentidos anotados, no qual palavras de conteúdo (substantivos, adjectivos, verbos, e advérbios) foram atribuídos sentidos. A versão 1.0 contém frases para 10 línguas: búlgaro, dinamarquês, inglês, espanhol, estónio, húngaro, italiano, neerlandês, português e esloveno (ler mais)
Endereço: http://hdl.handle.net/11356/1674

Léxicos, Dicionários, Glossários

BDTT-AR – Base de Dados Terminológica e Textual da Assembleia da República
A BDTT-AR é uma base de dados multilingue (Português, Inglês e Francês) que contém a terminologia utilizada no seio do parlamento português.
Endereço: http://terminologia.parlamento.pt/pls/ter/terwintra.home

Dicionário de Abreviaturas Digitais
O Dicionário de Abreviaturas Digitais contempla abreviaturas usadas pelas novas gerações falantes de português europeu na comunicação escrita nas redes sociais.
Endereço: https://www.lexonomy.eu/#/dig2023

DLP – Dicionário da Língua Portuguesa
O Dicionário da Língua Portuguesa da Academia das Ciências de Lisboa, tendo por base o Dicionário da Língua Portuguesa Contemporânea, coordenado por Malaca Casteleiro, foi publicada em abril de 2023 e encontra-se em permanente atualização (ler mais).
Endereço: https://dicionario.acad-ciencias.pt/

Dicionário Multilingue Multidomínio
O Dicionário Multilingue Multidomínio é uma base de dados criada a partir dos trabalhos desenvolvidos pelos alunos da Unidade Curricular “Terminologia” (NOVA FCSH) durante o 1º semestre do ano letivo 2022-2023 (1º ciclo de estudos). Os dados terminológicos que compõem as fichas foram extraídos de corpora de especialidade compilados pelos alunos.
Endereço: https://doi.org/10.34619/30qc-jzno

Glossário Colaborativo COVID-19
O Glossário Colaborativo COVID-19 é constituído pela terminologia utilizada pelos organismos oficiais de Saúde, pelos profissionais do setor e cientistas, assim como pelos meios de comunicação social e redes sociais
Endereço: https://www.lexonomy.eu/ec25mm79/

Glossários Terminológicos Multilingues para fins específicos na CPLP – Angola  
A pedido do Instituto Camões, o grupo de Lexicologia, Lexicografia e Terminologia concebeu e criou glossários terminológicos multilingues (Português, Inglês e Francês) associados a bases de dados textuais nos domínios da Agronomia, das Ciências da Saúde, do Direito e da Economia.
Endereço: a redisponibilizar em breve no sítio web do Instituto Camões.

Termos básicos em diagnóstico de patologia da fala e da linguagem
Termes de base du diagnostic orthophonique é um recurso constituído por uma lista de 45 unidades lexicais consideradas fundamentais para o diagnóstico de patologias da fala e da linguagem, constituindo um extrato não exaustivo do vocabulário em uso em 2020.
Endereço: https://www.ortolang.fr/market/lexicons/termes-diag-orthophonique

Ontologias

CDMR – Classificação de Domínios MorDigital
A CDMOR abrange as áreas do conhecimento usadas, sob a forma de etiquetas de domínio, nos artigos lexicográficos do “Diccionario da Lingua Portugueza” de António de Morais Silva (1789; 1813; 1823).
Endereço: http://vocabs.rossio.fcsh.unl.pt/morais_domains/

OntoAndalus
OntoAndalus é uma ontologia de artefactos em cerâmica do al-Andalus, cujo objetivo é aprofundar o conhecimento neste domínio e facilitar o desenvolvimento de um recurso terminológico multilingue baseado em descrições ou definições formais de conceitos e outras unidades de conhecimento.
Endereço: https://doi.org/10.34619/3W3T-HJ8S

OntoCork
OntoCork é uma microontologia de domínio focada nas rolhas de cortiça. O objetivo desta ontologia de domínio é organizar rolhas de cortiça – conceitos e termos –, de modo sistemático. OntoCork é desenvolvido em OWL. As definições formais são inferidas a partir do CorkCorpus – um corpus criado de raiz para o efeito.
Endereço: https://doi.org/10.34619/a27q-1ryd

OntoDomLab-Med
OntoDomLab-Med é uma ontologia centrada na Medicina, cujo objetivo é providenciar uma base conceptual sólida que facilite a interoperabilidade com TEI LEX-0 e, por outro lado, contribuir para: i) uma maior consistência na atribuição de etiquetas de domínio e ii) um aumento da eficiência no que diz respeito à recuperação de informação.
Endereço: https://doi.org/10.34619/emw4-ax6o

Material de formação

Introduction to dictionaries
O objetivo deste curso é apresentar uma breve história dos dicionários enquanto instrumentos de organização do conhecimento sobre as palavras e os seus significados, e analisar diferentes formas de entender e classificar o género dicionário.
Endereço: https://elexis.humanistika.org/resource/posts/introduction-to-dictionaries

Standards for representing lexicographical data: an overview
Este curso centra-se na importância das normas para facilitar a cooperação entre lexicógrafos num contexto multilingue e multicultural.
Endereço: https://campus.dariah.eu/resource/posts/standards-for-representing-lexicographic-data-an-overview

Outros

CORPORART_GRAMM_IT_1.0
A CORPORART_GRAMM_IT_1.0 é uma gramática semântica para o Italiano, codificada em linguagem Corpus Query Language (CQL) para o Sketch Engine.
Endereço: https://doi.org/10.34619/0bjc-vhc4
Também disponível em: https://clunl.fcsh.unl.pt/wp-content/uploads/sites/12/2024/04/CORPORART_GRAMM_IT_1.0.pdf

CORPORART_GRAMM_PT_1.1
A CORPORART_GRAMM_PT_1.1 é uma gramática semântica para o Português Europeu, codificada em linguagem Corpus Query Language (CQL) para o Sketch Engine.
Endereço: https://doi.org/10.34619/j2xi-fxfo
Também disponível em: https://clunl.fcsh.unl.pt/wp-content/uploads/sites/12/2024/05/CORPORART_GRAMM_PT_1.1.pdf