Recursos em linha
Corpora
CORPORART – corpus comparável PT/IT de especialidade no domínio da Arte Pública
O CORPORART – PT/IT é um corpus bilingue, comparável, do domínio da Arte Pública. É composto por dois subcorpora contemporâneos de Português Europeu e Italiano, período de 2000 a 2018, compreendendo tipos de texto e subdomínios representativos da produção de textos de especialidade num domínio altamente interdisciplinar.
Endereço: https://clunl.fcsh.unl.pt/recursos-em-linha/corpora/corporart-corpus-comparavel-pt-it-de-especialidade-no-dominio-da-arte-publica/
Corpus de Literatura Portuguesa para Distant Reading
O Corpus de Literatura Portuguesa para Distant Reading é um corpus literário de obras não canónicas de autores portugueses, datadas de 1840 a 1920.
Endereço: https://github.com/COST-ELTeC/ELTeC-por
MIGRANTE.PT
Resultado do projeto EXPRIMI, o MIGRANTE.PT é um corpus para fins específicos, com cerca de 1,5 milhões de palavras do Português Europeu, constituído por textos institucionais e compilado a partir de sites e materiais de acesso aberto relacionados com a integração de migrantes em Portugal e direcionados a esses mesmos migrantes.
Endereço: https://clunl.fcsh.unl.pt/recursos-em-linha/corpora/migrante-pt/
Parallel sense-annotated corpus ELEXIS-WSD 1.0
ELEXIS-WSD é um corpus paralelo de sentidos anotados, no qual palavras de conteúdo (substantivos, adjectivos, verbos, e advérbios) foram atribuídos sentidos. A versão 1.0 contém frases para 10 línguas: búlgaro, dinamarquês, inglês, espanhol, estónio, húngaro, italiano, neerlandês, português e esloveno (ler mais)
Endereço: http://hdl.handle.net/11356/1674
Léxicos, Dicionários, Glossários
BDTT-AR – Base de Dados Terminológica e Textual da Assembleia da República
A BDTT-AR é uma base de dados multilingue (Português, Inglês e Francês) que contém a terminologia utilizada no seio do parlamento português.
Endereço: http://terminologia.parlamento.pt/pls/ter/terwintra.home
Dicionário de Abreviaturas Digitais
O Dicionário de Abreviaturas Digitais contempla abreviaturas usadas pelas novas gerações falantes de português europeu na comunicação escrita nas redes sociais.
Endereço: https://www.lexonomy.eu/#/dig2023
DLP – Dicionário da Língua Portuguesa
O Dicionário da Língua Portuguesa da Academia das Ciências de Lisboa, tendo por base o Dicionário da Língua Portuguesa Contemporânea, coordenado por Malaca Casteleiro, foi publicada em abril de 2023 e encontra-se em permanente atualização (ler mais).
Endereço: https://dicionario.acad-ciencias.pt/
Dicionário Multilingue Multidomínio
O Dicionário Multilingue Multidomínio é uma base de dados criada a partir dos trabalhos desenvolvidos pelos alunos da Unidade Curricular “Terminologia” (NOVA FCSH) durante o 1º semestre do ano letivo 2022-2023 (1º ciclo de estudos). Os dados terminológicos que compõem as fichas foram extraídos de corpora de especialidade compilados pelos alunos.
Endereço: https://doi.org/10.34619/30qc-jzno
Glossário Colaborativo COVID-19
O Glossário Colaborativo COVID-19 é constituído pela terminologia utilizada pelos organismos oficiais de Saúde, pelos profissionais do setor e cientistas, assim como pelos meios de comunicação social e redes sociais
Endereço: https://www.lexonomy.eu/ec25mm79/
Glossários Terminológicos Multilingues para fins específicos na CPLP – Angola
A pedido do Instituto Camões, o grupo de Lexicologia, Lexicografia e Terminologia concebeu e criou glossários terminológicos multilingues (Português, Inglês e Francês) associados a bases de dados textuais nos domínios da Agronomia, das Ciências da Saúde, do Direito e da Economia.
Endereço: a redisponibilizar em breve no sítio web do Instituto Camões.
Termos básicos em diagnóstico de patologia da fala e da linguagem
Termes de base du diagnostic orthophonique é um recurso constituído por uma lista de 45 unidades lexicais consideradas fundamentais para o diagnóstico de patologias da fala e da linguagem, constituindo um extrato não exaustivo do vocabulário em uso em 2020.
Endereço: https://www.ortolang.fr/market/lexicons/termes-diag-orthophonique
Ontologias
CDMR – Classificação de Domínios MorDigital
A CDMOR abrange as áreas do conhecimento usadas, sob a forma de etiquetas de domínio, nos artigos lexicográficos do “Diccionario da Lingua Portugueza” de António de Morais Silva (1789; 1813; 1823).
Endereço: http://vocabs.rossio.fcsh.unl.pt/morais_domains/
OntoAndalus
OntoAndalus é uma ontologia de artefactos em cerâmica do al-Andalus, cujo objetivo é aprofundar o conhecimento neste domínio e facilitar o desenvolvimento de um recurso terminológico multilingue baseado em descrições ou definições formais de conceitos e outras unidades de conhecimento.
Endereço: https://doi.org/10.34619/3W3T-HJ8S
OntoCork
OntoCork é uma microontologia de domínio focada nas rolhas de cortiça. O objetivo desta ontologia de domínio é organizar rolhas de cortiça – conceitos e termos –, de modo sistemático. OntoCork é desenvolvido em OWL. As definições formais são inferidas a partir do CorkCorpus – um corpus criado de raiz para o efeito.
Endereço: https://doi.org/10.34619/a27q-1ryd
OntoDomLab-Med
OntoDomLab-Med é uma ontologia centrada na Medicina, cujo objetivo é providenciar uma base conceptual sólida que facilite a interoperabilidade com TEI LEX-0 e, por outro lado, contribuir para: i) uma maior consistência na atribuição de etiquetas de domínio e ii) um aumento da eficiência no que diz respeito à recuperação de informação.
Endereço: https://doi.org/10.34619/emw4-ax6o
Material de formação
Introduction to dictionaries
O objetivo deste curso é apresentar uma breve história dos dicionários enquanto instrumentos de organização do conhecimento sobre as palavras e os seus significados, e analisar diferentes formas de entender e classificar o género dicionário.
Endereço: https://elexis.humanistika.org/resource/posts/introduction-to-dictionaries
Standards for representing lexicographical data: an overview
Este curso centra-se na importância das normas para facilitar a cooperação entre lexicógrafos num contexto multilingue e multicultural.
Endereço: https://campus.dariah.eu/resource/posts/standards-for-representing-lexicographic-data-an-overview
Outros
CORPORART_GRAMM_IT_1.0
A CORPORART_GRAMM_IT_1.0 é uma gramática semântica para o Italiano, codificada em linguagem Corpus Query Language (CQL) para o Sketch Engine.
Endereço: https://doi.org/10.34619/0bjc-vhc4
Também disponível em: https://clunl.fcsh.unl.pt/wp-content/uploads/sites/12/2024/04/CORPORART_GRAMM_IT_1.0.pdf
CORPORART_GRAMM_PT_1.1
A CORPORART_GRAMM_PT_1.1 é uma gramática semântica para o Português Europeu, codificada em linguagem Corpus Query Language (CQL) para o Sketch Engine.
Endereço: https://doi.org/10.34619/j2xi-fxfo
Também disponível em: https://clunl.fcsh.unl.pt/wp-content/uploads/sites/12/2024/05/CORPORART_GRAMM_PT_1.1.pdf
Menu
- Projetos
- Projetos em curso
- HEREDITARY – HetERogeneous sEmantic Data Integration for guT-brAin interplay
- TTC-CPLP – Terminologias Técnicas e Científicas para a CPLP
- CHAMUÇA – Arquivo Lexical Português e Sul-Asiático
- e-Term ANCV – Recurso terminológico jurídico-parlamentar digital Assembleia Nacional de Cabo Verde
- NObarriers2Health: Reducing language and cultural barriers through machine translation literacy for inclusive multilingual health communication
- EPISTRAN – Epistemic Translation: Towards an Ecology of Knowledges
- DiTo – Didática do Texto
- REDGRAM – Percursos e trajetórias gramaticais (recursos educativos digitais)
- iRead4Skills – Intelligent Reading Improvement System for Fundamental and Transversal Skills Development
- Active Citizenship Through Dialogue in Virtual teacher communities
- ProPerL2 – Produção e Perceção de fala na aprendizagem de L2
- Heritage Languages go to School: The interplay of (extra)linguistic factors in successful language development
- Investigating the impact of implicit and explicit instruction on phonological acquisition in a second language
- LAUA – Language Attrition and Ultimate Attainment
- CORRELATE – Corpora e Recursos Lexicais e Terminológicos
- ANACOREX – Anafora y expresiones referenciales en el bilinguismo: triangulando enfoques de corpus y experimentales
- Caring Communication: a terapia genética no contexto da hemofilia
- CoRaLHis – Comparing Romance Languages through History: building a multilingual parallel diachronic corpus (13th-18th C.)
- MorDigital – Digitalização do Diccionario da Lingua Portugueza de António de Morais Silva
- Western Sephardic Diaspora Roadmap
- EXPRIMI
- Language and literacy at school – the contribution of metasyntactic abilities to reading comprehension development
- G&T.Comenta
- Glossário Colaborativo COVID-19
- TERMVEST – Terminologia do Vestuário: Versão Português Europeu
- Edição Digital do Vocabulário Ortográfico da Língua Portuguesa (VOLP-1940)
- PIPALE – Projeto de Intervenção Preventiva para a Aprendizagem da Leitura e da Escrita
- POR Nível – Construção e validação de um teste de colocação em nível para PLE
- ANACOR: A corpus-based approach to anaphora resolution in second language acquisition: beyond the interfaces
- Léxico dos Bens Culturais
- Projetos concluídos
- ELEXIS – European Lexicographic Infrastructure
- Humanities Going Digital (HUGOD)
- LL2DS – Linking Linguistics to Data Science
- QuILL – Quality in Language Learning
- Corpus Linguístico & Avatar para a Língua Gestual Portuguesa
- Monitor Corpora. PressCoronaVírus
- Com@Rehab – Comunicação para reabilitação interativa em realidade virtual
- Read4Succeed: Improving migrant, refugee and from deprived neighbourhood children reading skills through an Animal Assisted Reading program
- Projeto GiroFLE
- OrthoDef
- Dicionário de Português Europeu-Árabe Padrão
- MOCOLANG-O – MOdélisation COnceptuelle des troubles (du LANGage et de la communication) en Orthophonie
- Romance clitics in diachrony. An integrated approach
- Corpus de Literatura Portuguesa para Distant Reading
- ALPROF – Automatic Assessment of Language Proficiency for Migrant Integration
- CLARIN CLUNL
- Utopia, Alimentação e Futuro
- Desenvolvimento de estruturas sintáticas na aquisição monolingue e bilingue do português e do francês
- The Case of Grammatical Relations
- BlackBox – Artes e Cognição
- Promoção da Literacia Científica
- PerGRam – Percursos para o ensino da gramática nos primeiros anos de escolaridade
- Proposta de Organização do Conhecimento no Âmbito da Infertilidade: uma questão de terminologia
- Subordinação em Português Medieval
- Crosslinguistic and Crosspopulation approaches to the Acquisition of Dependencies
- Fatores Sintáticos e Lexicais na Complexidade do Processamento
- SIERA – Integrating Sina Institute into the European Research Area
- Dependências Sintáticas dos 3 aos 10 Anos
- Eventos e Subeventos em Caboverdiano
- TKB – Transmedia Knowledge Base for Contemporary Dance
- CogniNET – Semântica cognitiva em redes colaborativas
- Estudos Contrastivos Português/Esloveno
- APSE – Envelhecimento, pobreza e exclusão social: Um estudo interdisciplinar sobre serviços inovadores de intervenção social
- MERIDIUM – Multilingualism in Europe as a Resource for Immigration – Dialogue Iniatiative among the Universities of the Mediterranean
- DUPLEX – Duplos e Expletivos na Sintaxe Dialectal do Português Europeu
- Reflets Culturels de la Métaphore de Spécialité d’une culture à l’autre – Réseau de Lexicologie, Terminologie et Traduction
- ACASS – Análise da Conversação Aplicada ao Serviço Social. O interagir comunicacional na Intervenção Social
- VILA_CCC_Mont: Video indexation and linguistic annotation of contemporary choreographic creations
- e-LearnLex – Lexicografia de aprendizagem
- PreTexto – Praxis, Conhecimento e Texto
- PROGRAMMA – Processos de Gramaticalização em Português Europeu
- DHISCURSO – História dos Discursos em Portugal
- Técnicas Experimentais na Compreensão da Aquisição do Português Europeu
- Morfologia e Sintaxe na Aquisição de L2
- Laboratório de Linguística e Ensino de Línguas
- Dicionário da Língua Portuguesa Medieval
- Políticas e Práticas de Internacionalização do Ensino da Língua Portuguesa: os Leitorados de Português
- ENUNTIO
- Oneness – On-line less used and less taught language courses
- DISTEX – Textos e Discursos do Português Moderno e Contemporâneo
- ENLU – European Network for the Promotion of Language Learning among all undergraduates
- GRADE – Gramática e Enunciação
- HISPAM – História do Português Antigo e Médio
- LANGVAR – Aquisição/Aprendizagem da Linguagem, Variação e Mudança
- MORPHOCOM – Morfologia Computacional Aplicada a Corpora
- NEOPORTERM – Observatório de Neologia e de Terminologia em Língua Portuguesa
- NOTATOR – Tipo Medieval para Computador
- ONTOLEXTERM – Dicionários terminológicos e ontologias
- PHILOLOGIA – Filologia e Linguística Histórica: Fontes para a História da Língua Portuguesa
- REFORTERM – Reformulação e Terminologia
- LEXTERM – Léxico e automatização
- Quality assessment of the Word Health Survey Questionnaire in Portuguese. Classification, Assessment, Surveys & Terminology
- Léxico e Sintaxe do Verbo do Português Medieval
- PHARMATERM – Lexicografia Bilingue de Especialidade
- Terminologia Linguística para os Ensinos Básico e Secundário
- Automatic Translation System from and to Portuguese for public administration
- Thematic Network Project in the Area of Languages 2 (TNP 2)
- Thematic Network Project in Languages: Exploitation and Dissemination of Results
- Thematic Network Project in the Area of Languages (TNP 1)
- Arquivos Electrónicos de Terminologias e “corpora”, PRAXIS XXI
- CORDIAL-SIN – Corpus dialetal para o Estudo da Sintaxe
- TERMÉDICA – TERminologia e ensino da língua MÉDICA
- Corpora do Português Medieval – Etiquetagem e Segmentação Automáticas
- Etiquetagem e Segmentação Automática de Corpora de Português Medieval
- A Gramática do Português Medieval – Contributos para a sua caracterização
- Projetos em rede
- ELEXIS Association
- PhraConRep – A Multilingual Repository of Phraseme Constructions in Central and Eastern European Languages
- Y-JustLang – Justice to youth language needs
- ENEOLI – European Network On Lexical Innovation
- Consórcio Huma-Num ARIANE
- GRAFE’Maire
- UniDive – Universality, diversity and idiosyncrasy in language technology
- Metalex – International Metalexicography Network
- @ Cientista Regressa à Escola
- CLIL in Languages Other Than English
- NexusLinguarum – European network for Web-centred linguistic data science
- Distant Reading for European Literary History
- HL2C – Consórcio de Língua de Herança
- KEYSTONE – Semantic Keyword-Based Search on Structures Data Sources
- ARLE – International Association for Research in L1 Education
- ENeL – European Network of e-Lexicography
- GraMaLL – Grasping Meaning Across Languages and Learners
- European Statistical System Centers and Networks of Excellence on SDMX
- Language Impairment in a Multilingual Society: Linguistic Patterns and the Road to Assessment
- Crosslinguistically Robust Stages of Children’s Linguistic Performance
- GIRTraduvino – Grupo de Investigación Reconocido sobre la Lengua de la Vid Y el Vino y su Traducción
- Value for Health CoLAB
- Infraestruturas
- Prestação de Serviços
- Projeto de formação “Ensinar com o dicionário: informações linguísticas e lexicográficas para ensino de Português”
- BDTT-AR – Base de Dados Terminológica e Textual para a Assembleia da República. Fase 2
- Sistemas Conceptuais e Terminológicos no INE
- BDTT-AR – Base de Dados Terminológica e Textual para a Assembleia da República
- Glossários Terminológicos Multilingues para fins específicos dentro do espaço da CPLP – Angola
- Glossários Especializados em línguas faladas em Angola, Moçambique e São Tomé e Príncipe