HEREDITermCorpus_pt (V0.1)

 

Descrição

No contexto do projeto HEREDITARY, HetERogeneous sEmantic Data integratIon for the guT-brAin interplay (Integração de dados semânticos heterogéneos para a interação intestino-cérebro), estão a ser criados corpora multilíngues dedicados. O HEREDITermCorpus_pt_V0.1 compila uma seleção curada de textos dedicados ao eixo microbiota-intestino-cérebro (MGBA) e seu papel emergente nas doenças neurodegenerativas. A coleção destina-se a fornecer um recurso para investigadores, médicos e estudantes interessados em explorar como os microrganismos intestinais influenciam a saúde cerebral e os mecanismos das doenças. O conjunto de dados compreende 126 documentos, 100 610 frases, 1 999 301 palavras e 2 665 436 tokens. Todos os documentos estão escritos em português europeu e foram selecionados para captar uma ampla gama de perspetivas sobre o MGBA.

Identificador

https://doi.org/10.5281/zenodo.16969241

Equipa

Rute Costa
Margarida Ramos
Matilde Canelas
Ana Mouro