Validação de termos de domínio por meio de uma base lexical-semântica difusa

Afonso Rodrigues

doi:10.11606/issn.2317-9511.v30i30p71-86

Domain terms validation by means of a fuzzy lexical-semantic base

Authors

Afonso Rodrigues University of Santiago de Compostela, Spain.

DOI:

https://doi.org/10.11606/issn.2317-9511.v30i30p71-86

Keywords:

automatic term extraction, semantic relations, fuzzy synsets

Abstract

Term extraction or recognition searches a given corpus to provide a list of domain specific terms for further use in more advanced tasks as in terminology and ontology building. Several statistical measures and Natural Language Processing techniques have been researched to improve precision of retrieved lists. However, to keep recall high, lists contain a number of false positives. To validate candidates as true positives in the domain, terms have to be manually evaluated or automatically checked against external resources such as specialized glossaries. Starting with a baseline of 50 candidate terms with 52% precision, we perform a series of experiments to show that a lexical knowledge base can significantly improve glossary performance. Furthermore, using a fuzzy lexical base, words clustered by a semantic association value, we research cutting points to reach 100% rates for either precision or recall for the baseline list, while keeping F-Measure > 80%, achieving 90% as best result. We conclude that, considering further research for limits and different case scenarios is also needed, a fuzzy lexical base can improve current state-of-the art approaches in automatic term extraction .

Downloads

Download data is not yet available.

Author Biography

Afonso Rodrigues, University of Santiago de Compostela, Spain.

Geography Ph.D student at the University of Santiago de Compostela, Spain.

Downloads

Published

2017-12-20

Issue

Vol. 30 (2017)

Section

Articles

License

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Autores que publicam nesta revista concordam com os seguintes termos:

Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution BY-NC-SA que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).

How to Cite

Rodrigues, A. (2017). Domain terms validation by means of a fuzzy lexical-semantic base. TradTerm, 30, 71-86. https://doi.org/10.11606/issn.2317-9511.v30i30p71-86

Download Citation

Domain terms validation by means of a fuzzy lexical-semantic base

Authors

DOI:

Keywords:

Abstract

Downloads

Author Biography

Downloads

Published

Issue

Section

License

How to Cite

Make a Submission

Language