Extração de contextos definitórios do Corpus COVID-19 com CQL
DOI :
https://doi.org/10.11606/issn.2317-9511.v42p125-138Mots-clés :
terminologia, Linguística de Corpus, extração automática de contextos definitórios (CDs), traços definitórios (TDs), COVID-19Résumé
Termos representam os conceitos de um domínio e sua compreensão permite o acesso aos saberes contidos nos textos especializados. Entender o significado dos termos, portanto, é de grande importância não apenas para que pesquisadores possam socializar seus estudos e descobertas, mas também para que profissionais e estudantes de várias áreas possam se valer da informação especializada em contextos de estudo e de trabalho. A evolução rápida do conhecimento muitas vezes não permite que a terminologia criada para designar conceitos seja dicionarizada com a necessária rapidez. Tal fato pode representar um grande desafio para aqueles que necessitam ter acesso ao conhecimento especializado. Tendo em vista o contexto descrito, este estudo parte da revisão de abordagens utilizadas para a extração automática de traços definitórios (TDs) e contextos definitórios (CDs) e propõe a utilização da ferramenta Corpus Query Language (CQL) para a extração de informações que auxiliem no entendimento da terminologia empregada em textos especializados. Em especial, verificamos a utilidade das sintaxes de busca construídas com a CQL para esse propósito, aplicando-as ao Corpus COVID-19. O percurso apresentado neste estudo poderá auxiliar não apenas especialistas da área médica, mas também tradutores, lexicógrafos e professores a processarem, de forma mais rápida e precisa, o conhecimento contido em textos especializados.
##plugins.themes.default.displayStats.downloads##
Références
BARROS, L. A. Curso básico de Terminologia. São Paulo: EdUSP, 2004.
BIBER, D., CONNOR, U., & UPTON, T. Discourse on the Move. Using corpus analysis to describe discourse structure. Amsterdam: John Benjamins, 2007.
BOCORNY, A. E. P., REBECHI, R. R., REPPEN, R., DELFINO, M. C. N., & LAMEIRA, V. M. A produção de artigos da área das ciências da saúde com o auxílio de key lexical bundles: um estudo direcionado por corpus. D.E.L.T.A, n., v. 1, 2021: 1-37.
CUI, H., KAN, M. Y., & CHUA, T. S. Unsupervised learning of soft patterns for definitional question answering. Proceedings of the Thirteenth World Wide Web conference (WWW 2004), 2004: 90-99.
CUI, H., KAN, M. Y., & CHUA, T. S. Generic soft pattern models for definitional question answering. Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval, 2005: 384-391.
DE BESSÉ, B. Le contexte terminographique. Meta: journal des traducteurs/Meta: Translators' Journal, n. 36, v. 1, 1991: 111-120.
DE LUCCA, J. L. Identificação de padrões recorrentes no discurso técnico e científico para a extração automática de candidatos a contextos definitórios em língua portuguesa. Intercâmbio. Revista do Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, n. 15, 2006.
FAHMI, I., & BOUMA, G. Learning to identify definitions using syntactic features. Proceedings of the Workshop on Learning Structured Information in Natural Language Applications, 2006: 64-71.
FINATTO, M. J. B. Elementos Lexicográficos e Enciclopédicos na Definição Terminológica: Questões de Partida. Organon, n. 12, v. 26, 1998: 1-8. Disponível em < http://seer.ufrgs.br/index.php/organon/article/view/29563>. Acesso em 01 ago. 2020.
JIN, Y., KAN, M. Y., NG, J. P., & HE, X. Mining scientific terms and their definitions: A study of the ACL anthology. Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, 2013: 780-790.
KILGARRIFF, A.; RYCHLY, P.; SMRZ, P.; TUGWELL, D. The Sketch Engine. Proceedings of Euralex, 2004: 105-116.
KLAVANS, J. L., & MURESAN, S. Evaluation of the DEFINDER system for fully automatic glossary construction. Proceedings of the AMIA Symposium. American Medical Informatics Association, 2001: 324-328.
KLAVANS, J. L., & MURESAN, S. DEFINDER: Rule-based methods for the extraction of medical terminology and their associated definitions from on-line text. Proceedings of the AMIA Symposium. American Medical Informatics Association, 2000: 1049.
KOSEM, I., KOPPEL, K., KUHN, T. Z., MICHELFEIT, J., & TIBERIUS, C. Identification and automatic extraction of good dictionary examples: the case (s) of GDEX. International Journal of Lexicography, n. 32, v. 2, 2019: 119–137.
KOVÁŘ, V., MOČIARIKOVÁ, M., & RYCHLÝ, P. Finding definitions in large corpora with Sketch Engine. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16), 2016: 391-394.
MASUM, M., SHAHRIAR, H., HADDAD, H. M., AHAMED, S., SNEHA, S., RAHMAN, M., & CUZZOCREA, A. Actionable Knowledge Extraction Framework for COVID-19. Proceedings of the 2020 IEEE International Conference on Big Data (Big Data), 2020: 4036-4041.
PAVEL, S.; NOLET, D. Manual de Terminologia. Trad. Enilde Faulstich. Direção de Terminologia e Normalização. Departamento de Tradução do Governo Canadense, 2002. https://linguisticadocumentaria.files.wordpress.com/2011/03/pavel-terminologia.pdf
PEARSON, J. The expression of definitions in specialised texts: a corpus-based analysis. Proceedings of the Seventh Euralex International Congress, 1996: 817-824.
PEARSON, J. Terms in context. Amsterdam: John Benjamins, 1998.
SIERRA, G. Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos. Linguamática, n. 1, v. 2, 2009: 13-37.
TRIKI, N. Elaboration paradigms in PhD theses introductions. Deviation(s), 2014: 202-225.
TRIKI, N. Revisiting the metadiscursive aspect of definitions in academic writing. Journal of English for Academic Purposes, n. 37, 2019: 104-116.
VEYSEH, A. P. B., DERNONCOURT, F., DOU, D., & NGUYEN, T. H. A Joint Model for Definition Extraction with Syntactic Connection and Semantic Consistency. Proceedings of the AAAI, 2020: 9098-9105.
Téléchargements
Publiée
Numéro
Rubrique
Licence
(c) Copyright Ana Eliza Pereira Bocorny, Rozane Rebechi, Cristiane Krause Kilian 2022

Ce travail est disponible sous licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution BY-NC-SA que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).