Compilação, reciclagem e padronização de um Corpus Colaborativo de Linguística: percursos metodológicos / Compilation, recycling and standardization in a Collaborative Corpus of Linguistics: methodological approaches

Guilherme Fromm, Márcio Issamu Yamamoto

Abstract


Resumo: O objetivo deste texto é relatar uma experiência de trabalho com um corpus colaborativo, desenvolvida nos últimos 10 anos (2010-2020) com alunos de diversas turmas de graduação, pós-graduação e alunos de Iniciação Científica na Universidade Federal de Uberlândia (já parcialmente descrita por Fromm, 2013, e Fromm e Yamamoto, 2013). O trabalho parte da metodologia de elaboração do corpus (incluindo seu histórico) como um passo para um tipo de pesquisa específica (terminográfica), passa por uma análise para indicar e solucionar problemas de compilação e termina na sua adequação e padronização para reuso. O resultado é um corpus robusto, bem balanceado, bilíngue (inglês/português) e que poderá ser usado em inúmeras outras pesquisas na área de Linguística.

Palavras-chave: Linguística; Linguística de Corpus; Corpus colaborativo; Árvore de Domínio; Terminografia.

Abstract: This text describes a work experience with a collaborative corpus, developed during the last 10 years (2010-2020) with students in several undergraduate and graduate classes and students working on scientific undergraduate research projects at Universidade Federal de Uberlândia (already partially described by Fromm, 2013, and Fromm and Yamamoto, 2013). The work starts from the corpus elaboration methodology (including its history) as a step towards a specific type of research (terminographic), goes through an analysis to point out and solve compilation problems and ends in its adequacy and standardization for reuse. The result is a robust, well-balanced, bilingual (English/Portuguese) corpus that can be used in numerous other studies in the area of Linguistics.

Keywords: Linguistics; Corpus Linguistics; Collaborative corpus; Domain Tree; Terminography.


Keywords


Linguística; Linguística de Corpus; Corpus colaborativo; Árvore de Domínio; Terminografia; Linguistics; Corpus Linguistics; Collaborative corpus; Domain Tree; Terminography.

References


ALBUQUERQUE, D. B. de. Múltiplos olhares em Linguística e Linguística Aplicada, 2016. Ecolinguística: Revista Brasileira de Ecologia e Linguagem (ECO-REBEL), Brasília, v. 3, n. 1, p. 227-237, 2017. Disponível em: https://periodicos.unb.br/index.php/erbel/article/view/26263/23021 Acesso em: 26 mar. 2020.

ALVES, I. M. et al. (org.). Estudos lexicais em diferentes perspectivas. São Paulo: FFLCH/USP, 2010.

AUBERT, F. H. Introdução à metodologia da pesquisa terminológica bilíngue. 2. ed. São Paulo: FFLCH/CITRAT, 2001.

BARBOSA, M. A. Dicionário, vocabulário, glossário: concepções. In: ALVES, I. M. (org.). A constituição da normalização terminológica no Brasil. 2. ed. São Paulo: FFLCH/CITRAT, 2001. p. 23-45.

BARROS, L. A. Curso básico de terminologia. São Paulo: EDUSP, 2004.

BERBER SARDINHA, T. Linguística de Corpus. São Paulo: Manole, 2004.

BOWKER, L. Towards a Collaborative Approach to Corpus Building in the Translation Classroom. In: BAER, J. B.; KOBY, G. S. (ed.). Beyond the Ivory Tower: Rethinking Translation Pedagogy. Amsterdam; Philadelphia: John Benjamins, 2003. p. 193-210.

CABRÉ, M. T. Hacia una teoría comunicativa de la terminología: aspectos metodológicos. In: CABRÉ, M. T. La Terminologia: representación y comunicación. Barcelona: IULA, 2000. p. 129-150.

CARDOSO, S. A. F. TermosTeo: a elaboração de vocabulários monolíngues de termos da Teologia em um estudo conduzido por corpus. 2017. 340f. Tese (Doutorado em Estudos Linguísticos) – Instituto de Letras e Linguística, Universidade Federal de Uberlândia, Uberlândia, 2017.

FROMM, G. Vocabulário de linguística: treinamento em terminografia bilíngue, uso de corpora e ambiente de gestão terminológica. In: ISQUERDO, A. N.; DAL CORNO, G. O. M. (org.). As ciências do léxico: lexicologia, lexicografia, terminologia. Campo Grande: Editora UFMS, 2018. p. 309-328.

FROMM, G. Vocabulário de Linguística: treinamento em Terminografia Bilíngue, uso de corpora e ambiente de gestão terminológica. In: ENCONTRO INTERMEDIÁRIO DO GT DE LEXICOLOGIA, LEXICOGRAFIA E TERMINOLOGIA DA ANPOLL, 10., 2015, Rio de Janeiro. Anais [...]. Rio de Janeiro: ANPOLL, 2015. p. 1-5.

FROMM, G. A questão da taxonomia num corpus colaborativo para construção de um vocabulário na área de linguística. In: SIMPÓSIO INTERNACIONAL DE LETRAS E LINGUÍSTICA - SILEL, 2013, Uberlândia. Anais [...]. Uberlândia: EDUFU, 2013. p. 1-9.

FROMM, G. Ensino de terminologia: trabalhando com site e banco de dados. Debate Terminológico, Porto Alegre, v. 6, p. 2-22, 2010.

FROMM, G. VoTec: a construção de vocabulários eletrônicos para aprendizes de tradução. 2007. 215f. Tese (Doutorado em Estudos Linguísticos e Literários em inglês) – Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2007. Disponível em: https://www.teses.usp.br/teses/disponiveis/8/8147/tde-08072008-150855/publico/TESE_GUILHERME_FROMM.pdf. Acesso em: 30 mar. 2020.

FROMM, G.; YAMAMOTO, M. I. Terminologia, Terminografia, Tradução e Linguística de Corpus: a criação de um vocabulário bilíngue sobre Linguística. In: TAGNIN, S.; BEVILACQUA, C. (org.). Corpora na Terminologia. São Paulo: Hub Editorial, 2013. p. 129-152.

FROMM, G.; YAMAMOTO, M. I. A microestrutura em verbetes da área da Linguística. Revista Estudos da Linguagem, Belo Horizonte, v. 28, n. 1, p. 205-234, 2020. DOI: http://dx.doi.org/10.17851/2237-2083.28.1.205-234. Disponível em: http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/15255. Acesso em: 23 mar. 2020.

GARDNER, J.; KROWNE, A.; XIONG, L. Automatic Invocation Linking for Collaborative Web-Based Corpora. In: CHBEIR, R.; BADR, Y.; ABRAHAM, A. (org.). Emergent Web Intelligence: Advanced Semantic Technologies. Londres: Springer-Verlag, 2010. p. 23-45.

ILARI, R. Introdução ao estudo do léxico: brincando com as palavras. 2. ed. São Paulo: Contexto, 2003.

MELLO, H. Methodological Issues for Spontaneous Speech Corpora Compilation: The Case of C-ORAL-BRASIL. In: RASO, T.; MELLO, H. (ed.). Spoken Corpora and Linguistic Studies. Amsterdam: John Benjamins Publishing, 2014. p. 27-68. DOI: https://doi.org/10.1075/scl.61.01mel

OLIVEIRA, F. P. de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. 2019. 219f. Dissertação (Mestrado em Estudos Linguísticos) – Instituto de Letras e Linguística, Universidade Federal de Uberlândia, 2019. DOI: http://dx.doi.org/10.14393/ufu.di.2019.679.

PÉREZ-PAREDES, P. L.; SÁNCHEZ-TORNEL, M.; CALERO, J. A. M. Learners’ Search Patterns During Corpus-Based Focus-on-Form Activities. International Journal of Corpus Linguistics, [S.l.], v. 17, n. 4, p. 482-515, 2012. DOI: https://doi.org/10.1075/ijcl.17.4.02par

SCOTT, M. WordSmith Tools. Version 7. Liverpool: Lexical Analysis Software, 2015.

SINCLAIR, J. Reading Concordances: An Introduction. London: Longman, 2003.

TAGNIN, S.; BEVILACQUA, C. Corpora na Terminologia. São Paulo: Hub Editorial, 2013.

TAGNIN, S. E. O. Corpus-Driven Terminology in Brazil. In: POUPET, A. L. B.; XATARA, C. (org.). Cahiers de Lexicologie – Dynamique de la Recherche en Lexicologie, Lexicographie et Terminologie au Brésil. Paris: Classiques Garnier, 2012. p. 169-182.

TEIXEIRA, E. D. A Linguística de Corpus a serviço do tradutor: proposta de um dicionário de culinária voltado para a produção textual. 2008. 439f. Tese (Doutorado, Programa de Pós-Graduação em Estudos Linguísticos e Literários em Inglês) – Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, 2008.

TIEDEMANN, J. Recycling Translations: Extraction of Lexical Data from Parallel Corpora and their Application in Natural Language Processing. Uppsala: Acta Universitatis Upsaliensis, 2003.

VARANTOLA, K. Disposable Corpora as Intelligent Tools in Translation. Cadernos de Tradução, Florianópolis, v. 1, n. 9, p. 171-189, 2002. Disponível em: https://periodicos.ufsc.br/index.php/traducao/article/view/5985/5689. Acesso em: 15 maio 2020.

VIANA, V.; TAGNIN, S. E. O. (org.). Corpora na Tradução. São Paulo: Hub Editorial, 2015.

YAMAMOTO, M. I. Linguística histórica e Linguística de corpus: caminhos que se cruzam para desvelar a história da linguagem: um vocabulário bilíngue português-inglês. 2015. 118f. Dissertação (Mestrado em Linguística Letras e Artes) – Instituto de Letras e Linguística, Universidade Federal de Uberlândia, 2015. Disponível em https://repositorio.ufu.br/handle/123456789/15483. Acesso em: 15 mar. 2020.

YAMAMOTO, M. I. Vocabulário bilíngue português/inglês de linguística geral. Revista Philologus,v. 24, p. 272-297, 2018. disponível em http://www.filologia.org.br/rph/ano24/70supl/023.pdf . Acesso em: 15 mar. 2020.




DOI: http://dx.doi.org/10.17851/2237-2083.29.3.2041-2078

Refbacks

  • There are currently no refbacks.
';



Copyright (c) 2021 Guilherme Fromm, Márcio Issamu Yamamoto

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

e - ISSN 2237-2083 

License

Licensed through  Creative Commons Atribuição 4.0 Internacional