Analysing the behaviour of academic collocations in a corpus of research-papers: a data-driven study / Analisando o comportamento de colocações acadêmicas em um corpus de artigos científicos: um estudo dirigido por dados

Paula Tavares Pinto, Diva Cardoso de Camargo, Talita Serpa, Luciano Franco da Silva

Abstract


Abstract: Authors from different countries have published their papers in English, aiming to promote their research results widely and to become internationally known by their peers. It is also true that, although they are aware of the English terminology used in their respective field, some authors still struggle with some features of academic writing such as collocations. Thus, this paper presents a discussion on the underuse and overuse traces of academic collocations by Brazilian authors who had their articles published in English on an open electronic library of scientific journals. In order to analyse the collocations used by these researchers, we compiled a 906,035-word corpus from eight different academic areas. The collocations observed were statistically compared to those from an academic corpus of English writings which contains texts produced by English-speaking authors. Results showed that there are more collocations underused than overused by the authors. The analysis proved that the collocation repertoire of researchers could be broadened by being pointed out during academic writing workshops.

Keywords: academic collocations; research paper writing; corpus linguistics.

Resumo: Autores de vários países têm publicado seus artigos científicos em inglês com o intuito de promover amplamente os resultados de suas pesquisas dentre a comunidade científica internacional. É verdade que, embora estejam cientes da terminologia utilizada no respectivo campo de pesquisa, alguns autores ainda apresentam dificuldade em lidar com certas características da escrita acadêmica, como o uso das colocações. Este artigo apresenta uma discussão sobre traços de sobreuso e subuso de colocações acadêmicas utilizadas por autores brasileiros que têm seus artigos publicados em inglês numa plataforma eletrônica aberta de artigos científicos. Para analisar as colocações utilizadas por estes pesquisadores, compilamos um corpus de 906.000 palavras a partir de oito áreas científicas. As colocações analisadas foram comparadas estatisticamente com as colocações de um corpus acadêmico de inglês que contém textos escritos por autores anglófonos. Os resultados mostraram que há mais traços de subuso que sobreuso de colocações acadêmicas utilizadas pelos pesquisadores e este repertório poderia ser ampliado se fossem destacadas durante cursos de escrita acadêmica em língua inglesa.

Palavras-chave: colocações acadêmicas; escrita de artigos científicos; linguística de corpus.


Keywords


academic collocations; research paper writing; corpus linguistics; colocações acadêmicas; escrita de artigos científicos; linguística de corpus.

Full Text:

PDF

References


ACKERMANN, K.; CHEN, Y. H. Developing the Academic Collocation List (ACL). A Corpus-Driven and Expert-Judged Approach. Journal of English for Academic Purposes, [S.l.], v. 12, n. 4, p. 235-247, 2013. DOI: https://doi.org.10.1016/j.jeap.2013.08.002

BABINI, M.; SILVA, E. B. A terminologia acadêmica nos textos científicos em língua inglesa uma abordagem baseada em corpus. In: ISQUERDO, A. N.; SEABRA, M.C.T.C. (org.). As ciências do léxico: lexicologia, lexicografia, terminologia. Campo Grande: UFMS, 2012. p. 415-427.

CORTES, V. Lexical Bundles in Published and Student Disciplinary Writing: Examples from History and Biology. English for specific purposes, [S.l.], v. 23, n. 4, p. 397-423, 2004. DOI: https://doi.org.10.1016/j.esp.2003.12.001

DAYRELL, C. A Quantitative Approach to Compare Collocational Patterns in Translated and Non-Translated Texts. International Journal of Corpus Linguistics, [S.l.], v. 12, n. 3, p. 375-414, 2007. DOI: https://doi.org.10.1075/ijcl.12.3.04day

DAYRELL, C. Corpora no ensino de inglês acadêmico: padrões léxico-gramaticais em abstracts de pós-graduandos brasileiros. In: VIANA, V.; TAGNIN, S. (org.). Corpora no Ensino De Línguas Estrangeiras. São Paulo: HUB Editorial, 2011. p. 131-172.

FIRTH, J. R. Modes of Meaning. v. 4: Essays and Studies (English Association). Indianapolis: Bobbs-Merril, 1951. p. 118-149.

FRANKENBERG-GARCIA, A. et al. Developing a Writing Assistant to Help EAP Writers with Collocations in Real Time. ReCALL, Cambridge, v. 31, n. 1, p. 23-39, 2019a. DOI: https://doi.org.10.1017/S0958344018000150

FRANKENBERG-GARCIA, A. et al. Supporting the Internationalisation of Brazilian Research: Curso oferecido via financiamento Capes: Print para a Universidade Federal do Rio Grande do Sul e a Universidade Estadual Paulista, 4-06 de jun.de 2019. 30f. Notas de aula.

GARDNER, D.; DAVIES, M. A New Academic Vocabulary List. Applied Linguistics, Oxford, v. 35, n. 3, p. 305-327, 2014. DOI: https://doi.org.10.1093/applin/amt015

HASWELL, R. Gaining Ground in College Writing: Tales of Development and Interpretation. Dallas: Southern Methodist University Press, 1991.

HYLAND, K. Academic Clusters: Text Patterning in Published and Postgraduate Writing. International Journal of Applied Linguistics, [S.l.], v. 18, n. 1, p. 41-62, 2008. DOI: https://doi.org.10.1111/j.1473-4192.2008.00178.x

KILGARRIFF, A. et al. The Sketch Engine: Ten Years On. Lexicography, Sheffield, UK, v. 1, n. 1, p. 7-36, 2014. DOI: https://doi.org/10.1007/s40607-014-0009-9

KUHN, T. A Design Proposal of an Online Corpus-Driven Dictionary of Portuguese for University Students. 2017. 421f. Tese (Doutorado em Linguística Aplicada) – Faculdade de Letras, Universidade de Lisboa, Lisboa, 2017.

LEA, D.; CROWTHER, J.; DIGNEN, S. Oxford Collocations Dictionary for Students of English. Oxford: Oxford University Press, 2002.

NATION, I. Learning Vocabulary in Another Language. Cambridge: Cambridge University Press, 2001. (Cambridge Applied Linguistics).

NESSELHAUF, N. The Use of Collocations by Advanced Learners of English and Some Implications for Teaching. Applied Linguistics, Oxford, v. 24, n. 2, p. 223-242, 2003. DOI: https://doi.org/10.1093/applin/24.2.223

NEVES, M. L.; JIMENO-YEPES, A.; NÉVÉOL, A. The SciELO Corpus: a Parallel Corpus of Scientific Publications for Biomedicine. In: INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUTATION – LREC, 10th., 2016, Portorož, Slovenia. Proceedings […]. Portorož: LREC, 2016.

PAQUOT, M. Academic Vocabulary in Learner Writing: From Extraction to Analysis. London: Continuum, 2010.

PARTINGTON, A. Patterns and Meanings: Using Corpora for English Language Research and Teaching. Amsterdam: John Benjamins Publishing, 1998. DOI: https://doi.org/10.1075/scl.2

PAIVA, P. T. Uma investigação de traduções de textos da área médica sob a luz dos estudos da tradução baseados em corpus. 2009. 288f. Tese (Doutorado em Linguística Aplicada) – Instituto de Biociências, Letras e Ciências Exatas, Universidade Estadual Paulista, São José do Rio Preto, 2009.

SCIENTIFIC ELECTRONIC LIBRARY ONLINE. Available from: https://scielo.org/. Access on: Jun. 13, 2020.

SCOTT, M. WordSmith Tools 4. Oxford: Oxford University Press, 1996.

SILVA, E. B.; BABINI, M.; OTTAIANO, A. O. Identification of the most common phraseological units in the English language in academic texts: contributions coming from corpora. Acta Scientiarum, Maringá, v. 39, p. 345-353, 2017. DOI: https://doi.org/10.4025/actascilangcult.v39i4.31811

SILVA, L. G.; MATTE, M. L.; SARMENTO, S. Brazilian Students’s Use of English Academic Vocabulary: An Exploratory Study. In: FINATTO, M. J. et al. (org.). Linguística de corpus: perspectivas. Porto Alegre: Instituto de Letras, UFRGS, 2018. p. 509-526.

SINCLAIR, J. Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.

TAGNIN, S. E. O. O jeito que a gente diz - combinações consagradas em inglês e português. Barueri: Disal Editora, 2013.




DOI: http://dx.doi.org/10.17851/2237-2083.29.2.1229-1252

Refbacks

  • There are currently no refbacks.
';



Copyright (c) 2021 Paula Tavares Pinto, Diva Cardoso de Camargo, Talita Serpa, Luciano Franco de Silva

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

e - ISSN 2237-2083 

License

Licensed through  Creative Commons Atribuição 4.0 Internacional