A ferramenta de busca E-CORP aplicada ao Corpus Eletrônico de Documentos Históricos do Sertão

Autores

  • Igor Leal Souza UEFS
  • Gabriela Ribeiro Peixoto Rezende Pinto UEFS
  • Zenaide de Oliveira Novais Carneiro UEFS
  • Pablo Picasso Feliciano de Faria UNICAMP
  • Mariana Fagundes de Oliveira Lacerda UEFS

DOI:

https://doi.org/10.13102/cl.v19i2.4276

Resumo

Com o surgimento das Humanidades Digitais, cada vez mais a tecnologia está sendo aceita como parceira no desenvolvimento de pesquisas linguísticas. Essa parceria traz uma contribuição para ambas as áreas: para a linguística, novas possibilidades de estudo, com mais velocidade e confiabilidade; para a computação, essa interdisciplinaridade a enriquece com novos conceitos e aumenta sua área de atuação. Este trabalho, nessa interface entre a computação e a linguística, tem como objetivo apresentar o desenvolvimento do E-Corp – uma ferramenta de busca de dados para fins linguísticos, e sua aplicação no CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão (www.uefs.br/cedohs), da Universidade Estadual de Feira de Santana (UEFS). O desenvolvimento dessa ferramenta visa a auxiliar os pesquisadores da área da linguística a fazer exploração de corpora de maneira mais rápida e confiável.

Referências

CARNEIRO, Z. de O. N. Cartas brasileiras (1808-1904): um estudo linguístico-filológico. 2005. 4v. 2.329f. Tese (Doutorado em Linguística) – Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, Campinas, São Paulo, 2005.

COSTA, A. S. WebSinC: Uma Ferramenta Web para buscas sintáticas e morfossintáticas

em corpora anotados - Estudo de Caso do Corpus DOViC – Bahia. 2015. 1v. 190f. Dissertação (Mestrado em Linguística) - Programa de Pós-graduação em Linguística, Universidade Estadual do Sudoeste da Bahia, Vitória da Conquista, 2015.

CLUL (Ed.). 2014. P.S. Post Scriptum. Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna. Disponível em: http://ps.clul.ul.pt.>. Acesso em: 31 fev. 2018.

CORPUS CE-DOHS. Corpus Eletrônico de Documentos Históricos do Sertão. Disponível em: . Acesso em: 10 mar 2018.

FARIA, Pablo; GALVES, Charlotte. Criando “Bancos de Árvores”: O Sistema de Anotação e o Processo Automático. Cadernos de Estudos Linguísticos. Campinas: v. 58, n. 2 p. 299-315, maio/ago./2016. Disponível em http://revistas.iel.unicamp.br/index.php/cel/article/view/5133. Acesso em 25 mar. 2018.

Galves, Charlotte; Andrade, Aroldo Leal de; and Faria, Pablo (2017, December). Tycho Brahe Parsed Corpus of Historical Portuguese. Disponível em: . <http://www.tycho.iel.unicamp.br/~tycho/corpus/texts/psd.zip>. Acesso em: 14 mar 2018.

LACERDA, Mariana Fagundes de Oliveira; CARNEIRO, Zenaide de Oliveira Novais; SANTIAGO, H. S. . Corpus eletrônico de documentos históricos do sertão: as cartas de inábeis. A COR DAS LETRAS (UEFS), v. 17, p. 127, 2016.

LEAL, Igor. E-Corp - uma ferramenta de busca de dados para fins linguísticos: aplicação em banco de dados de corpus eletrônico. Monografia (Graduação em Engenharia de Computação). Universidade Estadual de Feira de Santana, 2016.

PAIXÃO DE SOUSA, M. C. A Filologia Digital em Língua Portuguesa: Alguns caminhos. In: BANZA, A. P.; GONÇALVES, M. F. Património textual e humanidades digitais: da antiga à nova Filologia. Évora: Centro Interdisciplinar de História, Culturas e Sociedades da Universidade de Évora (CIDEHUS)/ Fundação para a Ciência e a Tecnologia (FCT).

PAIXÃO DE SOUSA, M. C. Memórias do Texto. Texto Digital (UERJ), 2006. v. 1. p. 10. Disponível em: <http://www.periodicos.ufsc.br/index.php/textodigital/>. Acesso em: 10 mar 2018.

PAIXÃO DE SOUSA, M. C. O Corpus Tycho Brahe: contribuições para as humanidades digitais no Brasil. Filologia e Linguística Portuguesa, 2014. v. 16. p. 53-93.

PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. E-dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: VIII Encontro de Linguística de Corpus, 2009. Rio de Janeiro, Anais do VIII Encontro de Linguística de Corpus. Rio de Janeiro: UERJ, 2009. p. 69-105.

PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. E-Dictor: Uma ferramenta integrada para a anotação de edição e classe de palavras. In: VI Encontro de Lingüística de Corpus, São Paulo, 2007.

SARDINHA, T. B. Lingüística de corpus: histórico e problemática. D.E.L.T.A., São Paulo, 2000. v. 16. n. 2. p. 323-367. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502000000200005>. Acesso em: 15 mar 2018.

TUY BATISTA, P, S, E. O uso de tu e você em cartas baianas pessoais no século xx em reações de simetria. (a sair). Dissertação (Mestrado em Estudos Linguísticos) – Programa de Pós-Graduação em Estudos Linguísticos, Universidade Estadual de Feira de Santana, Feira de Santana, 2016.

Downloads

Publicado

2019-01-01

Como Citar

Souza, I. L., Pinto, G. R. P. R., Carneiro, Z. de O. N., Faria, P. P. F. de, & Lacerda, M. F. de O. (2019). A ferramenta de busca E-CORP aplicada ao Corpus Eletrônico de Documentos Históricos do Sertão. A Cor Das Letras, 19(2), 8–21. https://doi.org/10.13102/cl.v19i2.4276

Artigos mais lidos pelo mesmo(s) autor(es)