CONSTITUIÇÃO DE CORPUS ELETRÔNICO PARA ANOTAÇÃO SINTÁTICA: EDIÇÃO EM LINGUAGEM XML DE PANFLETOS

Rhillary Lopes Vieira

Resumo


O presente trabalho faz parte da agenda do projeto CEDOHS-Corpus Eletrônico de Documentos Históricos do Sertão, o qual compõe o Núcleo de Estudos em Língua Portuguesa (NELP), situado no Departamento de Letras e Artes da Universidade Estadual de Feira de Santana (UEFS).
O trabalho de reconstituição da história da língua tem como ponto de partida a constituição de corpus, e, segundo Mattos e Silva (2002), o corpora deve ser diverso, constituído por textos de diferentes tipos e escritos em diferentes épocas. Dessa forma, a formação de um banco de dados com textos históricos é de grande importância para estudos na área da linguística histórica.
Pensando nisso, como parte da agenda do CEDOHS, o objetivo neste trabalho foi editar, em linguagem XML, de 57 panfletos de Eulálio Motta, produzidos em Mundo Novo-Bahia, entre 1930 e 1980. A edição eletrônica dos panfletos foi feita a partir da edição filológica feita por Barreiros (2013). Essa conciliação das novas tecnologias digitais e da antiga filologia traz novas possibilidades para preservação e análise de textos antigos (GONÇALVES; BANZA, 2013), contribuindo, assim, para avanços nos estudos diacrônicos da língua.
Para a edição eletrônica, utilizou-se o eDictor, ferramenta desenvolvida por Kepler, Paixão de Sousa e Farias (2007), programa computacional voltado para a análise linguística automática, que permite a transcrição e codificação em formato XML e facilita a edição eletrônica de textos antigos.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.