eASSIGNER: UMA PROPOSTA DE AUTOMAÇÃO DAS EDIÇÕES DE ANOTAÇÕES XML DO eDICTOR
DOI:
https://doi.org/10.13102/cl.v17i1.1439Resumo
Este trabalho discute a importância da aplicação das técnicas de Aprendizado de Máquina - ligadas à Inteligência Artificial (IA) - como ferramentas de auxílio aos trabalhos dos linguistas, particularmente no que se refere à Linguística de Corpus. Para atingir essa proposta, o trabalho define a Linguística de Corpus, a Linguística Computacional e descreve utilizações atuais da IA enfatizando os problemas relacionados à Linguística e as estratégias modernas em busca de soluções. A partir daí, descreve a importância do uso de softwares de anotação em corpora eletrônicos e a decorrente necessidade de automatizar algumas dessas operações através do desenvolvimento do software eAssigner, apresentando as suas características, limitações e estágio de desenvolvimento. Para ilustrar a necessidade de uso do software são apresentados resultados de alguns testes realizados em amostra de documentos do Corpus DoViC.
Downloads
Métricas
Referências
BERBER SARDINHA, Tony. O que é um corpus representativo? São Paulo: LAEL PUCSP, 2000. Disponível em http://www2.lael.pucsp.br/direct/DirectPapers44.pdf acesso em 11 out. 2015.
COPPIN, Ben. Inteligência Artificial. Rio de Janeiro: LTC, 2010.
DIAS-DA-SILVA, Bento Carlos. O estudo Linguístico-Computacional da Linguagem. Letras de Hoje. Porto Alegre. v. 41, nº 2, p. 103-138, junho, 2006. Disponível em <http://revistaseletronicas.pucrs.br/ojs/index.php/fale/article/viewFile/597/428> acesso em 13 out. 2015.
FARIA, Pablo; GALVES, Charlotte. Criando “Bancos de Árvores”: O Sistema de Anotação e o Processo Automático. Cadernos de Estudos Linguísticos. Campinas: v. 58, n. 2 p. 299-315, maio/ago./2016. Disponível em http://revistas.iel.unicamp.br/index.php/cel/article/view/5133. Acesso em 30 dez. 2016.
FARIA, Pablo P. F.; PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. An Integrated Tool for Annotating Historical Corpora. The Fourth Linguistic Annotation Workshop (LAW IV) at The 48th Annual Meeting of the Association for Computational Linguistics (ALC 2010), Uppsala, 2010. (Congresso).
GALVES, Charlotte; BRITTO, Helena. A Construção do Corpus Anotado do Português Histórico Tycho Brahe: o sistema de anotação morfológica. USP. São Paulo: 1999. Disponível em https://www.ime.usp.br/~tycho/participants/c_galves/galves_e_britto.htm. Acesso em 13 out. 2015.
LUGER, George F. Inteligência Artificial. 6ª ed. Tradução de Daniel Vieira. São Paulo: Pearson Education do Brasil, 2013.
NAMIUTI, Cristiane; SANTOS, Jorge Viana. Novos desafios para antigas fontes: a experiência DOViC na nova linguística histórica. In.: E-Book do Congresso de Humanidades Digitais em Portugal: Construir pontes e quebrar barreiras na era digital – 2015. Lisboa: Universidade Nova de Lisboa, 2016a (no prelo).
NAMIUTI, Cristiane; COSTA, Aline Silva. Reflexões sobre anotação sintática e ferramentas de busca - Uso da linguagem XML para anotação sintática no corpus digital DOViC. Letras & Letras. Uberlândia, v.30, n.2, 2014, p. 82-103. Disponível em http://www.seer.ufu.br/index.php/letraseletras/article/view/27855/15804. Acesso em 2 ago. 2016.
NAMIUTI, Cristiane; VIANA SANTOS, Jorge; LEITE, Cândida Mara Brito. Propostas e Desafios dos Novos Meios das Antigas Fontes: a preservação da memória pela Linguística de Corpus. Trabalho apresentado no IX Colóquio do Museu Pedagógico. UESB, Vitória da Conquista: 2011. Disponível em http://periodicos.uesb.br/index.php/cmp/article/viewFile/2717/2382. Acesso em 2 ago. 2016.
OTHERO, Gabriel de Ávila; MENUZZI, Sérgio de Moura. Linguística Computacional: teoria & prática. São Paulo: Parábola Editorial, 2005.
OTHERO, Gabriel de Ávila. Linguística Computacional: uma breve introdução. Letras de Hoje. Porto Alegre. v. 41, nº2, p. 341-351, junho, 2006. <http://revistaseletronicas.pucrs.br/ojs/index.php/fale/article > acesso em 13 out. 2015.
PAIXÃO DE SOUSA, M. C. Memórias do Texto. In: Revista Texto Digital, ISSN 1807-9288, ano 2 n.1 2006a.<http://www.textodigital.ufsc.br/num02/paixao.htm>
PAIXÃO DE SOUSA, M. C. A anotação semiautomática de divergências de grafia como fundamento para o processamento automático de textos antigos: Uma experiência na Brasiliana Digital. 18º Intercâmbio de Pesquisas em Linguística Aplicada, PUC, São Paulo, 2011.
PAIXÃO DE SOUSA, Maria Clara; KEPLER, Fabio Natanael; FARIA, Pablo Picasso Feliciano de. e-Dictor. Versão 1.0 beta 10, 2013. Programa de Computador. Disponível em: http://edictor.net/download. Acesso em 01 jun.2016. Acesso em 15 maio 2016.
______. eDictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: VIII Encontro de Linguística de Corpus, 2009, Rio de Janeiro. Resumos, 2009.
RUSSELL, Stuart; NOVIG, Peter. Inteligência Artificial. 3ª ed. Rio de Janeiro: Elsevier, 2013 [e-book].
SANTOS, Jorge Viana. Técnicas de transporte do texto manuscrito para o meio digital. Trabalho apresentado na I Oficina de Linguística de Corpus da Bahia (UEFS, UESB, UFBA). Feira de Santana, Brasil, Dezembro 15-17, 2010.
VIEIRA, Renata; LIMA, V.L.S. Linguística Computacional: princípios e aplicações. In: IX Escola de Informática da SBC-Sul. Luciana Nedel (Ed.) Passo Fundo, Maringá, São José. SBC-Sul, 2001.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2021 Revista A Cor das Letras

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Este trabalho foi licenciado com uma Licença Creative Commons - Atribuição - NãoComercial - CompartilhaIgual 3.0 Não Adaptada.

