¿No posee una cuenta?
Humanidades Digitales: Miradas desde el sur. Quinto Congreso de la AAHD
—
Asociación Argentina de Humanidades Digitales
— 17 y 18 de noviembre de 2022
— General Roca-Füskü Menuko, Provincia de Río Negro, Argentina.
Panel 7
Proposta metodológica para edição eletrônica de textos: inserção de uma camada para identificação de palavras
Horario: 11:30hs a 13:00hs.
Coordinador(es):
Tuy Batista, Priscila (USP) y Leal, Igor (UNICAMP) .
Duración:
1:30hs.
Este trabalho apresenta uma proposta metodológica para a edição eletrônica de textos, cujo objetivo é a inserção de uma camada de edição para identificação de palavras. A metodologia aqui apresentada, discutida por Tuy Batista e Leal (2021), foi empregada em textos da coleção documental Família Estrela Tuy (CDFET), composta por 152 textos manuscritos, produzidos entre 1920 e 2000, por 49 brasileiros (23 mulheres e 26 homens); uma das coleções que integram o Corpus Eletrônico de Documentos Históricos do Sertão (CE-DOHS) (www.uefs.br/cedohs), projeto desenvolvido no âmbito do Núcleo de Estudos de Língua Portuguesa (NELP), da Universidade Estadual de Feira de Santana (UEFS). A edição eletrônica foi realizada a partir do programa computacional eDictor (PAIXÃO DE SOUSA; KPLER; FARIA, 2013), desenvolvido especialmente para o trabalho filológico e para a análise linguística automática, a fim de facilitar a edição eletrônica de textos antigos, ao fazer a mediação entre o editor e a linguagem XML. O eDictor combina um editor de XML e um etiquetador morfológico, que permite que o texto seja transcrito, editado e etiquetado (etiquetação morfossintática), possibilitando que diferentes versões de edição – diplomática, semidiplomática e modernizada (em HTML), acompanhadas pelo fac-símile –, inclusive o texto original, sejam gerados sem prejuízos à qualidade filológica, além de versões com anotação morfológica (em texto simples e XML), reunindo todas as informações em camadas editoriais sobre um mesmo arquivo (cf. PAIXÃO DE SOUSA, 2014). Ampliando a proposta metodológica de edição eletrônica adotada pelo CE-DOHS, é aplicada uma camada de edição, em um nível mais alto, que permite a inserção de outras informações e a instanciação da palavra editada. Ao utilizar esse método, não estamos mais trabalhando, necessariamente, como um conjunto de caracteres e sim como um “objeto” que está inserido no texto, seja para inserir informações de cunho sócio-histórico ou de identificação por ID de todas as pessoas presentes nos manuscritos, por exemplo. A edição eletrônica de textos, aplicada na CDFET, propõe a inclusão de recursos quando da edição, a partir da adição de uma camada de informações, de forma que permitirá a recuperação desses dados e a construção de uma rede de ligação entre as informações dos metadados e os manuscritos, sendo possível aplicar essa proposta de edição em outras coleções documentais. Além disso, ao inserir as informações nessa camada mais alta de edição, reunimos pistas que podem auxiliar na investigação acerca da comunidade linguística, da sócio-história, dos manuscritos, entre outras, oferecendo textos com controle rigoroso das informações, tornando um conjunto de documentos confiável, desde dados como escolaridade até as relações interpessoais, que podem servir como fonte de dados para demais trabalhos. Para concretizar o trabalho, utilizamos as ferramentas computacionais junto às necessidades discutidas nos campos filológico e linguístico, sob os métodos das humanidades digitais.