ETIQUETAGEM DE DADOS DE ENTREVISTAS SOCIOLINGUÍSTICAS: A PRODUTIVIDADE DA FERRAMENTA LANCSBOX PARA LEVANTAR OCORRÊNCIAS DO MODALIZADOR EPISTÊMICO “(EU) ACHO QUE”

  • Autor
  • Calyne Porto de Oliveira
  • Co-autores
  • Marta Deysiane Alves Faria Sousa
  • Resumo
  •  

    O uso de ferramentas computacionais para a anotação linguística com o propósito de automatizar a análise de amostras sociolinguísticas, principalmente aquelas com grande volume, é fundamental (SOUSA, 2020). Existem diversas ferramentas para etiquetagem automática, isto é, que atribuem automaticamente ao conjunto de dados marcações morfológicas, sintáticas, semânticas, entre outras. No entanto, nem todas são gratuitas e simples de utilizar, já que algumas exigem conhecimento de linguagem de programação. Tendo como foco a etiquetagem morfológica das categorias gramaticais do português brasileiro na amostra Deslocamentos 2019 do banco de dados Falares Sergipanos, apresentamos os resultados parciais do desempenho da ferramenta LancsBox 6.0 (BREZINA; WEILL-TESSIER; MCENERY, 2020), com o objetivo  de contribuir para  automatização da análise sociolinguística. Para realizar tal objetivo, selecionamos aleatoriamente 14 entrevistas que compõem a amostra e realizamos uma inspeção em cada uma para retirar marcas externas do texto como referências a risos, barulhos, interveniências, entre outros. Calculamos o quantitativo de palavras,  resultando em 100.437 palavras, o que corresponde a 20% do total de palavras da amostra. Em seguida, para analisar a produtividade do etiquetador, escolhemos como fenômeno o modalizador epistêmico “(eu) acho que”, que foi estudado em diferentes variedades do português brasileiro, e possui sentidos variáveis de verbo pleno, opinião, dúvida, ou incerteza (cf. CARDOSO, 2021). Importamos os arquivos finais para a ferramenta e analisamos inicialmente todas as 317 ocorrências do fenômeno na amostra em relação a marcações corretas e incorretas. Atribuímos, no próprio arquivo exportado do Lancsbox,  a cor vermelha às unidades da entrevista que estavam classificadas inadequadamente; e, para as unidades etiquetadas corretamente, aderimos à cor verde. No caso do fenômeno em questão, todas as 317 ocorrências foram corretamente marcadas morfologicamente. Nosso próximo objetivo é, a partir do levantamento inicial, refinar a busca utilizando filtros mais rápidos, pois fizemos, nessa primeira testagem, 4 tipos de pesquisa nos dados para buscar todas as ocorrências do fenômeno, para, posteriormente, a partir das etiquetas, levantar pistas acerca do contexto linguístico em que o fenômeno ocorre. Acreditamos que a  automatização das análises em corpus de língua falada é altamente relevante por beneficiar não só os pesquisadores que lidam com grande volume de dados, como é o caso da Sociolinguística, mas também desenvolvedores de ferramentas de processamento linguístico automático. É fundamental, nesse processo, a validação e avaliação do desempenho dos etiquetadores, para que possam atender às demandas dos projetos da área.

  • Palavras-chave
  • Etiquetagem morfológica; Lancsbox; ‘’(Eu) acho que’’; Variação.
  • Área Temática
  • Sociolinguística Variacionista
Voltar

A SOCIOLINGUÍSTICA NO NORDESTE

 

Chegamos à décima primeira edição do Encontro de Sociolinguística com o objetivo de ampliar a rede de pesquisas e pesquisadoras/es em Sociolinguística e dar maior destaque às produções acadêmicas na região Nordeste.

A programação deste ano, contou com uma conferência que abordou o panorama das pesquisas sociolinguísticas no Nordeste e quatro mesas-redondas sobre a Sociolinguística Variacionista, Sociolinguística Histórica, Sociofuncionalismo, como também Sociolinguística e Ensino. Todas formas por pesquisadoras/es de Estados diferentes para mostrar a diversidade de conhecimentos que são produzidos nessa região.

Os trabalhos apresentados ao longo de três dias, no período de 01 a 03 de dezembro de 2021, verseram sobre diferentes temáticas e os mais diversos dialetos da língua portuguesa, distribuídos em várias áreas da Sociolinguística, a saber: 

  • Geossociolinguística
  • Sociofuncionalismo
  • Sociolinguística de Contato
  • Sociolinguística Educacional
  • Sociolinguística Histórica
  • Sociolinguística Interacional
  • Sociolinguística Perceptual
  • Sociolinguística Variacionista

Esperamos que a compilação dos trabalhos apresentados nestes anais possam contribuir para o desenvolvimento dos estudos sociolinguísticos e sirvam de inspiração a outras novas pesquisas.

 

Valter de Carvalho Dias
Membro da Comissão Organizadora

Comissão Organizadora

Aline Silva Gomes

Cristina dos Santos Carvalho

Norma da Silva Lopes

Norma Lúcia Fernandes Almeida

Pedro Daniel dos Santos Souza

Raquel Meister Ko Freitag

Silvana Silva de Farias Araujo

Valter de Carvalho Dias

 

Comissão Científica

Aline Silva Gomes

Aurelina Ariadne Domingues Almeida

Clézio Roberto Gonçalves

Fabrício da Silva Amorim

Fernanda de Oliveira Cerqueira

Geisa Borges da Costa

Huda da Silva Santiago

Marcela Moura Torres Paim

Pedro Daniel dos Santos Souza

Raquel Meister Ko Freitag

Sandra Carneiro de Oliveira

Silvana Silva de Farias Araújo

Valter de Carvalho Dias

I ENCONTRO DE SOCIOLINGUÍSTICA
Variação - História - Mudança
01 de dezembro de 2011
Universidade do Estado da Bahia (Salvador)

 

II ENCONTRO DE SOCIOLINGUÍSTICA
Estudos da Variação, da Mudança e da Sócio-História do Português Brasileiro; Sociofuncionalismo e Etnografia da Comunicação
28 e 29 de novembro de 2012
Universidade do Estado da Bahia (Salvador-BA)

 

III ENCONTRO DE SOCIOLINGUÍSTICA
A pesquisa em Salvador
03 e 04 de outubro de 2013
Universidade do Estado da Bahia (Salvador-BA)

 

IV ENCONTRO DE SOCIOLINGUÍSTICA
Diferentes olhares sobre o português brasileiro
15 e 16 de setembro de 2014
Universidade do Estado da Bahia (Salvador-BA)

 

V ENCONTRO DE SOCIOLINGUÍSTICA
Diálogos entre Brasil e África
09 e 10 de novembro de 2015
Universidade Estadual de Feira de Santana (Feira de Santana-BA)

 

VI ENCONTRO DE SOCIOLINGUÍSTICA
O português do Nordeste: (para além das) fronteiras linguísticas
29 e 30 de setembro de 2016
Universidade do Estado da Bahia (Salvador-BA)

 

VII ENCONTRO DE SOCIOLINGUÍSTICA
Redes e contatos
28 a 30 de setembro de 2017
Universidade Federal de Sergipe (São Cristovão-SE)

 

VIII ENCONTRO DE SOCIOLINGUÍSTICA
Variação e ensino: unidade e diversidade
20 e 21 de julho de 2018
Universidade do Estado da Bahia (Salvador-BA)

 

IX ENCONTRO DE SOCIOLINGUÍSTICA
Sociolinguística: quebrando tabus e inovando na escola
01 e 02 de agosto de 2019
Universidade Federal da Bahia (Salvador-BA)
Anais

 

X ENCONTRO DE SOCIOLINGUÍSTICA
Desafios do isolamento social para a Sociolinguística e interfaces
De 01 a 04 de dezembro de 2021
Edição online
Anais