O uso de ferramentas computacionais para a anotação linguística com o propósito de automatizar a análise de amostras sociolinguísticas, principalmente aquelas com grande volume, é fundamental (SOUSA, 2020). Existem diversas ferramentas para etiquetagem automática, isto é, que atribuem automaticamente ao conjunto de dados marcações morfológicas, sintáticas, semânticas, entre outras. No entanto, nem todas são gratuitas e simples de utilizar, já que algumas exigem conhecimento de linguagem de programação. Tendo como foco a etiquetagem morfológica das categorias gramaticais do português brasileiro na amostra Deslocamentos 2019 do banco de dados Falares Sergipanos, apresentamos os resultados parciais do desempenho da ferramenta LancsBox 6.0 (BREZINA; WEILL-TESSIER; MCENERY, 2020), com o objetivo de contribuir para automatização da análise sociolinguística. Para realizar tal objetivo, selecionamos aleatoriamente 14 entrevistas que compõem a amostra e realizamos uma inspeção em cada uma para retirar marcas externas do texto como referências a risos, barulhos, interveniências, entre outros. Calculamos o quantitativo de palavras, resultando em 100.437 palavras, o que corresponde a 20% do total de palavras da amostra. Em seguida, para analisar a produtividade do etiquetador, escolhemos como fenômeno o modalizador epistêmico “(eu) acho que”, que foi estudado em diferentes variedades do português brasileiro, e possui sentidos variáveis de verbo pleno, opinião, dúvida, ou incerteza (cf. CARDOSO, 2021). Importamos os arquivos finais para a ferramenta e analisamos inicialmente todas as 317 ocorrências do fenômeno na amostra em relação a marcações corretas e incorretas. Atribuímos, no próprio arquivo exportado do Lancsbox, a cor vermelha às unidades da entrevista que estavam classificadas inadequadamente; e, para as unidades etiquetadas corretamente, aderimos à cor verde. No caso do fenômeno em questão, todas as 317 ocorrências foram corretamente marcadas morfologicamente. Nosso próximo objetivo é, a partir do levantamento inicial, refinar a busca utilizando filtros mais rápidos, pois fizemos, nessa primeira testagem, 4 tipos de pesquisa nos dados para buscar todas as ocorrências do fenômeno, para, posteriormente, a partir das etiquetas, levantar pistas acerca do contexto linguístico em que o fenômeno ocorre. Acreditamos que a automatização das análises em corpus de língua falada é altamente relevante por beneficiar não só os pesquisadores que lidam com grande volume de dados, como é o caso da Sociolinguística, mas também desenvolvedores de ferramentas de processamento linguístico automático. É fundamental, nesse processo, a validação e avaliação do desempenho dos etiquetadores, para que possam atender às demandas dos projetos da área.
Chegamos à décima primeira edição do Encontro de Sociolinguística com o objetivo de ampliar a rede de pesquisas e pesquisadoras/es em Sociolinguística e dar maior destaque às produções acadêmicas na região Nordeste.
A programação deste ano, contou com uma conferência que abordou o panorama das pesquisas sociolinguísticas no Nordeste e quatro mesas-redondas sobre a Sociolinguística Variacionista, Sociolinguística Histórica, Sociofuncionalismo, como também Sociolinguística e Ensino. Todas formas por pesquisadoras/es de Estados diferentes para mostrar a diversidade de conhecimentos que são produzidos nessa região.
Os trabalhos apresentados ao longo de três dias, no período de 01 a 03 de dezembro de 2021, verseram sobre diferentes temáticas e os mais diversos dialetos da língua portuguesa, distribuídos em várias áreas da Sociolinguística, a saber:
Esperamos que a compilação dos trabalhos apresentados nestes anais possam contribuir para o desenvolvimento dos estudos sociolinguísticos e sirvam de inspiração a outras novas pesquisas.
Valter de Carvalho Dias
Membro da Comissão Organizadora
Aline Silva Gomes
Cristina dos Santos Carvalho
Norma da Silva Lopes
Norma Lúcia Fernandes Almeida
Pedro Daniel dos Santos Souza
Raquel Meister Ko Freitag
Silvana Silva de Farias Araujo
Valter de Carvalho Dias
Aline Silva Gomes
Aurelina Ariadne Domingues Almeida
Clézio Roberto Gonçalves
Fabrício da Silva Amorim
Fernanda de Oliveira Cerqueira
Geisa Borges da Costa
Huda da Silva Santiago
Marcela Moura Torres Paim
Pedro Daniel dos Santos Souza
Raquel Meister Ko Freitag
Sandra Carneiro de Oliveira
Silvana Silva de Farias Araújo
Valter de Carvalho Dias
I ENCONTRO DE SOCIOLINGUÍSTICA
Variação - História - Mudança
01 de dezembro de 2011
Universidade do Estado da Bahia (Salvador)
II ENCONTRO DE SOCIOLINGUÍSTICA
Estudos da Variação, da Mudança e da Sócio-História do Português Brasileiro; Sociofuncionalismo e Etnografia da Comunicação
28 e 29 de novembro de 2012
Universidade do Estado da Bahia (Salvador-BA)
III ENCONTRO DE SOCIOLINGUÍSTICA
A pesquisa em Salvador
03 e 04 de outubro de 2013
Universidade do Estado da Bahia (Salvador-BA)
IV ENCONTRO DE SOCIOLINGUÍSTICA
Diferentes olhares sobre o português brasileiro
15 e 16 de setembro de 2014
Universidade do Estado da Bahia (Salvador-BA)
V ENCONTRO DE SOCIOLINGUÍSTICA
Diálogos entre Brasil e África
09 e 10 de novembro de 2015
Universidade Estadual de Feira de Santana (Feira de Santana-BA)
VI ENCONTRO DE SOCIOLINGUÍSTICA
O português do Nordeste: (para além das) fronteiras linguísticas
29 e 30 de setembro de 2016
Universidade do Estado da Bahia (Salvador-BA)
VII ENCONTRO DE SOCIOLINGUÍSTICA
Redes e contatos
28 a 30 de setembro de 2017
Universidade Federal de Sergipe (São Cristovão-SE)
VIII ENCONTRO DE SOCIOLINGUÍSTICA
Variação e ensino: unidade e diversidade
20 e 21 de julho de 2018
Universidade do Estado da Bahia (Salvador-BA)
IX ENCONTRO DE SOCIOLINGUÍSTICA
Sociolinguística: quebrando tabus e inovando na escola
01 e 02 de agosto de 2019
Universidade Federal da Bahia (Salvador-BA)
Anais
X ENCONTRO DE SOCIOLINGUÍSTICA
Desafios do isolamento social para a Sociolinguística e interfaces
De 01 a 04 de dezembro de 2021
Edição online
Anais