Linguística de Corpus, é a área da Linguística que usa corpora como sua ferramenta de pesquisa. Nessa área, corpus é definido como uma extensa coletânea de textos (de natureza oral ou escrita) autênticos, ou seja, produzidos com uma finalidade que não está ligada à criação do corpus (STEFANOWITSCH, 2020; CSOMAY; CRAWFORD, 2024). Ainda, de acordo com Sardinha-Berber (2004), esses textos devem ser legíveis por computador e criteriosamente escolhidos para representar uma língua ou variante de uma língua e, para tanto, devem ser abrangentes em quantidade de texto.

Uma das tendências nessa área de pesquisa é o desenvolvimento de “corpora nacionais”, isto é, corpora de uma determinada língua em uma escala muito grande (MIKHAILOV; COOPER, 2016). Um exemplo desses corpora é o Balanced Corpus of Contemporary Written Japanese (BCCWJ), lançado pelo National Institute for Japanese Language and Linguistics (NINJAL) em 2011. Esse corpus eletrônico aberto compreende uma coletânea de textos de diversos gêneros que totaliza um montante de 100.430.000 palavras. No entanto, embora, a língua japonesa conte com um corpus de grande extensão como o BCCWJ e o desenvolvimento de novos corpora da língua japonesa (Corpus of Spontaneous Japanese (CSJ), Corpus of Historical Japanese (CHJ) etc.) continue acontecendo, ainda são poucas as pesquisas na área de Língua Japonesa no Brasil feitas com base em dados de corpora da Língua Japonesa.

Tendo em vista o exposto acima, esta oficina tem como objetivo difundir a metodologia de pesquisa da Linguística de Corpus e ampliar a conscientização de pesquisadores de Língua Japonesa no Brasil sobre as ferramentas disponíveis na atualidade. Assim, primeiramente abordaremos a área da Linguística de Corpus como um todo (discutindo sua definição e alcance, além de um breve histórico dessa metodologia), para, em seguida, observarmos na prática o uso das ferramentas disponíveis para a pesquisa em corpora da língua japonesa (utilizando especificamente o BCCWJ como exemplo) e os tipos de análise feitas com base nesses dados. Por fim, discutiremos as possibilidades futuras para a área de Linguística de Corpus no âmbito dos estudos de Língua, Literatura e Cultura Japonesa no Brasil.

Share!

Colaboração

Organization