VII Encontro Baiano de Estatística

VII Encontro Baiano de Estatística

Faça sua inscrição
De 18 a 25 de outubro Todos os dias das 10h20 às 10h20

Sobre o Evento

VII EBEst: A Versatilidade do Estatístico na Gestão de Dados Complexos

É com muita satisfação e honra que anunciamos a vocês a realização do VII Encontro Baiano de Estatística - EBEST. Pela primeira vez o evento será promovido de forma 100% online e gratuita, uma excelente oportunidade para fortalecermos as interações regionais entre os Estatísticos.

O evento ocorrerá entre os dias 18 e 25 de outubro de 2020, em dias e horários que facilitarão sua presença virtual, com o objetivo de brindar os participantes com palestras nas áreas de Estatística e Ciência de Dados e fomentar discussões sobre os desafios e oportunidades da formação, atuação e prática do Estatístico na gestão de dados complexos no mercado de trabalho e na academia.

Não perca a oportunidade e garanta já sua vaga!

Palestrantes

  • Florencia Leonardi
  • Marcos Santos Oliveira
  • Gilberto Alvarenga Paula
  • Pedro Luis do Nascimento Silva
  • Paulo Canas Rodrigues
  • Paulo Henrique Ferreira da Silva
  • Paulo Ricardo Cosme Bezerra
  • Julio Adolfo Zucon Trecenti
  • Allan Robert da Silva
  • Grimaldo Lopes de Oliveira
  • João Agnaldo do Nascimento

Programação

10h00 Cerimônia de Abertura Abertura
Local: https://www.youtube.com/watch?v=15k4jYijzts
10h20 - Pedro Luis do Nascimento Silva Combinando amostras para aprimorar estimativas – algumas aventuras na amostragem não probabilística Palestra
Local: https://www.youtube.com/watch?v=_s9b8fQ7uEA

Clique aqui e acesse o slide da palestra.

16h20 - Allan Robert da Silva Introdução a manipulação e visualização de dados usando o pacote tidyverse do R Minicurso
Local: https://www.youtube.com/watch?v=ZFnGb-g97m4

Em uma pesquisa geralmente nos deparamos com o processo que é bastante custoso: A manipulação dos dados. Este processo acontece bem antes da análise perpassando pela leitura, organização, preparo, seleção, síntese e visualização dos dados. Neste curso será usado pacote tidyverse do software R que, na verdade, é um conjunto de pacotes com funções harmônicas cujo objetivo principal é a redução de tempo operacional e do custo computacional fazendo uso de uma gramática simplificada para manipulação de dados. Serão explorados conjuntos de dados do Censo via Atlas de desenvolvimento humano no Brasil, dados sobre o covid-19 e outros. Todos scripts do R serão disponibilizados.

Clique aqui e acesse ao material do minicurso (script, slide e exemplos)

10h20 - Paulo Henrique Ferreira da Silva Uso de Técnicas de Mineração de Dados para Classificação de Eventos Raros Palestra
Local: https://www.youtube.com/watch?v=l0-GEs8p60c

Uma aplicação bem-sucedida de mineração de dados (em inglês,data mining), tendo como objetivo a predição baseada em padrões, passa por várias etapas importantes, que vão desde a preparação dos dados (limpeza, integração, seleção e transformação) até o ajuste e validação dos modelos preditivos. Muitas vezes, as aplicações de mineração de dados com algoritmos de aprendizado de máquina (em inglês, machine learning) em problemas de classificação binária, ocorrem quando existem muito menos casos de uma classe do que da outra (bases de dados desbalanceadas). Isto é bastante comum em várias áreas, como finanças (e.g., detecção de fraude em cartões de crédito) e saúde (e.g., diagnóstico médico). Contudo, o desbalanceamento entre as classes pode comprometer significativamente o desempenho dos algoritmos de classificação. Nesta apresentação serão discutidos, portanto, os principais desafios e dificuldades das técnicas tradicionais de mineração de dados neste contexto, bem como alternativas de modelagem estatística e de aprendizado de máquina propostas na literatura recente.

16h00 Homenagem ao Estatístico Gilberto Alvarenga Paula Sessão Solene
Local: https://www.youtube.com/watch?v=LsiseCKrdLs
16h20 - Gilberto Alvarenga Paula Modelos Lineares Parciais Aditivos Generalizados com Penalização através de B-Splines Palestra
Local: https://www.youtube.com/watch?v=GawCccBXvXw

Os MLPAGs combinam duas classes de modelos de regressão muito conhecidas no Brasil, os modelos lineares generalizados e os modelos aditivos generalizados. Nos MLPAGs o parâmetro de localização é modelado através de componentes paramétricos e não paramétricos, esses últimos sendo aproximados por B-splines. O objetivo desta palestra é apresentar uma atualização dos MLPAGs, motivando inicialmente com exemplos ilustrativos e descrevendo as equações de máxima verossimilhança penalizadas para estimação dos parâmetros dos componentes paramétrico e não paramétrico. Descrevemos o processo iterativo conhecido como backfitting (Gauss-Seidel) que evita operações com matrizes de alta dimensão. Alguns conceitos inferenciais relacionados com máxima verossimilhança penalizada e métodos de diagnóstico são apresentados. Extensões para o MLPAG duplo são discutidas e os exemplos ilustrativos são analisados através de MLPAGs.

19h20 - João Agnaldo do Nascimento Análise de Variância não paramétrica para dados Longitudinais Palestra
Local: https://www.youtube.com/watch?v=QMhfnis0njc

Exprimentos longitudinais (medidas repetidas ao longo do tempo) com um ou mais fatores são analisados por métodos paramétricos cujas suposições são difíceis de ocorrer na maioria das aplicações. São sensíveis a outliers, não aplicáveis a dados com nível de mensuração ordinal ou dicotômicos e necessitam de amostras razoavelmente grandes para que seus estimadores sejam confiáveis. A técnica não paramétrica está preparada para estas dificuldades não superadas pelos métodos paramétricos. Exemplos de aplicação utilizando linguagem R com a library nparLD são apresentadas e a teoria desenvolvida para alcançar as estatísticas dos testes multivariados.

20h20 Homenagem ao Estatístico LINO MOSQUERA NAVARRO Sessão Solene
Local: https://www.youtube.com/watch?v=Lh_ZiAKiipE
16h20 - Allan Robert da Silva Introdução a manipulação e visualização de dados usando o pacote tidyverse do R Minicurso
Local: https://www.youtube.com/watch?v=ZFnGb-g97m4

Em uma pesquisa geralmente nos deparamos com o processo que é bastante custoso: A manipulação dos dados. Este processo acontece bem antes da análise perpassando pela leitura, organização, preparo, seleção, síntese e visualização dos dados. Neste curso será usado pacote tidyverse do software R que, na verdade, é um conjunto de pacotes com funções harmônicas cujo objetivo principal é a redução de tempo operacional e do custo computacional fazendo uso de uma gramática simplificada para manipulação de dados. Serão explorados conjuntos de dados do Censo via Atlas de desenvolvimento humano no Brasil, dados sobre o covid-19 e outros. Todos scripts do R serão disponibilizados.

Clique aqui e acesse ao material do minicurso (script, slide e exemplos)

10h20 - Marcos Santos Oliveira Modelagem de Escore para Crédito: Passos fundamentais para um bom modelo Palestra
Local: https://www.youtube.com/watch?v=99NbBKDpWGQ

Os bancos, financeiras e instituições que operam crédito em geral, busca a maximização dos seus resultados por meio da busca de novos clientes e da manutenção dos já existentes. Para isso, utilizam técnicas estatísticas, matemáticas e/ou computacionais como ferramentas que auxiliem na decisão inteligente de ações a serem realizadas na concessão e continuidade do crédito a seus clientes. Mas é muito importante seguir passos essenciais para obter bons modelos que segmentem e façam a distinção dos clientes.

16h20 - Florencia Leonardi Detecção de estruturas de dependência em processos estocásticos Palestra
Local: https://www.youtube.com/watch?v=4zqgy_L2uKs
19h20 - Paulo Ricardo Cosme Bezerra Oportunidades e desafios no mercado de trabalho: experiência como estatístico no Sebrae Palestra
Local: https://www.youtube.com/watch?v=w1NVhb5MjOE
16h20 - Allan Robert da Silva Introdução a manipulação e visualização de dados usando o pacote tidyverse do R Minicurso
Local: https://www.youtube.com/watch?v=ZFnGb-g97m4

Em uma pesquisa geralmente nos deparamos com o processo que é bastante custoso: A manipulação dos dados. Este processo acontece bem antes da análise perpassando pela leitura, organização, preparo, seleção, síntese e visualização dos dados. Neste curso será usado pacote tidyverse do software R que, na verdade, é um conjunto de pacotes com funções harmônicas cujo objetivo principal é a redução de tempo operacional e do custo computacional fazendo uso de uma gramática simplificada para manipulação de dados. Serão explorados conjuntos de dados do Censo via Atlas de desenvolvimento humano no Brasil, dados sobre o covid-19 e outros. Todos scripts do R serão disponibilizados.

Clique aqui e acesse ao material do minicurso (script, slide e exemplos)

10h20 - Grimaldo Lopes de Oliveira Visualização de Dados Palestra
Local: https://www.youtube.com/watch?v=KZpVcPVoahA

A visualização de dados é considerada uma das camadas mais importante na entrega de qualquer projeto de dados, ela consiste na representação/comunicação das informações e dados com princípios na exploração, descoberta ou comunicação. O mercado de trabalho possui diversas oportunidades com as mais diversificadas ferramentas, para profissionais de diversas áreas que trabalham com dados em seus mais variados formatos.

16h20 - Julio Adolfo Zucon Trecenti Introdução ao Deep Learning com R Palestra
Local: https://www.youtube.com/watch?v=DHgKXOmHkjA

Deep learning é uma classe de modelos que ficou famosa nos últimos anos dentro do Machine Learning por resolver problemas historicamente difíceis de detecção de imagem, transcrição de áudio e classificação de textos. O objetivo desta palestra é introduzir algumas técnicas utilizadas em Deep Learning, discutindo como funcionam as redes neurais, quais são os softwares utilizados para treiná-las e quais são as principais técnicas para tunar esses modelos.

10h20 - Paulo Canas Rodrigues Estatística e Ciência de Dados: transformando dados em informação Palestra
Local: https://www.youtube.com/watch?v=XkBFS6whZ-8

Em anos recentes, grandes quantidades de dados têm sido geradas e coletadas em várias áreas do conhecimento. Esses dados são provenientes de sensores, sinais de GPS, imagens de satélite e mídias sociais, entre muitos outros. Com esse aumento da quantidade de dados coletados, o desenvolvimento de novas estratégias estatísticas e computacionais para analisar esses dados num intervalo de tempo aceitável torna-se essencial. Nesta palestra irei abordar a diferença entre estatística e ciência de dados, e discutir a sua utilidade na era da internet of things e inteligência artificial.

11h20 Cerimônia de Encerramento. Encerramento
Local: https://www.youtube.com/channel/UChOqqlY5xbV8qP375PYaF_Q

Realização

Apoio

Organizador

VII Encontro Baiano de Estatística