Sessões Temáticas

Sessão Temática 1 - ST1 – Sessão Jovens Pesquisadores da RBras – 29/05 (15:00 – 16:30) – Sala 314

Organização: Jovens Pesquisadores da RBras – Viviane Costa Silva – Estudante de Pós-Graduação em Estatística e Experimentação Agropecuária, UFLA

Saúde mental dos estudantes de pós-graduação em ciências exatas: estamos atentos?

Palestrantes: Profª. Drª. Elisangela Aparecida da Silva Lizzi (UTFPR-CP) e Juliana Andre Rosano (Médica Psiquiatra – CRM 109207)

Resumo: O mundo vem presenciando um forte aumento da preocupação com a saúde mental e os seus impactos nos últimos anos, tendo em vista os números expressivos acerca de tal assunto. De acordo com a Organização Mundial da Saúde, atualmente o suicídio é a segunda maior causa de morte de pessoas entre 15 e 29 anos, sendo essa faixa etária a que apresenta a maior quantidade de pessoas dentro do ambiente acadêmico/universitário. O cenário fica ainda mais complexo quando cobranças (internas e externas) são realizadas sobre os estudantes, principalmente quando se trata da área da pesquisa, como por exemplo as vivenciadas pelos estudantes de Pós-Graduação. Tal grau de estudo requer uma forte entrega e comprometimento por parte dos alunos, e quando associados a fatores, muitas vezes fora do controle dos estudantes (orientações mal realizadas, competições no ambiente de trabalho, cobrança exacerbada por artigos, problemas pessoais etc.), tendem a guiá-los a um quadro de problemas em sua saúde mental. Diante disso, a sessão temática proposta pela JP-RBras procura trazer à luz o real cenário que os estudantes de Pós-Graduação, principalmente da área de ciências exatas, devido a alta complexidade do ramo, vivem no mundo atual e o que isso impacta não somente dentro do seu desempenho acadêmico, como também nos passos subsequentes, seja em sua carreira ou em sua vida pessoal, bem como formas de contornar ou enfrentar os gatilhos associados a este quadro.

Sessão Temática 2 - ST2 – Desafios dos Programas de Pós-Graduação em Estatística – 29/05 (15:00 – 16:30) – sala 311

Organizador: Alessandro Dal Col Lúcio – UFSM

Mediador: Hemílio Fernandes Campos Coelho – UFPB

Participantes: Nancy Lopes Garcia – UNICAMP (Coordenadora da área de Probabilidade e Estatística – CAPES), Luiz Alexandre Peternelli (UFV), Renata Alcarde Sermarini (ESALQ) e Tales Jesus Fernandes (UFLA)

Desafios dos Programas de Pós-Graduação em Estatística

Resumo: A Pós-graduação em Estatística Aplicada às ciências agrárias chega ao 60º aniversário no Brasil em 2024. Ao longo desses 60 anos houve uma notável transformação da sociedade, dos recursos tecnológicos e das competências profissionais que devem ser cumpridas pelos programas de pós-graduação com vistas à excelência. Sendo assim, é fundamental a reflexão e discussão do cenário atual e suas exigências, ainda mais frente a era da Ciência de Dados. O objetivo desta sesso temática é promover uma discussão epistemológica, curricular e prospectiva dos Programas nesta área.

Sessão Temática 3 - ST3 – Ciência de Dados – 29/05 (15:00 – 16:30) – Anfiteatro

Organizador: Rafael Moral (MU-Irlanda)

Mediadora: Daiane Aparecida Zuantti – UFSCar

The aim of this thematic session is to present recent developments and applications in the

field of Data Science.

Random Machines with probability outputs: an application to psychopathological

Palestrante: Anderson Ara – UFPR

Resumo: Supervised machine learning techniques have one of their main objectives to reduce the generalized prediction error and these methods can be applied to predict healthy conditions with several purposes. Support vector models (SVM) have been drawing the attention of the machine learning community because these models have properties which are easy to characterize and allow the estimation process with global optimization. However, SVM has challenges in choosing the appropriate kernel function, as well as the tuning process estimation of its hyperparameters. Random machines (Ara et al., 2022) is a recent machine learning method which eliminates the need to choose the best kernel function during the tuning process. In this section, we present a modification of the traditional Random Machines, namely Random Machines with probability outputs, an extension with high predictive performance compared with the traditional Random Machines and other classical machine learning methods. To predict the general psychopathological symptoms from the SIPS (Structured Interview for Prodromal Syndromes) on At Risk Mental State (ARMS), the usefulness of the Random Machines is illustrated. Random Machines with probability outputs showed a superior predictive capacity than traditional Random Machines and methods such as extreme gradient boosting, random forest, deep multilayer perceptron, support vector machine and logistic regression.

Machine learning and comorbidity network analysis for hospitalized patients with COVID-19 in a city in Southern Brazil

Palestrante: Rodrigo Pescim – UEL

Resumo: The large amount of data generated during the COVID-19 pandemic requires advanced tools for the long-term prediction of risk factors associated with COVID-19 mortality with higher accuracy. Machine learning (ML) methods directly address this topic and are essential tools to guide public health interventions. Here, we used ML to investigate the importance of demographic and clinical variables on COVID-19 mortality. We also analyzed how comorbidity networks are structured according to age groups. We conducted a retrospective study of COVID-19 mortality with hospitalized patients from Londrina, Paraná, Brazil, registered in the database for severe acute respiratory infections (SIVEP- Gripe), from January 2021 to February 2022. We tested four ML models to predict the COVID-19 outcome: Logistic Regression, Support Vector Machine, Random Forest, and XGBoost. We also constructed a comorbidity network to investigate the impact of co- occurring comorbidities on COVID-19 mortality. Our study comprised 8358 hospitalized patients, of whom 2792 (33.40%) died. The XGBoost model achieved excellent performance (ROC-AUC = 0.90). Both permutation method and SHAP values highlighted the importance of age, ventilatory support status, and intensive care unit admission as key features in predicting COVID-19 outcomes. The comorbidity networks for old, deceased patients are denser than those for young patients. In addition, the co-occurrence of heart disease and diabetes may be the most important combination to predict COVID-19 mortality, regardless of age and sex. This paper presents a valuable combination of machine learning and comorbidity network analysis to predict COVID-19 outcomes. Reliable evidence on this topic is crucial for guiding the post-pandemic response and assisting in COVID-19 care planning and provision.

Sessão Temática 4 – ST4 – Sessão Temática Embrapa – 30/05 (15:00 – 16:30) – Anfiteatro

Coordenador: Waldomiro Barioni Júnior – Pesquisador da Embrapa

A Embrapa e o 12º Censo Agropecuário do IBGE

Palestrante: Dr. Alfredo J. B. Luiz – Pesquisador da Embrapa

Resumo: Os dados do Censo Agropecuário são uma excelente fonte de dados, públicos e gratuitos, especialmente para a comunidade da Biometria. Para a Embrapa, fornece informações insubstituíveis, utilizadas por gestores e pesquisadores. Diante da expectativa por um novo censo em 2026, a complexidade envolvida na sua realização e alguns exemplos de utilização dos dados gerados no passado serão apresentados.

Tecnologias Digitais para coleta de Dados e Tomada de Decisão em sistemas agropecuários

Palestrantes: Dr. Alberto C. C. Bernardi – Pesquisador da Embrapa –Tecnologias digitais na Pecuária de Precisão

Dr. José Ricardo M. Pezzopane – Pesquisador da Embrapa – Pecuária de Precisão aplicada ao manejo de pastagem – Uso de Imagens aéreas de Drone

Dra. Teresa Cristina Alves – Pesquisadora da Embrapa – Pecuária de Precisão aplicada à produção de leite – Uso da ordenha robotizada

Resumo: A informatização no campo (OiT) propiciou a gerência otimizada no processo de coleta de dados de manejo e de experimentos de pesquisa realizados em um sistema de produção de animais, com o armazenamento e acesso ao banco de dados de animais de uma fazenda, universidade e centro de pesquisa. Com o avanço à adoção da identificação eletrônica de animais é possível interligar, via Bluetooth ou outras conexões, varias ferramentas práticas de manejo e pesquisa, com aplicação em Pecuária de Precisão como: pesagem eletrônica individual, medidor eletrônico da emissão de gás metano, consumo individual de ração e água bem como os dados do comportamento e o bem estar dos animais. As tecnologias digitais integradas ao conceito de Pecuária de Precisão auxiliam no trabalho de rotina de campo e principalmente na otimização e na confiabilidade dados coletados dos experimentos de pesquisa e principalmento na tomada de decisão.

“Homenagem ao Assistente Benedito Aparecido da Silva – EMBRAPA Pecuária Sudeste – São Carlos/SP”

Sessão Temática 5 – ST5 – Big Data: oportunidades e desafios em debate – 30/05 (15:00 – 16:30) – sala 311

Organizadora: Andrea Diniz da Silva (ENCE/IBGE)

Mediadoras: Vera Tomazella (UFSCar) e Agatha Sacramento Rodrigues (UFES)

Palestrantes:

Maria do Carmo Dias Bueno, Centro de Documentação e Disseminação de Informações (CDDI) do Instituto Brasileiro de Geografia e Estatística (IBGE)

Marcelo Pitta, Centro Regional de Estudos para o Desenvolvimento da

Sociedade da Informação (Cetic.br) do Núcleo de Informação e Coordenação do Ponto BR (NIC.br)

Augusto Fadel, Diretoria de Pesquisas (DPE) do Instituto Brasileiro de Geografia e Estatística (IBGE)

Resumo

Resumo: Big data vem sendo utilizado com sucesso na iniciativa privada. Nike, Danone, Maplink, Mc Donalds, Starbucks, Monsanto, Grupo Pão de Açúcar, Amazon e Netflix são apenas alguns exemplos de empresas que fazem análise de mercado e identificação do padrão de consumo com base em big data. Os produtores de estatísticas oficiais avançam no uso desse tipo de dado, buscando manter o seu compromisso com os Princípios Fundamentais das Estatísticas Oficiais. Ainda que o princípio “Eficiência” sugira o uso de diversos tipos de fontes de dados, o compromisso com o uso de padrões profissionais, com a ética, a responsabilidade, a transparência e a confidencialidade, previstos nos demais princípios, faz com que tal avanço seja mais parcimonioso. O Comitê de Especialistas em Big Data e Ciência de Dados para Estatísticas Oficiais da ONU registrou mais de uma centena de experiências no uso de big data na produção de estatística por organismos nacionais e internacionais. O Hub Regional da ONU para Big Data no Brasil identificou 15 institutos nacionais de estatística na América Latina e Caribe utilizando big data na produção estatística. Apesar de compor um cenário promissor, o uso de big data ainda apresenta muitos desafios. Falta de pessoal qualificado, de métodos consolidados e de infraestrutura tecnológica são os mais apontados por institutos nacionais de estatística. Na sessão, oportunidades e desafios do uso de big data serão discutidos, incluindo aspectos de amostragem e confidencialidade.

Sessão Temática 6 - ST6 – Dados longitudinais – 30/05 (15:00 – 16:30) - sala 314

Organizador: John Hinde (NUIG-Irlanda)

The aim of this thematic session is to present recent works and contributions to the longitudinal studies area.

Unit gamma regression models for correlated bounded data

Palestrante: João Victor de Freitas – UNICAMP

Resumo: Experiments with repeated measures are the ones where more than one observation per subject is available. To model of such experiments, dependency within subjects needs to be taken into consideration. In cases where the variable of interest is bounded in (a, b) with a < b known reals, there are few proposals to model correlated bounded data most part being based on Beta, Simplex and Unit gamma distributions. In particular, for marginal modeling of the mean and precision/dispersion, Simplex and Beta models based on Generalized Estimating Equations (GEE) are used. In this paper, to take account of possible within-subject dependence using the GEE approach, we proposed an Unit Gamma regression model used to modeling bounded data in a unit interval. In this paper, we developed residuals and influence diagnostic tools to the Simplex and Unit Gamma models for correlated bounded data. Furthermore, To assess the finite-sample performance of the proposed estimators, we conducted a Monte Carlo simulation study. The methodology is illustrated with the analysis of a real data set. An R package was developed for all the new methodology described in this paper. Paper in collaboration with Juvêncio Santos Nobre (DEMA-UFC), Patricia Espinheira (DE-UFBA) and Leandro Rego (DEMA-UFC).

Fractional polynomials in mixed models

Palestrante: Luzia Trinca – UNESP/Botucatu

Resumo: The class of regression models incorporating Fractional Polynomials (FPs), proposed by Royston and colleagues in the 1990s, has been extensively studied and shown to be fruitful under non-linearity between the response variable and continuous covariates. FP functions provide an alternative to higher-order polynomials and splines for dealing with lack of fit. Mixed models may also benefit from this class of curves in the presence of non-linearity. The use of FP functions in the structure of linear mixed-effects models has been previously explored, though for simple layouts, e.g. a single covariate in the random intercept model. We propose a general strategy for model-building and variable selection that takes advantage of the FPs within the framework of linear mixed models. For illustrations, we apply the method to a few data sets. Work in collaboration with: Edijane Paredes Garcia (UFAM, Manaus, AM) and Luzia Trinca (Unesp, Botucatu, SP).

Time series and multilevel modelling for longitudinal item response theory data

Palestrante: Caio Azevedo – UNICAMP

Resumo: In this work we consider some stationary and nonstationary time series and multilevel models to represent longitudinal Item Response Theory (IRT) data. We developed a Bayesian inference framework, which includes parameter estimation, model fit assessment and model comparison tools, through MCMC algorithms. Simulation studies are conducted in order to measure the parameter recovery. All computational implementations are made through the Stan program, using the rstan package, from the R program. A real data analysis, concerning the Amsterdam Growth and Health Longitudinal Study, is properly analyzed and useful conclusions are drawn from the obtained results.

*joint work with Jean-Paul Fox, University of Twente and Dalton F. Andrade, Universidade Federal de Santa Catarina

Sessão Temática 7 - ST7 – Sessão ABE (Associação Brasileira de Estatística) – 31/05 (08:00-09:00) - sala 311

Organizadora: Viviana Giampaoli (IME-USP)

Ser estatístico(a) na era da ciência de dados

Palestrantes: Doris S. M. Fontes – Conselho Regional de Estatística da 3ª Região (CONRE-3) e Eliani Mosquim – Especialista em Ciência de Dados – Ministério da Economia

Resumo: Com a evolução da tecnologia nos últimos anos, os estatísticos têm enfrentado o desafio de incorporar diversos conhecimentos da área de computação para se tornarem verdadeiros cientistas de dados. Nesta Sessão Temática, discutiremos as habilidades e competências essenciais que a formação de um estatístico deve oferecer. Além disso, abordaremos as exigências habituais impostas pelo mercado de trabalho e exploraremos como ocorre a transição entre os conhecimentos acadêmicos e a aplicação prática no dia a dia do exercício da função do estatístico.

Sessão Temática 8 – ST8 – Sessão “Brazilian Journal of Biometrics” – 31/05 (08:00-09:00) - Sala 314

Organizador: Tales Jesus Fernandes (UFLA)

Development of a social and professional stress scale for parents of children with autism spectrum disorder

Palestrante: Yasmin Roberta Fernandes

Resumo: Parents of children with Autism Spectrum Disorder (ASD) may experience increased stress in their social and professional activities due to the challenges of raising a child with ASD. The present study developed a scale to measure the Social and Professional Stress (SPS) experienced daily by these parents. The study sample consisted of 255 parents residing in Brazil aged between 21 and 61 years (mean = 38, SD = 6.0). Item Response Theory (IRT) was used to develop the SPS-Scale, which showed good psychometric properties. Our findings indicated a higher level of SPS among mothers who are primary caregivers and who have children with symptoms of ASD at medium or severe levels. The child’s age and the interviewee’s marital status also showed an association with the SPS experienced by the parents. Overall, the SPS-Scale proved to be a valid instrument to measure the SPS experienced daily by parents of children or adolescents diagnosed with ASD.

Robust local quantile regression for reference curves

Palestrante: Gianni Mara Silva dos Santos

Resumo: We propose two non-parametric methods to construct locally fitted quantile reference curves that are robust with respect to outliers in the predictor variable. The first includes a weighting procedure and the second, the detection and subsequent elimination of outlying predictor variable values before the local fitting process. The reference curves fitted by the proposed methods generate quantile limits that are less affected in regions with a low frequency of the predictor variable values. The proposed procedures are used to fit reference curves to data extracted from a study conducted at the Heart Institute of the University of São Paulo Medical School.