|
Dissertações |
|
|
1
|
-
HELENA SANTOS BRANDÃO
-
A Study of Non-Parametric Entropy Estimators for Analyzing Financial Data
-
Orientador : RAUL YUKIHIRO MATSUSHITA
-
MEMBROS DA BANCA :
-
RAUL YUKIHIRO MATSUSHITA
-
ANTONIO EDUARDO GOMES
-
EDUARDO YOSHIO NAKANO
-
ERALDO SERGIO BARBOSA DA SILVA
-
Data: 27/03/2024
-
-
Mostrar Resumo
-
Esta dissertação é composta por uma coletânea de quatro artigos que abordam a estimação da entropia diferencial com aplicações em dados financeiros. A obtenção de um estimador robusto e dotado de propriedades satisfatórias para tal medida mostra-se de suma importância para sua aplicação. Nesse contexto, os objetivos do presente estudo incluem realizar uma revisão abrangente dos estimadores de entropia diferencial não paramétricos e propor aprimoramentos na escolha e otimização de seu uso, visando encontrar um estimador mais adequado para dados financeiros, os quais frequentemente apresentam distribuições com caudas pesadas e mudanças de regimes.
-
Mostrar Abstract
-
In financial risk, the conventional approach has typically linked risk to the variance of a variable, such as the return of a stock or portfolio. By recognizing the constraints of this conventional method and the need for various risk metrics, alternative measures have been developed to address downside risk or extreme outcomes specifically. One such complementary metric is the uncertainty measure, which enables us to capture and describe different aspects of risk, going beyond traditional notions of variability alone. Obtaining a robust estimator with desirable properties for entropy is crucial for its practical application. In particular, our study aims to conduct a comprehensive review of non-parametric differential entropy estimators and then propose adjustments regarding the choice and optimization of their use to find an estimator with convenient properties for application in financial data, which are often characterized by distributions with heavy tails. We also conducted real-data applications to illustrate the use of the proposed measures.
|
|
|
2
|
-
Pedro Henrique Monteiro Moreira
-
Aplicação de Modelos de Regressão Logística Ordinal na Aferição do Tratamento com Plasma Convalescente para a COVID-19
-
Orientador : JOANLISE MARCO DE LEON ANDRADE
-
MEMBROS DA BANCA :
-
JOANLISE MARCO DE LEON ANDRADE
-
ANDRE LUIZ FERNANDES CANCADO
-
EDUARDO YOSHIO NAKANO
-
CARLA ALMEIDA VIVACQUA
-
Data: 24/05/2024
-
-
Mostrar Resumo
-
Objetivos: Avaliar a resposta ao tratamento da COVID-19 por meio do plasma convalescente monitorado utilizando modelos de regressão logística ordinal. Identificar se o desempenho do tratamento com plasma convalescente, no combate à COVID-19, depende mais de características do doador ou do receptor e identificar quais variáveis são as mais importantes. Métodos: Para avaliar o desempenho do tratamento com plasma convalescente foram utilizados modelos de regressão logística ordinal, incluindo modelos de chances proporcionais (MCP), modelo de chances proporcinais parciais (MCPP), modelo de razão contínua (MRC) e modelo estereótipo (ME) para verificar qual deles melhor descreve o banco de dados estudado. Resultados: O conjunto de dados envolveu 2.369 pacientes e foi dividido em 6 grupos menores de acordo com resultados preliminares de outros estudos. Em todos os grupos analisados houve significância, mas o ajuste não foi satisfatório. Conclusão: Não foi possível encontrar evidência estatística que comprovasse a eficácia do tratamento utilizando os modelos MCP, MCPP, MRC e ME. Todos os modelos classificaram, no mínimo, 98,7% dos casos na categoria de menor severidade, por estar em maior proporção na base, evidenciando um desequilíbrio considerável na distribuição das categorias. Considerando o conjunto de dados, as variáveis características do doador não se mostraram tão relevantes para os modelos quanto as variáveis do receptor do plasma. Neste cenário, mesmo sem um resultado preditivo satisfatório, algumas variáveis como “Grau de severidade ao ser hospitalizado” e “Score OMS ao ser hospitalizado” foram incluídas em praticamente todos os modelos. Com isso, futuras investigações podem considerar abordagens alternativas, explorando melhor tais variáveis ou a inclusão de variáveis adicionais para compreender melhor os fatores que influenciam os desfechos dos pacientes submetidos a este tipo de tratamento.
-
Mostrar Abstract
-
Objectives: To evaluate the response to COVID-19 treatment through monitored convalescent plasma using ordinal logistic regression models. To determine whether the effectiveness of convalescent plasma treatment in combating COVID-19 depends more on donor or recipient characteristics, and to identify the most important variables. Methods: To assess the performance of convalescent plasma treatment, ordinal logistic regression models were used, including proportional odds models (POM), partial proportional odds models (PPOM), continuation ratio models (CRM), and stereotype models (SM) to determine which best describes the studied dataset. Results: The dataset included 2,369 patients and was divided into 6 smaller groups according to preliminary results from other studies. In all the groups analyzed, there was significance, but the fit was not satisfactory. Conclusion: Statistical evidence to prove the effectiveness of the treatment using POM, PPOM, CRM, and SM was not found. All models classified at least 98.7% of cases in the lowest severity category, due to the higher proportion of this category in the database, highlighting a considerable imbalance in category distribution. Considering the dataset, donor characteristics were not as relevant to the models as recipient variables. In this scenario, even without satisfactory predictive results, some variables such as "Severity level upon hospitalization"and "WHO score upon hospitalization"were included in almost all models. Therefore, future investigations may consider alternative approaches to better explore these variables or include additional variables to better understand the factors influencing patient outcomes subjected to this type of treatment.
|
|
|
3
|
-
Yasmin Lírio Souza de Oliveira
-
"Distribuição Gumbel bivariada multimodal"
-
Orientador : CIRA ETHEOWALDA GUEVARA OTINIANO
-
MEMBROS DA BANCA :
-
CIRA ETHEOWALDA GUEVARA OTINIANO
-
FELIPE SOUSA QUINTINO
-
RAUL YUKIHIRO MATSUSHITA
-
VERONICA ANDREA GONZALEZ LOPEZ
-
Data: 29/05/2024
-
-
Mostrar Resumo
-
Distribuições bivariadas de valores extremos surgem como a distribuição limite de estatísticas extremais (máximo ou mínimo) normalizadas. Sua aplicabilidade é bem conhecida na modelagem de eventos extremos naturais. No entanto, a modelagem de eventos extremos bivariados que apresentam comportamento heterogêneo com mais de uma moda ainda é um desafio. Nessa dissertação, é proposta uma nova classe de distribuições bivariadas denominada distribuição Gumbel bivariada multimodal, cujas distribuições marginais são distribuições de valores extremos generalizadas bimodais. A flexibilidade da nova distribuição é ilustrada graficamente e algumas propriedades estatísticas são derivadas. A técnica de máxima verossimilhança é utilizada para estimar os parâmetros do modelo. Experimentos de Monte Carlo foram realizados para examinar, atavés do erro quadrático médio e erro padrão, o comportamento das estimativas de máxima verossimilhança. Finalmente, para ilustrar a aplicabilidade do nosso modelo, usamos conjuntos de dados climáticos de estações meteorológicas do Brasil e do canadá.
-
Mostrar Abstract
-
Bivariate extreme value distributions arise as the limiting distribution of normalized extreme statistics (maximum or minimum). Their applicability is well known in modeling natural extreme events. However, modeling bivariate extreme events that exhibit heterogeneous behavior with more than one mode is still a challenge. In this dissertation, a new class of bivariate distributions called multimodal bivariate Gumbel distribution is proposed, whose marginal distributions are bimodal generalized extreme value distributions. The flexibility of the new distribution is illustrated graphically and some statistical properties are derived. The maximum likelihood technique is used to estimate the parameters of the model. Monte Carlo experiments were conducted to examine the behavior of the maximum likelihood estimates through mean squared error and standard error. Finally, to illustrate the applicability of our model, we use climatic data sets from meteorological stations in Brazil and Canada.
|
|
|
4
|
-
LUCAS DE MORAES BASTOS
-
TRI Profundo: uma aplicação de métodos de redes neurais profundas à Teoria de Resposta ao Item
-
Orientador : GUILHERME SOUZA RODRIGUES
-
MEMBROS DA BANCA :
-
GUILHERME SOUZA RODRIGUES
-
ANTONIO EDUARDO GOMES
-
JOSE AUGUSTO FIORUCCI
-
DALTON FRANCISCO DE ANDRADE
-
Data: 12/06/2024
-
-
Mostrar Resumo
-
Este trabalho buscou um novo método para a estimação do nível de conhecimento de alunos, no contexto de TRI para estimação da habilidade latente, o que foi feito ao criar um modelo de redes neurais capaz de utilizar algoritmos de aprendizado de máquina a fim de estimar os parâmetros do ML3. Essa rede foi aplicada ao Exame Nacional do Ensino Médio (Enem), resultando em estimativas mais precisas do que alcançado por métodos tradicionais. Também faz parte do escopo deste trabalho a replicação dos métodos oficiais de correção e atribuição de notas aos alunos em uma linguagem aberta. O trabalho é introduzido por uma contextualização do que é o Exame Nacional do Ensino Médio, destacando sua relevância para a população e para a educação do país. Os métodos utilizados na correção desse exame são indicados, com observações acerca de suas limitações intrínsecas. Então, métodos de inteligência artificial são ilustrados, demonstrando sua abrangência e grande utilidade, e, em sequência, a utilização desses métodos em Teoria de Resposta ao Item, na área que está sendo denominada TRI Profunda, sendo este trabalho uma expansão dos modelos atualmente disponíveis e sua aplicação aos dados do Enem. Em seguida, a revisão de literatura busca cadenciar o surgimento da TRI Profunda, tratando inicialmente da própria TRI e de redes neurais profundas, para mostrar como o modelo tradicional de 3 parâmetros (ML3) pode ser escrito como uma rede neural. Então, é mostrado sucintamente o modelo de TRI Profunda de Tsutsumi et. al (2021) e o que seriam positional encoders, método utilizado mais à frente. Ainda como parte da revisão, são resumidas informações sobre o método de estimação utilizado pelo Inep e sobre as bases de dados disponibilizadas publicamente e que foram o escopo de análise deste trabalho. O Capítulo seguinte apresenta os dois métodos propostos para tratar dados binários originados de respostas de alunos a um teste: ML3 Raso (Shallow 3PL) e ML3 Profundo (Deep 3PL), buscando extender os modelos previamente revisados, especialmente no caso deste último, que se deriva mais diretamente do modelo de Tsutsumi et al. (2021). Os modelos utilizam estratégias diferentes para lidar com o grande volume de dados de entrada, um com camadas de embedding e o outro com positional encoders. A Aplicação inicialmente descreve os passos percorridos neste trabalho, desde o tratamento da base de dados, indicando os softwares e métodos utilizados. Então são apresentados os resultados, primeiramente comparando o alcançado pelo Inep utilizando o software proprietário BILOG e sua replicação no mirt, pacote de TRI disponível no R. Estes resultados são então comparados aos modelos propostos, destacando-se a performance do modelo ML3 Raso, mais preciso (com o menor EQM e perda) e maior verossimilhança das probabilidades de acerto estimadas às respostas empíricas. Os resultados alcançados em lingaguem aberta também indicam performance superior, apesar da falta de informações divulgadas sobre o método oficial de estimação. Por fim, esses resultados são sintetizados na Conclusão, com sugestões para trabalhos futuros, destacando-se a fixação dos parâmetros dos itens na estimação das habilidades dos alunos. Assim a estimação das notas poderá ser feita pelo algoritmo Adam, muito mais parcimonioso, em vez das aproximações e integrações (Quadratura Gaussiana) do algoritmo EM utilizado. Dessa forma, apresenta-se uma alternativa que poderia contribuir com o trabalho atualmente feito pelo Inep, tanto na questão da transparência do cálculo das notas dos alunos, como na simplicidade e maior confiabilidade da estimação conduzida pela rede neural.
-
Mostrar Abstract
-
This work aimed to provide a new method for the estimation of examinees’ abilities in the IRT context, which was done by designing a novel neural network capable of using machine learning algorithms to estimate the 3PL IRT model parameters. This network was applied to Brasil’s National High School Exam (Enem), yielding more accurate estimates than the traditional methods. It is also in the scope of this work to replicate the official methods used in the evaluation of students’ grades in an open software.
|
|
|
5
|
-
Joao Gabriel Rodrigues Reis
-
Otimização Bayesiana Multiobjetivo para Aperfeiçoar a Eficiência Computacional em Modelos de Redes Neurais.
-
Orientador : GUILHERME SOUZA RODRIGUES
-
MEMBROS DA BANCA :
-
ANDRE LUIZ FERNANDES CANCADO
-
ELIZABETH FIALHO WANNER
-
GUILHERME SOUZA RODRIGUES
-
JOSE AUGUSTO FIORUCCI
-
Data: 13/06/2024
-
-
Mostrar Resumo
-
Modelos de aprendizado de máquina, especialmente Redes Neurais Artificiais (RNAs), tornaram-se ferramentas indispensáveis em diversas áreas devido à sua capacidade de aprender com dados e fazer previsões ou tomar decisões. A grande flexibilidade dos modelos de RNA torna a escolha dos hiperpâmetros crucial para a obtenção do desempenho ideal. Entretanto, encontrar essa configuração pode ser uma tarefa desafiadora e computacionalmente intensiva.
O ajuste de hiperparâmetros (hyperparameter tuning) é crucial para otimizar o desempenho de modelos de aprendizado de máquina. Diversas técnicas são empregadas para essa finalidade, sendo a Otimização Bayesiana (BO) uma das mais prevalentes. Contudo, essa abordagem tradicionalmente foca na maximização da precisão dos modelos, o que frequentemente resulta em modelos desnecessariamente complexos. Esse processo muitas vezes ignora o princípio da parcimônia, também conhecido como a navalha de Occam, que sugere a preferência por soluções mais simples quando desempenhos similares são possíveis.
Na aplicação do princípio de parcimônia em modelos estatísticos clássicos, foram desenvolvidas várias métricas, como o AIC (Critério de Informação de Akaike) e o BIC (Critério de Informação Bayesiano). Essas métricas avaliam não apenas a precisão do modelo, mas também o número de parâmetros, buscando um equilíbrio entre complexidade e desempenho. No entanto, sua aplicabilidade é limitada em redes neurais artificiais (RNAs) devido à complexidade destes modelos. As RNAs frequentemente não possuem um conjunto único de pesos ótimos devido à sua alta capacidade de parametrização e às múltiplas soluções locais encontradas durante o treinamento. Essa característica torna desafiador determinar o número efetivo de parâmetros ou os graus de liberdade de uma RNA, o que é crucial para a aplicação do AIC e do BIC, comprometendo a validade dessas métricas para avaliar sua parcimônia. Uma abordagem adotada para contornar essa limitação foi utilizar o custo total de treinamento e avaliação da RNA como um indicativo de sua parcimônia, visando identificar o modelo mais eficiente, ou seja, que tenham alto poder preditivo sem comprometer excessivamente os recursos computacionais.
Normalmente os algoritmos de BO focam em um único objetivo (predições mais acuradas), o que pode resultar em soluções com alto consumo de recursos. Alternativamente, a Otimização Bayesiana Multi Objetivo (MOBO) é uma generalização do BO que lida com múltiplos objetivos conflitantes, permitindo uma tunagem de hiperparâmetros que equilibra a precisão do modelo e o custo computacional. Este estudo investiga a eficácia da MOBO na redução dos custos computacionais totais, mantendo ao mesmo tempo a alta acurácia dos modelos, através de simulações que comparam o desempenho da MOBO com métodos tradicionais de BO e busca aleatória.
A BO é uma técnica bastante popular para a tunagem de hiperparâmetros, pois é capaz de encontrar boas configurações com poucas avaliações da função objetivo. Isso é especialmente útil quando a avaliação da função é computacionalmente cara. A BO utiliza processos gaussianos para modelar a função objetivo, permitindo uma estimativa precisa das regiões promissoras no espaço de hiperparâmetros. Através do uso de funções de aquisição, a BO equilibra automaticamente a exploração de novas áreas do espaço de hiperparâmetros e a exploração de áreas já conhecidas que parecem promissoras. Isso ajuda a guiar a busca de maneira inteligente. Utilizando processos gaussianos e funções de aquisição adaptadas, a MOBO pode identificar soluções que oferecem um compromisso eficiente entre diferentes métricas de desempenho. Isso é particularmente vantajoso em cenários onde é necessário minimizar o consumo de recursos.
Utilizando o HPOBench, uma plataforma que proporciona uma ampla gama de benchmarks específicos para otimização de hiperparâmetros, este estudo avalia a eficácia da tunagem de hiperparâmetros ao considerar simultaneamente duas funções-objetivo: acurácia e custo. Por meio de simulações, o desempenho de diversas implementações MOBO, BO e métodos de busca aleatória foram comparados. Os resultados obtidos demonstraram que o MOBO foi capaz de gerar modelos significativamente mais eficientes, reduzindo bastante o custo computacional sem sacrificar a precisão.
-
Mostrar Abstract
-
The optimization of hyperparameters is a crucial step in enhancing the performance of machine learning models, particularly Artificial Neural Networks (ANNs). This dissertation explores the application of Multi-Objective Bayesian Optimization (MOBO) to improve computational efficiency in neural network predictions. Traditional Bayesian Optimization (BO) focuses on a single objective, often resulting in resource-intensive solutions. MOBO, however, addresses multiple conflicting objectives, allowing for a balanced trade-off between model accuracy and computational cost. In this study, we conducted simulations using a benchmark framework HPOBench (Schneider et al., 2021) to compare the performance of MOBO with traditional BO and random search algorithms. The results demonstrate that MOBO significantly reduces total computational cost while maintaining high model accuracy.
|
|
|
6
|
-
MELQUISADEC DE SOUZA OLIVEIRA
-
"Seleção de ativos financeiros com base na estimativa de probabilidades de stress-strength: o caso de retornos seguindo distribuições GEV e TGEV"
-
Orientador : PUSHPA NARAYAN RATHIE
-
MEMBROS DA BANCA :
-
PUSHPA NARAYAN RATHIE
-
ROBERTO VILA GABRIEL
-
TEREZINHA KESSIA DE ASSIS RIBEIRO
-
JOSE AILTON ALENCAR ANDRADE
-
Data: 22/07/2024
-
-
Mostrar Resumo
-
A análise do comportamento estatístico dos retornos dos ativos mostrou-se uma abordagem interessante para realizar a seleção de ativos. Neste trabalho, exploramos uma abordagem de confiabilidade stress-strength para realizar a seleção de ativos com base em probabilidades do tipo P (X < Y ) quando tanto X quanto Y seguem a distribuição dos valores extremos generalizada (GEV) ou a distribuição transmutada GEV (TGEV). Derivamos novas relações analíticas e de forma fechada em termos da função de valor extremo H, que foram obtidas sob mínimas restrições de parâmetros quando comparadas com resultados semelhantes na literatura. Para mostrar o desempenho de nossos resultados, incluímos estudos de simulações de Monte-Carlo e investigamos a aplicação da medida de confiabilidade P (X < Y ) na seleção de ativos financeiros com retornos caracterizados pelas distribuições X e Y . Assim, em vez de adotar a abordagem convencional de comparar os valores esperados de X e Y com base na teoria de portfólio moderna, exploramos a métrica P (X < Y ) como uma abordagem alternativa para avaliar retornos.
-
Mostrar Abstract
-
Analyzing the statistical behavior of the assets’ returns has shown to be an interesting approach to perform asset selection. In this work, we explore a stress-strength reliability approach to perform asset selection based on probabilities of the type P (X < Y ) when both X and Y follow a Generalized Extreme Value (GEV) or a Transmuted GEV (TGEV) distribution. We derive new analytical and closed form relations in terms of the extreme value H-function, which have been obtained under fewer parameter restrictions while compared to similar results in the literature. To show the performance of our results, we include a Monte-Carlo simulation study and we investigate the application of the reliability measure P (X < Y ) in selecting financial assets with returns characterized by the distributions X and Y . Thus, instead of adopting the conventional approach of comparing the expected values of X and Y based on modern portfolio theory, we explore the metric P (X < Y ) as an alternative approach for assessing returns.
|
|
|
7
|
-
REBECA KLAMERICK LIMA
-
Avaliando o impacto de medidas de confiabilidade do tipo stress-strength com marginais extremais: aplicações em dados financeiros e hidrológicos
-
Orientador : PUSHPA NARAYAN RATHIE
-
MEMBROS DA BANCA :
-
PUSHPA NARAYAN RATHIE
-
CIRA ETHEOWALDA GUEVARA OTINIANO
-
FREDERICO MACHADO ALMEIDA
-
JOSE AILTON ALENCAR ANDRADE
-
Data: 22/07/2024
-
-
Mostrar Resumo
-
Em estudos de confiabilidade, estamos interessados no comportamento de um sistema quando ele interage com seu ambiente circundante. Para avaliar o comportamento do sistema em termos de confiabilidade, podemos considerar a qualidade analisadas do sistema como sua resistência e o resultado das interações como tensão. A falha é observada sempre que a tensão excede a resistência. Tomando Y como uma variável aleatória que representa a tensão (stress) que o sistema experimenta e a variável aleatória X como sua resistência (strength), a probabilidade de não falha pode ser tomada como um indicador da confiabilidade do componente e expressa como P (Y < X) = 1 − P (X < Y ). Dessa forma, neste trabalho, consideramos que X e Y seguem distribuições generalizadas de valores extremos (GEV), que representam uma família de distribuições de probabilidade contínuas amplamente aplicadas em contextos de Engenharia e Economia. Nossa contribuição lida com um cenário mais geral em que tensão e resistência possuem dependência, e cópulas são usadas para modelar a dependência entre as variáveis aleatórias envolvidas. As cópulas de Gumbel-Hougaard, Frank e Clayton foram usadas para modelar conjuntos de dados bivariados. Em cada caso, critérios de informação foram considerados para comparar as capacidades de modelagem de cada cópula. Duas aplicações económicas em conjuntos de dados reais são discutidos, bem como uma aplicação em Engenharia. Outro tema abordada neste trabalho foi a confiabilidade em um sistema multicomponente. A confiabilidade pode ser estendida para um sistema multicomponente que consiste em k componentes de resistência com uma tensão comum, ou seja, Rs,k = P (pelo menos s das (X1, · · · , Xk) excedem Y ), sendo X1, X2, · · · , Xk variáveis aleatórias independentes e idênticamente distribuídas que representam a resistência de k componentes em um sistema e seguirem uma função de distribuição acumulada comum GX (·), onde cada componente está sujeito a uma tensão aleatória independente Y , com a FDP fY (·). Dessa forma foram consideradas as leis estáveis l-máximas e as leis p-max estáveis como as distribuição para a aplicação deste estudo. Uma aplicação em conjuntos de dados reais é discutida. No geral, é descrito um quadro metodológico fácil de usar, permitindo que os profissionais o apliquem em seus próprios projetos de pesquisa.
-
Mostrar Abstract
-
In reliability studies, we are interested in the behaviour of a system when it interacts with its surrounding environment. To assess the system’s behavior in a reliability sense, we can take the system’s intrinsic quality as strength, and the outcome of interactions as stress. Failure is observed whenever the stress exceeds the strength. Taking Y as a random variable representing the stress the system experiences and the random variable X as its strength, the probability of not failing can be taken as a proxy for the reliability of the component and given as P (Y < X) = 1−P (X < Y ). This way, in the present paper it is considered that X and Y follow generalized extreme value, distributions, which represent a family of continuous probability distributions that have been extensively applied in Engineering and Economy contexts. Our contribution deals with a more general situation when stress and strength are not independent, and copulas are used to model the dependence between the involved random variables. Gumbel-Hougaard, Frank and Clayton copulas were used for modelling bivariate data sets. In each case, information criteria were considered to compare the modelling capabilities of each copula. Two economic applications on real data sets are discussed, as well as an Engineering one. Another topic addressed in this work was reliability in a multicomponent system. Reliability can be extended to a multicomponent system consisting of k resistance components with a common voltage, i.e. Rs,k = P (at least s of (X1, · · · , Xk) exceed Y ), with X1, X2, · · · , Xk independent and identically distributed random variables that represent the resistance of k components in a system and follow a common cumulative distribution function GX (·), where each component is subject to an independent random voltage Y , with the PDF fY (·). Thus, the l-maximum stable laws and the stable p-max laws were considered as the distributions for the application of this study. An application to real data sets is discussed. Overall, an easy-to-use methodological framework is described, allowing practitioners to apply it to their own research projects.
|
|
|
8
|
-
Mariana Fehr Nicácio
-
"Estatística de varredura espacial aplicada às ocorrências aeronáuticas na Aviação Civil no Território Nacional"
-
Orientador : ANDRE LUIZ FERNANDES CANCADO
-
MEMBROS DA BANCA :
-
ANDRE LUIZ FERNANDES CANCADO
-
ANTONIO EDUARDO GOMES
-
THAIS CARVALHO VALADARES RODRIGUES
-
FERNANDO LUIZ PEREIRA DE OLIVEIRA
-
Data: 28/08/2024
-
-
Mostrar Resumo
-
Utilizando os dados de ocorrências aeronáuticas da Aviação Civil no Brasil nos anos de 2013 a 2022, o trabalho aplica a estatística de varredura espacial (estatística Scan), proposta por Kulldorff (1997), para identificar clusters significativos dessas ocorrências. A análise envolve a construção de matrizes de distâncias entre cidades e a definição de zonas candidatas a clusters, utilizando janelas circulares através da ferramenta SatScan. Foram aplicados os modelos binomial, multinomial e ordinal, e por meio de simulações de Monte Carlo foram obtidos os p-valores, permitindo a avaliação da significância dos clusters detectados por cada modelo. Os resultados de cada modelo foram comparados, destacando a localização e a extensão dos clusters de acidentes, incidentes graves e incidentes, proporcionando insights valiosos para a prevenção e a investigação de acidentes aeronáuticos. Os resultados mostraram que o modelo binomial, que é o mais amplamente utilizado, nem sempre é o mais adequado para dados com mais de duas categorias.
-
Mostrar Abstract
-
Using aviation occurrence data from Civil Aviation in Brazil from 2013 to 2022, this study applies spatial scan statistics, proposed by Kulldorff (1997), to identify significant clusters of these occurrences. The analysis involves constructing distance matrices between cities and defining candidate cluster zones using circular windows through the SatScan tool. Binomial, multinomial, and ordinal models were applied, and Monte Carlo simulations were used to obtain p-values, allowing for the assessment of the significance of the clusters detected by each model. The results of each model were compared, highlighting the location and extent of clusters of accidents, serious incidents, and incidents, providing valuable insights for the prevention and investigation of aviation accidents. The findings showed that the binomial model, while the most widely used, is not always the most suitable for data with more than two categories.
|
|
|
9
|
-
William Edward Rappel de Amorim
-
REDES NEURAIS QUANTÍLICAS DE GRAFOS COM CODIFICADOR POSICIONAL PARA DADOS GEOGRÁFICOS
-
Orientador : GUILHERME SOUZA RODRIGUES
-
MEMBROS DA BANCA :
-
GUILHERME SOUZA RODRIGUES
-
JOSE AUGUSTO FIORUCCI
-
RAUL YUKIHIRO MATSUSHITA
-
FABRICIO AGUIAR SILVA
-
Data: 29/08/2024
-
-
Mostrar Resumo
-
Este trabalho propõe uma nova arquitetura chamada Redes Neurais Quantílicas de Grafos com Codificador Posicional para Dados Geográficos (PE-GQNN). Ela foi criada para melhorar a previsão espacial, integrando Redes Neurais de Grafos (GNNs) com Codificação Posicional (PE) e regressão quantílica. A PE-GQNN é projetada para superar as limitações dos modelos tradicionais, ao incorporar o contexto espacial e capturar uma ampla gama de quantis condicionais, permitindo a modelagem de incertezas de maneira mais precisa.
Os dados geoespaciais, ou dados espaciais, contêm informações que incluem um ou mais atributos relacionados às coordenadas geográficas dos dados, geralmente definidas por latitude e longitude. Estes dados são amplamente utilizados em várias áreas, como economia, meteorologia, transporte urbano, redes sociais, plataformas de comércio eletrônico, entre outras. Um aspecto importante dos dados espaciais é a autocorrelação espacial, que se refere ao fenômeno em que pontos de dados espaciais não são estatisticamente independentes, mas sim correlacionados, especialmente em locais próximos.
Modelos de regressão espacial tradicionais utilizam matrizes de pesos espaciais ou termos de defasagem espacial para capturar a estrutura espacial nos dados. No entanto, esses modelos frequentemente não conseguem modelar relações complexas entre as variáveis preditoras e a variável de interesse. Por outro lado, os Processos Gaussianos (GPs), que assumem uma distribuição preditiva Gaussiana, apresentam alta flexibilidade e podem capturar relações complexas, mas enfrentam desafios significativos de escalabilidade e complexidade computacional, especialmente para conjuntos de dados grandes.
As GNNs surgiram recentemente como uma solução poderosa e escalável para aplicar redes neurais a dados estruturados em grafos. A abordagem tradicional de GNNs para dados espaciais consiste em representar os dados como um grafo, permitindo que as GNNs sejam aplicadas para aprendizado de representações e inferência. No entanto, a eficácia desta abordagem depende fortemente de como os dados espaciais são representados no grafo, e a aplicação tradicional de GNNs a dados espaciais pode não modelar efetivamente relações espaciais complexas.
Para melhorar o desempenho preditivo, foi proposta a Rede Neural de Grafos com Codificador Posicional (PE-GNN), uma abordagem modular e flexível projetada para aplicação a dados espaciais. A PE-GNN constrói o grafo usando distâncias calculadas a partir das coordenadas geográficas e incorpora um Codificador Posicional (PE) para assimilar o contexto espacial de cada par de coordenadas. A saída do PE resulta em um embedding espacial que é concatenado com as variáveis explicativas dos nós antes da aplicação do operador GNN, que produz uma previsão pontual para a variável alvo. Entretanto, a PE-GNN está limitada a fornecer apenas previsões pontuais e não foi projetada para oferecer uma descrição probabilística completa da distribuição condicional da variável alvo. Para superar essa limitação, este trabalho propõe a PE-GQNN, que combina a abordagem PE-GNN com inovações que permitem a quantificação de incerteza ao realizar previsões, oferecendo uma descrição completa da distribuição preditiva condicional.
A PE-GQNN inclui três inovações principais: (1) uma nova arquitetura que funde o procedimento em dois passos proposto por Kuleshov and Deshpande (2022) em um único modelo intrinsecamente calibrado, adiando a concatenação do quantil τ proposto por Si, Kuleshov, and Bishop (2022); (2) uma alteração estrutural que aplica o operador GNN apenas às características dos nós, que são então concatenadas com o embedding espacial; e (3) a introdução da média da variável alvo dos vizinhos do nó no grafo como uma característica adicional em uma camada próxima ao output. A PE-GQNN foi testada em três conjuntos de dados reais contendo dados espaciais. Para o conjunto de dados da Califórnia, a PE-GQNN atingiu desempenho de estado da arte, com melhorias relevantes em relação a GNN tradicional e PE-GNN. Ao compará-la com o modelo Processo Neural Condicional com Multi-Atenção Espacial (SMACNP), proposto por Bao, Zhang, and Zhang (2024), a PE-GQNN consistentemente apresentou desempenho preditivo superior com uma grande vantagem: melhor quantificação de incerteza. Utilizando esse mesmo conjunto de dados, as contribuições de cada inovação são reveladas ao realizar uma análise aprofundada dos resultados. A inovação τ , que corresponde à aplicação do framework de regressão quantílica proposto por Si, Kuleshov, and Bishop (2022), realizou um efeito de regularização e melhorou notavelmente a calibração das previsões de quantis, reduzindo o MPE e o MADECP. A inovação estrutural, que envolve a aplicação do operador GNN apenas nas características, é fundamental para melhorar o desempenho das previsões e melhorar a calibração, conforme evidenciado pela redução do MSE, MAE, MPE e MADECP. Além disso, o uso da média dos alvos dos vizinhos de treinamento como uma característica introduzida em uma das últimas camadas da rede, inspirada no método KNN, também melhorou ainda mais o modelo em termos de desempenho preditivo e calibração, apresentando uma redução substancial de MSE, MAE, MPE e MADECP. Além disso, foi verificado empiricamente que as predições da PE-GQNN não apresentaram casos de cruzamento de quantis. Os resultados experimentais para os outros dois conjuntos de dados demonstraram que a PE-GQNN consistentemente supera a GNN tradicional e a PE-GNN em todas as arquiteturas de GNN. Em cada conjunto de dados, as inovações da PE-GQNN levam a reduções significativas em MSE, MAE e MPE. Por outro lado, para o conjunto de dados Air Temperature, o SMACNP alcança o menor MSE e MAE, mas sofre com previsões significativamente descalibradas, refletidas por um MPE e MADECP muito mais altos em comparação com a PE-GQNN.
Em resumo, a PE-GQNN representa um avanço significativo na modelagem de dados espaciais, combinando a flexibilidade das GNNs com a capacidade de quantificar incerteza através da regressão quantílica, oferecendo maior capacidade preditiva e uma descrição probabilística completa da distribuição condicional da variável de interesse.
-
Mostrar Abstract
-
Positional Encoder Graph Neural Networks (PE-GNNs) are a leading approach for modeling continuous spatial data. However, they often fail to produce calibrated predictive distributions, limiting their effectiveness for uncertainty quantification. We introduce the Positional Encoder Graph Quantile Neural Network (PE-GQNN), a novel method that integrates PE-GNNs, Quantile Neural Networks, and recalibration techniques in a fully nonparametric framework, requiring minimal assumptions about the predictive distributions. We propose a new network architecture that, when combined with a quantile-based loss function, yields accurate and reliable probabilistic models without increasing computational complexity. Our approach provides a flexible, robust framework for conditional density estimation, applicable beyond spatial data contexts. We further introduce a structured method for incorporating a KNN predictor into the model while avoiding data leakage through the GNN layer operation. Experiments on benchmark datasets demonstrate that PE-GQNN significantly outperforms existing state-of-the-art methods in both predictive accuracy and uncertainty quantification.
|
|
|
10
|
-
TIAGO CHANDIONA ERNESTO FRANQUE
-
"Modelo de regressão log de sobrevivências proporcionais para dados discretos com presença de censura"
-
Orientador : EDUARDO YOSHIO NAKANO
-
MEMBROS DA BANCA :
-
EDUARDO YOSHIO NAKANO
-
FREDERICO MACHADO ALMEIDA
-
HELTON SAULO BEZERRA DOS SANTOS
-
AGATHA SACRAMENTO RODRIGUES
-
Data: 30/08/2024
-
-
Mostrar Resumo
-
Um dos modelos de regressão mais populares na análise de dados de sobrevivência é o modelo de riscos proporcionais de Cox, cuja principal característica é considerar que as covariáveis atuem multiplicativamente na função de risco. No entanto, essa característica não pode ser satisfeita quando os tempos de sobrevivência são discretos, devido ao fato da função de risco ser limitada no intervalo (0,1). Neste contexto, este trabalho apresenta o desenvolvimento do modelo log de sobrevivências proporcionais para dados de sobrevivência discretos. Inferências dos parâmetros do modelo foram formuladas considerando dados com censura à direita e a distribuição Weibull discreta como distribuição basal dos dados. Estudos de simulação foram realizados para verificar as propriedades assintóticas dos estimadores. Ademais, procedimentos para a verificação da suposição de proporcionalidade do logaritmo da função de sobrevivência foram propostos e o modelo foi ilustrado por meio de um conjunto de dados sobre o tempo de sobrevivência de pacientes com leucemia.
-
Mostrar Abstract
-
One of the most popular regression models in survival data analysis is the Cox proportional hazards model, which considers that the covariates act multiplicatively on the risk function. However, this characteristic cannot be satisfied when survival times are discrete, due to the fact that the hazard function is limited in the interval (0,1). In this context, this work presents the development of the proportional log survival model for discrete time-to-event data. Inferences of the models parameters were formulated considering the presence of right censoring and the discrete Weibull baseline distribution. Simulation studies were carried out to check the asymptotic properties of the estimators. In addition, procedures for checking the proportional log survival assumption were proposed, and the proposed model was illustrated using a dataset on the survival time of patients with leukemia.
|
|
|
11
|
-
Vívia de Alencar Seabra
-
Melhorando a Acurácia por meio de um Ensemble Eficiente de Redes Neurais em Grafos com Codificadores Posicionais Ajustados Geograficamente
-
Orientador : GUILHERME SOUZA RODRIGUES
-
MEMBROS DA BANCA :
-
GUILHERME SOUZA RODRIGUES
-
ALAN RICARDO DA SILVA
-
JOSE AUGUSTO FIORUCCI
-
FABRICIO AGUIAR SILVA
-
Data: 05/09/2024
-
-
Mostrar Resumo
-
A presente pesquisa investiga uma nova abordagem para melhorar a precisão preditiva e a capacidade de generalização de redes neurais em grafos (Graph Neural Networks - GNNs) aplicadas a dados espaciais. Dados espaciais oferecem insights valiosos sobre fenômenos geográficos e relações espaciais, apresentando desafios únicos que requerem metodologias analíticas dedicadas. Características como autocorrelação espacial, heterogeneidade espacial e nãoestacionaridade espacial dificultam a aplicação de técnicas convencionais de aprendizado de máquina, que geralmente assumem a independência dos pontos de dados ou relações lineares. Baseados no algoritmo estado da arte para regressão em dados espaciais proposto por (Klemmer, Safir, and Neill, 2023), as inovações propostas nesta pesquisa são as seguintes: primeiramente, introduzimos uma Função de Perda Ponderada, que implementa um mecanismo de ponderação na função de perda, permitindo que o modelo priorize o aprendizado de pontos de dados com base em sua proximidade espacial. Em segundo lugar, é proposto a Escolha Eficiente de Modelos Localizados, onde, baseados em mecanismos de clusterização, modelos locais são criados reduzindo o número de modelos necessários e aumentando a eficiência computacional. Em terceiro, é utilizado um Ensemble de Modelos Locais, combinando previsões dos múltiplos modelos localizados para suavizar erros e reduzir o impacto de imprecisões de qualquer modelo individual. Quarto, a Utilização de Pesos Pré-Treinados inicializa modelos locais com pesos de um modelo global previamente treinado, melhorando a eficiência do treinamento e fornecendo uma base robusta. Por fim, introduzimos uma Matriz de Distância com Redução Dimensional, que usa distâncias entre clusters em vez de entre todos os pontos, simplificando a carga computacional. Para avaliar a eficácia da abordagem proposta, utilizamos dois conjuntos de dados reais que contêm informações geográficas. O primeiro é o California Housing, que inclui preços de mais de 20.000 casas na Califórnia, coletados a partir do censo dos EUA de 1990 e com objetivo de previsão dos preços das casas com base em características como idade da casa e número de quartos, além de suas localizações geográficas. O segundo conjunto de dados é o Air Temperature, que contém coordenadas de 3.000 estações meteorológicas ao redor do mundo. Neste caso, a tarefa de regressão é prever as temperaturas médias a partir da precipitação média e da localização das estações. A função de perda ponderada, que prioriza o aprendizado a partir de pontos de dados com base em sua proximidade espacial, mostrou-se eficaz em melhorar a sensibilidade às variações locais, aumentando significativamente o desempenho do modelo para o conjunto de dados Air temperature. Além disso, a análise de sensibilidade revelou que aumentar o número de clusters ou a largura de banda geralmente melhora a precisão do modelo, mas até certo ponto, após o qual as melhorias se estabilizam ou diminuem. Esses achados indicam que a simples elevação desses parâmetros sem considerar suas interações pode resultar em resultados subótimos, destacando a necessidade de métodos mais sofisticados para a seleção desses valores.
-
Mostrar Abstract
-
Spatial data analysis presents unique challenges due to the inherent properties of spatial autocorrelation, heterogeneity, and non-stationarity. Traditional approaches often struggle with these complexities, leading to models that either underfit or misinterpret spatial dynamics. This work introduces an innovative approach to enhance the predictive power and generalizability of spatial data models by integrating localized modeling techniques with the advanced capabilities of Graph Neural Networks (GNNs). Our method incorporates the clustering of geographical coordinates to train localized models effectively. This approach leverages the strength of GNNs to capture and utilize complex spatial relationships. By segmenting the data into clusters, we create localized models that learn from specific spatial contexts, aiming to improve model accuracy and performance. We introduce a novel weighted loss function that prioritizes geographical proximity between clusters. Additionally, we employ pre-trained weights from a global model to initialize these localized models, which speeds up the training process and gives the models a comprehensive understanding of spatial relationships before adjusting them to fit specific local data. This work contributes to the field of spatial data analysis by providing a scalable, efficient, and effective framework for modeling complex spatial relationships.
|
|
|
12
|
-
LEONARDO SANTOS DA CRUZ
-
Multivariate asymmetric distributions on the unit hypercube: Properties and applications
-
Orientador : ROBERTO VILA GABRIEL
-
MEMBROS DA BANCA :
-
ROBERTO VILA GABRIEL
-
EDUARDO YOSHIO NAKANO
-
JOSE AUGUSTO FIORUCCI
-
CAROLINA MARCHANT
-
Data: 09/09/2024
-
-
Mostrar Resumo
-
A simetria é crucial na modelagem de dados, pois muitas técnicas estatísticas, como testes de hipóteses e intervalos de confiança, assumem a normalidade ou simetria dos dados. Distribuições simétricas simplificam a análise e a interpretação. Em contextos multivariados, asimetria é avaliada através de momentos de ordem superior, matrizes de covariância e funções de densidade de probabilidade, por exemplo. No contexto multivariado, onde a simetria está presente, algumas distribuições podem ser utilizadas para modelar os dados, como, por exemplo, distribuições esféricas e distribuições elípticas, ambas multivariadas. Porém, quando os dados apresentam algum grau de assimetria, que pode ser observado através de uma representação gráfica, por exemplo, funções classificadas de acordo com essas denominações podem não modelar de forma otimizada o conjunto de dados em estudo. Portanto, alguns erros podem ocorrer na análise decorrente do ajuste dessas distribuições. Em geral, a assimetria está frequentemente presente em contextos multivariados, mas mode- lar dados multivariados que apresentam assimetria não é uma tarefa trivial. Para lidar com essas características, métodos específicos foram desenvolvidos. Alguns destes métodos baseiam-se em abordagens originalmente criadas para dados simétricos, generalizando assim modelos pro- postos anteriormente. Esses modelos são conhecidos por incorporarem certo grau de assimetria em modelos simétricos, o que facilita a descrição e ajuste de dados que possuem essa carac- terística.
O primeiro capítulo do presente trabalho apresentará ferramentas básicas e consecutivamente mais sofisticadas relacionadas à modelagem de dados multivariados, com e sem simetria. Serão definidas distribuições mais complexas, como a distribuição elíptica, e serão apresentados exemplos e resultados importantes relacionados a essas distribuições. Por fim, são discutidas distribuições que generalizam distribuições elípticas, incorporando a propriedade de modelar dados assimétricos. Estas distribuições assimétricas serão definidas e alguns exemplos serão apresentados. No capítulo seguinte, uma nova família de distribuições assimétricas é apresentada. Inicialmente é apresentado o modelo do qual deriva esta família de distribuições. Este modelo consiste em uma relação condicional entre variáveis aleatórias, onde são incorporados parâmetros de locação, escala, assimetria e um parâmetro adicional que pode ser utilizado para refinar o ajuste do modelo ao conjunto de dados. Nessa fase do trabalho são discutidos aspectos importantes, como a definição da função densidade de probabilidade que pode ser derivada do modelo apresentado. Também são discutidas as possíveis configurações dessas funções, destacando como elas podem, dependendo dos intervalos, assumir a forma de uma função de densidade de probabilidade já conhecida, destacando o caráter generalista do modelo. Serão exploradas outras propriedades, incluindo os critérios de escolha das funções a utilizar no modelo, alguns casos especiais da função densidade de probabilidade, a sua representação gráfica, a não identificabilidade do modelo, em determinadas condições; os quantis marginais, entre outras características relevantes. Além disso, são apresentadas justificativas matemáticas para alguns fatos discutidos ao longo do texto. Por fim, é apresentada a função de máxima verossimilhança, com a caracterização explícita desta função e suas respectivas derivadas parciais, destacando a impossibilidade de descrever explicitamente os estimadores dos parâmetros em termos de expressões analíticas. Como consequência direta, as estimativas dos parâmetros precisarão ser obtidas utilizando métodos computacionais, que serão discutidos e detalhados no capítulo seguinte. Na parte final do presente trabalho, são empregados estudos de simulação, bem como a aplicação de duas famílias de distribuições apresentadas no capítulo 3 em dados reais. O estudo de simulação foi realizado com versões da função de densidade de probabilidade representando a distribuição dos dados do modelo. A estimativa de máxima verossimilhança foi utilizada em conjunto com o algoritmo de Monte Carlo. As análises utilizadas para avaliar as estimativas dos parâmetros foram o viés relativo e o erro quadrático médio. Para melhor ilustrar os resultados, são apresentados gráficos que mostram o comportamento dessas duas métricas para cada um dos parâmetros. Além disso, diversas funções foram empregadas para realizar o estudo de simulação. Uma pequena seleção representativa dessas funções é apresentada no corpo principal do texto, enquanto as demais podem ser encontradas no apêndice deste trabalho.
A aplicação aos dados reais foi realizada com um conjunto de dados reais do software R. A estatística descritiva dos dados foi apresentada e comentada. Duas funções de densidade derivadas do modelo foram então ajustadas e o ajuste é avaliado usando algumas métricas, que são brevemente apresentadas e discutidas. Após a discussão dos dados, indica-se qual distribuição melhor se ajusta ao conjunto de dados com base nos critérios considerados e nas funções G escolhidas para o modelo. Por fim, são apresentadas conclusões quanto à aplicação dos dados e à estimação dos parâmetros dentro de uma perspectiva geral do trabalho desenvolvido.
-
Mostrar Abstract
-
In this work, a family of multivariate asymmetric distributions over the unitary hypercube defined in terms of well-known symmetric elliptical distributions is proposed. Here we seek to study fundamental properties, such as the characterization of the density function for some types of distributions, as well as other properties, such as loss of identifiability, quantiles, conditional and marginal distributions, and moments. Furthermore, simulation studies were carried out to verify the asymptotic behavior of the estimated parameter values as the sample size increased. Finally, the developed model was used on real data where, using convenient metrics, the degree of quality of the model’s adjustment to real data was verified.
|
|
|
13
|
-
ESTEVAO SERGIO ZECO
-
Regressão Quantílica Multitarefa via Redes Neurais Profundas
-
Orientador : THAIS CARVALHO VALADARES RODRIGUES
-
MEMBROS DA BANCA :
-
THAIS CARVALHO VALADARES RODRIGUES
-
JOSE AUGUSTO FIORUCCI
-
RAUL YUKIHIRO MATSUSHITA
-
ANA CAROLINA CAMPANA NASCIMENTO
-
Data: 26/09/2024
-
-
Mostrar Resumo
-
A regressão quantílica via redes neurais tem se consolidado como uma abordagem poderosa para modelar relações não lineares entre variáveis, permitindo a estimação individual de quantis condicionais. No entanto, essa técnica enfrenta desafios quando é necessário estimar múltiplos quantis simultaneamente. Neste trabalho, propomos uma nova arquitetura para Regressão Quantílica Multitarefa via Redes Neurais Profundas, visando aprimorar tanto a precisão quanto a eficiência computacional na estimação de quantis. Baseada na arquitetura de Kuleshov e Deshpande (2022), essa nova arquitetura, denominada RQRN1E, inova ao unificar dois estágios da arquitetura original em um único estágio e ao introduzir o logito do τ diretamente na penúltima camada intermediária da rede. Nos três conjuntos de dados avaliados, os resultados evidenciaram que o modelo RQRN1E superou os modelos concorrentes, apresentando consistentemente a menor perda quantílica e a melhor cobertura para os quantis, o que reflete uma melhor precisão e calibração na estimativa dos quantis. Além disso, o RQRN1E destacou-se pela eficiência computacional, com menor tempo de processamento e rápida convergência, sem comprometer a qualidade das previsões.
-
Mostrar Abstract
-
Quantile regression via neural networks has emerged as a powerful approach for modeling nonlinear relationships between variables, allowing for the individual estimation of conditional quantiles. However, this technique faces challenges when estimating multiple quantiles simultaneously. In this work, we propose a new architecture for Multitask Quantile Regression via Deep Neural Networks, aiming to improve both accuracy and computational efficiency in quantile estimation. Based on the architecture of Kuleshov e Deshpande (2022), this new ar-chitecture, called RQRN1E, introduces innovations by unifying the two stages of the original architecture into a single stage and incorporating the logit of τ directly into the penultimate intermediate layer of the network. In the three datasets evaluated, the results showed that the RQRN1E model outperformed competing models, consistently achieving the lowest quantile loss and the best coverage for the quantiles, reflecting better accuracy and calibration in quantile estimation. Furthermore, RQRN1E excelled in computational efficiency, with reduced processing time and faster convergence, without compromising prediction quality.
|
|
|
14
|
-
JOAO VICTOR MONTEIROS DE ANDRADE
-
Family of multivariate distributions for modeling data with positive support: Properties and applications
-
Orientador : ROBERTO VILA GABRIEL
-
MEMBROS DA BANCA :
-
ROBERTO VILA GABRIEL
-
JOSE AUGUSTO FIORUCCI
-
RAUL YUKIHIRO MATSUSHITA
-
JUVÊNCIO SANTOS NOBRE
-
Data: 04/10/2024
-
-
Mostrar Resumo
-
Este trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados.
A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas.
Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados.
A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados.
No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α px/β − pβ/x, Gi(x) = log(x), Gi(x) = cosh−1(x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq(x) estão detalhados no Apêndice.
Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizando-se uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de Kolmogorov-Smirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada.
Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.
-
Mostrar Abstract
-
This work proposes the development of a new family of multivariate truncated elliptical distributions, aiming to expand the possibilities of statistical modeling for multivariate data with specific characteristics, such as heavy tails and asymmetry. The distributions used as a basis for the construction of the new densities are Cauchy, t-Student and Normal, which allow capturing different behaviors and dependence structures between variables. The construction of these new distributions will be performed by applying monotonic increasing, invertible and differentiable functions, defined in the domain of positive real numbers. These characteristics ensure that the resulting density has support in positive real numbers. This new class of distributions offers greater flexibility to model complex behaviors of multivariate data, preserving fundamental characteristics of elliptical distributions, such as the shape of the tails, while incorporating distortions that adjust the density function to the particularities of the studied phenomenon. This development opens new perspectives for statistical analysis, providing more robust models that are appropriate to the reality of the data. A Monte Carlo simulation study will also be carried out and applied to real data from the AIS (Australian Institute of Sport) and information on the 50 states of the United States (life expectancy and homicide rate).
|
|
|
15
|
-
MOISÉS LIMA
-
"Desenvolvimento e Aplicações do Processo Estocástico de Touchard para Contagens não-Poisson"
-
Orientador : RAUL YUKIHIRO MATSUSHITA
-
MEMBROS DA BANCA :
-
RAUL YUKIHIRO MATSUSHITA
-
GLADSTON LUIZ DA SILVA
-
ROBERTO VILA GABRIEL
-
REGINA CÉLIA BUENO DA FONSECA
-
Data: 18/10/2024
-
-
Mostrar Resumo
-
Apresentamos o processo estocástico de Touchard como um novo processo estocástico pontual pertencente à classe dos modelos de Poisson ponderados. Ele é obtido por meio da modificação das premissas do processo de Poisson tradicional, produzindo um sistema de diferença de equações diferencial, cuja solução está relacionada com os polinómios de Touchard. Entre as suas propriedades, o nosso modelo sugerido é um modelo flexível que pode ter em conta tanto a subdispersão ou superdispersão ou caudas pesadas e concentração de zeros que são frequentemente encontrados em dados não-Poisson. No entanto, ao contrário dos modelos estocásticos tradicionais, o processo de Touchard é gerado por incrementos não estacionários e dependentes, cujas probabilidades podem ser determinadas recursivamente. Além das suas propriedades, desenvolvemos um algoritmo de simulação para geração de contagens Touchard. Sua aplicabilidade é exemplificada através de dados de acidentes de trânsito nos condados de Queens e Kings do Estado de New York (EUA), sugerindo que o processo de Touchard seja um modelo candidato competitivo para o ajuste de contagens não-Poisson.
-
Mostrar Abstract
-
We introduce the Touchard stochastic process as a new point stochastic process belonging to the class of weighted Poisson models. It is derived by changing the assumptions of the classical Poisson process, producing a system of difference differential equations whose solution is related to Touchard polynomials. Among its properties, our suggested model is flexible and can describe underdispersion, overdispersion, heavy tails, or concentration of zeros often found in non-Poisson data. However, unlike traditional stochastic models, the Touchard process is generated by non-stationary and dependent increments, whose probabilities can be obtained recursively. In addition to discussing its properties, we developed an algorithm for simulating Touchard counts. We illustrate its applicability with traffic accident data from New York/USA counties (Queens and Kings), showing that the Touchard process is a competitive candidate model for describing non-Poisson counts.
|
|
|
16
|
-
Marcos Augusto Daza Barbosa
-
Bayesian Optimization for Stake Allocation in Soccer Betting
-
Orientador : GUILHERME SOUZA RODRIGUES
-
MEMBROS DA BANCA :
-
EDUARDO YOSHIO NAKANO
-
GUILHERME SOUZA RODRIGUES
-
JOSE AUGUSTO FIORUCCI
-
JOÃO BATISTA DE MORAIS PEREIRA
-
Data: 22/11/2024
-
-
Mostrar Resumo
-
Este trabalho apresenta métodos de otimização para alocar apostas em futebol, equipado com uma sólida modelagem probabilística dos eventos, para maximizar o retorno ajustado ao risco. O crescimento das plataformas de apostas online facilitou o acesso ao mercado, mas as odds oferecidas incluem margens que garantem a lucratividade das casas, reduzindo o valor esperado para o apostador. Nesse cenário, o objetivo deste projeto é identificar e explorar ineficiências de mercado, utilizando uma abordagem de otimização baseada em probabilidades. Diferente da maioria dos estudos, que se concentram em prever desfechos limitados, como vitória, empate ou derrota, este trabalho está equipado com a modelagem da superfície completa de probabilidades, representando todos os possíveis resultados de uma partida. Essa superfície, parametrizada a partir das odds oferecidas pelas casas de apostas, abrange uma variedade demercados, como Correct Score, Spread, Over/Under e Both Score. Com essa modelagem, é possível explorar de maneira robusta diversas oportunidades de apostas, maximizando o uso das probabilidades implícitas nas odds e proporcionando uma diversificação mais eficiente. A principal contribuição deste projeto é a otimização da alocação de apostas com base nessa superfície de probabilidades, por meio de diferentes funções objetivo e maneiras de obter a distribuição dos retornos. O processo de otimização utiliza métodos numéricos para determinar a melhor distribuição das apostas de acordo com a função objetivo predefinida. A alocação é feita não apenas para um jogo, mas simultaneamente para múltiplos jogos e mercados em um mesmo dia, para múltiplas casas de apostas, diversificando a carteira e permitindo o gerenciamento do risco associado. Uma das principais métricas utilizadas é a Sharpe Ratio, que mede o retorno ajustado ao risco. O Sharpe Ratio leva em conta o retorno esperado e a volatilidade dos retornos, permitindo que o sistema ajuste a alocação de apostas para maximizar o ganho potencial enquanto minimiza a volatilidade. Outro critério é o Limite Inferior de Confiança (LCL), uma variação do Sharpe Ratio, que introduz o parâmetro λ para equilibrar expectativa e risco. A otimização LCL ajusta o peso dado ao risco, permitindo maior controle sobre a volatilidade; λ é sintonizado para que a alocação de apostas busque maximizar a expectativa de retorno com o controle do risco, priorizando maior estabilidade ou retornos mais altos, conforme o caso. Para além das abordagens de objetivo único, foi implementada uma otimização multiobjetivo que considera simultaneamente a expectativa e o desvio padrão dos retornos. Essa abor- dagem utiliza Multi-Objective Bayesian Optimization (MOBO) para encontrar a fronteira de Pareto, um conjunto de soluções onde nenhum dos objetivos (expectativa de retorno e risco) pode ser melhorado sem sacrificar o outro. Além disso, o sistema conta com um procedimento de alocação percentual variável para definir o percentual do orçamento a ser apostado. Esse percentual é tratado como uma variável adicional no processo de otimização, o que permite ajustar dinamicamente a exposição ao risco em função do desempenho do modelo e das condições do mercado de apostas. Por fim, também foi incorporada uma técnica de otimização de retornos a longo prazo por meio de simulação de Monte Carlo, aplicando o Sharpe Ratio, para o retorno simulado em um horizonte de múltiplas rodadas de apostas, em um mesmo dia. Os métodos empregados neste estudo utilizaram a Otimização Bayesiana para as tarefas de otimização. Essa escolha se deu devido à eficácia da Otimização Bayesiana em explorar espaços de soluções complexos e encontrar pontos ideais de alocação de apostas, especialmente em situações de alta dimensionalidade e incerteza.
Os experimentos foram conduzidos com dados de apostas coletados entre 2019 e 2024, aplicando o método de otimização selecionado a partir da superfície de probabilidades. Os testes indicaram que a aplicação do Sharpe Ratio e de outras funções objetivo resultou em multiplicações significativas do capital inicial. Assim, este estudo demonstra que uma combinação de modelagem probabilística e otimização multiobjetivo oferece uma abordagem promissora para desenvolver uma estratégia de apostas lucrativa e sustentável a longo prazo. Embora desafios práticos, como o monitoramento em tempo real e restrições de apostas, devam ser considerados, os resultados indicam que a abordagem pode maximizar o retorno ajustado ao risco, conceitualmente e teoricamente, aproveitando as ineficiências do mercado de apostas esportivas.
-
Mostrar Abstract
-
This study explores optimization methods for football betting allocation using probabilistic modeling to maximize risk-adjusted returns. As online betting markets have become increasingly accessible, bookmakers include profit margins in odds, reducing expected value for bettors. This project aims to detect and leverage market inefficiencies through a comprehensive probability surface covering multiple markets, such as Correct Score, Spread, Over/Under, and Both Teams to Score, parameterized from bookmaker odds. The primary contribution is optimizing betting allocation across these markets with various objective functions. Key metrics include the Sharpe Ratio and Lower Confidence Limit (LCL), enabling maximization of gains while managing risk. In one proposed method, a parameter representing the percentage of the budget to be bet is included directly within the optimization process, allowing dynamic adjustment of capital allocation based on model performance and market conditions. Additionally, a multi-objective Bayesian approach (MOBO) provides a Pareto frontier of solutions that balance return and risk simultaneously. We demonstrated significant gains, using Brazilian Serie A data, showing that combining probabilistic modeling with optimization methodsand led to high multiplication of initial capital, theoretically.
|
|