ICEx UFMG - Mostrando itens por tag: Tese

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Dissertação:

 

Learning the Latent Structure of Networked Point Processes

Guilherme Resende Borges

 

A temporal point process is a sequence of timestamps representing the occurrences of certain events. Recently, there has been a lot of work on the use of Networked Point Processes to extract the latent graphs of large scale networks. The problem can be framed as follows: Given a set of timestamps (e.g. messages or posts) for K entities (e.g. users or web pages), can we extract a latent K by K graph that corresponds to an underlying complex network using only the timestamps? This task has gained attention of researchers and practitioners due to its wide applicability and several models have been proposed to extract such relationships in different datasets. However, we have found that such models are usually under-evaluated. That is, past endeavours focus on a small set of unjustified metrics for one or two datasets at most. To provide the community with a rigorous benchmark, we propose an evaluation framework of metrics and datasets for network inference via Point Processes.

 

Comissão Examinadora:

 

Prof. Pedro Olmo Stancioli Vaz de Melo - Orientador (DCC - UFMG)

Prof. Renato Martins Assunção - Coorientador (DCC - UFMG)

Prof. Flavio Vinicius Diniz de Figueiredo - Coorientador (DCC - UFMG)

Prof. Daniel Ratton Figueiredo (PESC - UFRJ)

Prof. Heitor Soares Ramos Filho (DCC- UFMG)

 

5 de Dezembro de 2019

14:00h

 

Sala 2077 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Tese:

Methods for Vector Representation and Topic Modeling of Short Text

Marcelo Rodrigo de Souza Pita

 

Short texts are everywhere in the Web. They are characterized by little context words and a large collection vocabulary. This makes the discovery of knowledge in short text challenging, motivating the development of novel effective methods. This work has contributions in two lines of research. In the first line, a framework that creates larger pseudo-documents for STTM is proposed, from which we derive two implementations: (1) CoFE, based on the co-occurrence of words; and (2) DREx, which relies on word vectors. We also propose Vec2Graph, a graph-based representation for corpora induced by word vectors, and VGTM, a probabilistic short text topic model that works on the top of Vec2Graph. In the second line of research, we report a investigation on proper ways of combining word vectors to produce document vectors. Experiments show competitive results both in NPMI (topic modeling) and F1 (document classification), many times with significant improvement over state-of-the-art methods.

Comissão Examinadora:

Profa. Gisele Lobo Pappa - Orientadora (DCC - UFMG)

Prof. Marcos André Gonçalves (DCC - UFMG)

Prof. Marco Antônio Pinheiro de Cristo (IComp - UFAM)

Prof. Alexandre Plastino de Carvalho (IC - UFF)

Prof. Pedro Olmo Stancioli Vaz de Melo (DCC - UFMG)

 

2 de Dezembro de 2019

13:00h

 

Sala 2077 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Tese:

 

A Thorough Exploitation of Distance-Based Meta-Features for Automated Text Classification

Sérgio Daniel Carvalho Canuto

 

Classificação automática de texto é uma das aplicações fundamentais do paradigma de classificação supervisionada, sendo indispensável para diversas tarefas, como categorização de notícias, organização de bibliotecas digitais, construção de diretórios da web, análise de sentimentos e detecção de spam. Embora o algoritmo de classificação por

si só desempenhe um papel importante nas tarefas de classificação, os atributos usados para representar documentos podem ser igualmente importantes para determinar a eficácia da classificação. Neste trabalho, propomos novos meta-atributos baseados em distância entre documentos capazes de fornecer evidências discriminativas para a classificação, bem como novos mecanismos para analisar e selecionar meta-atributos. Além disso, fornecemos contribuições adicionais para aprimorar a eficiência e a eficácia na utilização de meta-atributos por meio do enriquecimento de meta-atributos com dados rotulados e de análise de sentimento.

 

Comissão Examinadora:

Prof. Marcos André Gonçalves - Orientador (DCC - UFMG)

Prof. Thierson Couto Rosa - Coorientador (INF - UFG)

Profa. Gisele Lobo Pappa (DCC - UFMG)

Prof. Rodrygo Luis Teodoro Santos (DCC - UFMG)

Prof. Pável Pereira Calado (INESC - ULisboa)

Prof. Alexandre Plastino de Carvalho (IC - UFF)

 

22 de Novembro de 2019

08:00h

Sala 2077 do ICEX

 

 

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Projeto de Tese:

 

Scalable and Precise Dynamic Reconstruction of CFGs

Andrei Rimsa Álvares

 

The automatic recovery of a program’s high-level representation from its binary version is a well-studied problem. However, most of the solutions are based on purely static approaches: the bytes of an executable back are converted into control flow graphs (CFGs). This proposal shows that a dynamic analysis can be effective and useful as a standalone technique, and as a way to enhance the precision of static approaches. The experimental results provide evidence that completeness is achievable on many functions from industry-strong benchmarks. Experiments also indicate that it greatly enhances the ability of

DynInst to deal with code stripped of debugging information. These results were obtained with CFGGrind, a dynamic CFG reconstructor. CFGGrind recovers the complete CFG of 41% of Spec Cpu2017's procedures. When combined with CFGGrind, DynInst finds 36% more CFGs for cBench, and 21% more for Spec Cpu2017. Finally, CFGGrind is 7x faster than DCFG, and 1.30x faster than bfTrace.

 

Comissão Examinadora:

Prof. Fernando Magno Quintão Pereira - Orientador (DCC - UFMG)

Prof. Leonardo Barbosa e Oliveira (DCC - UFMG)

Prof. Marcos Augusto Menezes Vieira (DCC - UFMG)

Prof. Guido Costa Souza de Araújo (IC - UNICAMP)

Prof. José Nelson Amaral (DSC - University of Alberta)

 

19 de Novembro de 2019

13:00h

 

Sala 2077 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Dissertação:

 

Mapping the Unseen: Exploiting Super-Resolution for Semantic Segmentation in Low-Resolution Images

Matheus Barros Pereira

 

Imagens de sensoriamento remoto de baixa resolução são facilmente encontradas em repositórios públicos e são usadas em diversos estudos. Porém o uso de dados de baixa resolução para criação automática de mapas temáticos é restrito, pois a maioria das abordagens para segmentação semântica são adequadas apenas para dados subdecimais. Neste trabalho, foi desenvolvido um arcabouço cujo objetivo é avaliar a efetividade de super-resolução na segmentação semântica de imagens de sensoriamento remoto de baixa resolução. Foram executados experimentos em dados de natureza distinta, visando avaliar a super-resolução em diferentes níveis de degradação, comparando-a com interpolação bicúbica. Os resultados mostram que super-resolução não apenas é melhor, como também alcança resultados de segmentação semântica comparáveis a dados de alta resolução. O uso de super-resolução provou ser mais efetivo do que a aplicação direta de imagens de baixa resolução, especialmente para altos fatores de degradação.

 

Comissão Examinadora:

Prof. Jefersson Alex dos Santos - Orientador (DCC - UFMG)

Prof. George Luiz Medeiros Teodoro (DCC - UFMG)

Prof. André Vital Saúde (DCC - UFLA)

Prof. Wesley Nunes Gonçalves (FAENG - UFMS)

 

11 de Novembro de 2019

09:00h

 

Sala 2077 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Dissertação:

 

Extended Pre-Processing Pipeline For Text Classification: On the Role of Meta-Features, Sparsification and Selective Sampling

 Washington Luiz Miranda da Cunha

 

Pipelines for Text Classification are a sequence of tasks needed to be performed to classify documents. The pre-processing phase of these pipelines involve different ways of manipulating the documents for the learning phase. We introduce three new steps into the pre-processing phase: 1. Meta-Features (MF) to reduce the dimensionality of the original term-document (TF-IDF) matrix; 2. Sparsification step to make the MF less dense; 3. Selective Sampling step to select the "best" documents for the learning phase. We show that the proposed extended pre-processing pipeline can improve the effectiveness while reducing the associated costs. Our experiments show that the proposed extended pre-processing pipeline can achieve significant gains in effectiveness (up to 52%) when compared to the TF-IDF, at a much lower cost (up to 9.7x faster in some cases). Another main contribution is a thorough evaluation of the trade-offs associated with the introduction of these new steps into the pipeline.

 

Comissão Examinadora:

 

Prof. Marcos André Gonçalves - Orientador (DCC - UFMG)

Prof. Leonardo Chaves Dutra da Rocha - Coorientador (DCOMP - UFSJ)

Profa. Jussara Marques de Almeida Gonçalves (DCC - UFMG)

Prof. Anisio Mendes Lacerda (DCC - UFMG)

 

8 de Novembro de 2019

13:00h

 

Sala 6321 do ICEX

 

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Projeto de Tese:

 

From Gates to Circuits: Complementary Photonic Crystal Logic Devices Allowing the Development of Integrated Systems

Luis Eduardo Pedraza Caballero

 

This thesis project proposes a new approach to realize logic systems on photonic crystals (PhC). It consists of projecting logic circuits by connecting two complementary building-blocks: the Switches N and P. With this, the PhC computing paradigm reaches a high abstraction level, switching up from devices to logic circuits. The results show that the projected logic systems using this approach present a minimum clock rate of 20 GHz, an average ON-OFF contrast ratio of 7.18 dB and a clean output signal to represent the logic values 1 and 0. This work also explores how logic gates can be projected by control the light beam interference in PhC. In this case, the results show that the projected devices present a minimum clock rate of 100 GHz, an average ON-OFF contrast ratio of 6.24 dB, and a wide operation bandwidth. As a final consideration, the projected devices have great potential to be microfabricated, low energy dissipation, and high speed of data processing.

 

Comissão Examinadora:

 

Prof. Omar Paranaíba Vilela Neto - Orientador (DCC - UFMG)

Prof. Paulo Sérgio Soares Guimarães - Coorientador (DF - UFMG)

Prof. Luiz Filipe Menezes Vieira (DCC - UFMG)

Prof. Gilberto Medeiros Ribeiro (DCC - UFMG)

Prof. José Augusto Miranda Nacif (DI - UFV)

Profa. Patricia Lustoza de Souza (CETUC - PUC)

 

6 de Novembro de 2019

13:30h

Sala 2077 do ICEX

Sala 2077 do ICEX

 

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Dissertação:

 

Product Partition Model for Categorical Features

Tulio Lima Criscuolo

 

A common difficulty in data analysis is how to handle categorical predictors with a large number of levels or categories. There are few proposals developed in the literature to handle this important and frequent problem. We introduce a generative model that simultaneously carries out the model fitting and the aggregation of the categorical levels into larger groups. Our approach is based on imposing a graph where the nodes are categories and creating a probability distribution over meaningful partitions of this graph. Being a Bayesian model, it allows the posterior inference, including uncertainty measurement, on the estimated parameters and the categories partition. We compare our method with the state-of-art methods showing that it has equally good predictive performance and much better interpretation ability. Given the current concern on balancing accuracy versus interpretability, our proposal reaches an excellent result.

 

Comissão Examinadora:

 

Prof. Wagner Meira Júnior - Orientador (DCC - UFMG)

Prof. Renato Martins Assunção - Coorientador (DCC - UFMG)

Prof. Fabricio Murai Ferreira (DCC - UFMG)

Profa. Rosangela Helena Loschi (DEST - UFMG)

Prof. Denis Deratani Mauá (IME - USP)

 

25 de Outubro de 2019

13:00h

 

Sala 6321 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Projeto de Tese:

 

Heuristics for minmax regret optimization problems under interval uncertainty

Iago Augusto de Carvalho

 

Minmax regret is an approach to tackle uncertainty in the decision-making process. In this Thesis, we investigate minmax regret optimization problems where the coefficient of the variables on the objective function is unknown, but it is assumed to be bounded by an interval. We investigate the Minmax regret Single-Source Shortest PathProblem under Interval Uncertainty (MSS-SPP). We prove that this problem is NP-Hard, extend several heuristics from the literature to the MSS-SPP, and introduce a new class of heuristics for solving minmax regret optimization problems under interval uncertainty, which are the Fix-and-Optimize heuristics. Computational experiments performed on classical instances from the literature demonstrated that one of the proposed Fix-and-Optimize heuristics significantly outperformed the literature heuristics for solving MSS-SPP.

 

Comissão Examinadora:

 

Prof. Thiago Ferreira de Noronha - Orientador (DCC - UFMG)

Prof. Christophe Didier Duhamel - Coorientador (ISIMA - UCA)

Prof. Cristiano Arbex Valle (DCC - UFMG)

Prof. Vinícius Fernandes dos Santos (DCC - UFMG)

Prof. Rafael Castro de Andrade (DEMA - UFC)

 

25 de Outubro de 2019

13:h

 

Sala 2077 do ICEX

A Coordenação do Programa de Pós-Graduação em Ciência da Computação tem a satisfação de convidá-lo para a Defesa de Projeto de Tese:

Compression-Based Unsupervised Sampling for Learning to Rank

Rodrigo de Magalhães Silva

 

Learning to Rank (L2R) methods can be used to improve ranking quality in a variety of applications. Yet a major hurdle to the adoption of L2R on private and public collections is the investment required to produce good training sets. It is possible to use Active Learning (AL) algorithms to produce smaller training sets. But these methods can be difficult to implement and may not produce good results depending on characteristics of the collections or data being sampled. They are also not very practical, requiring constant supervision and availability of human assessors. We propose an unsupervised sampling technique that relies on very general characteristics of L2R datasets. We show how this method has several advantages over AL methods for L2R, making it much easier for practitioners to use L2R on their systems and applications. Finally, based on a detailed analysis of the method's inner workings, we provide information-theoretic insights on why it is so effective.

Comissão Examinadora:

 

Prof. Marcos André Gonçalves - Orientador (DCC - UFMG)

Prof. Mario Sérgio Ferreira Alvim Júnior - Coorientador (DCC - UFMG)

Prof. Rodrygo Luis Teodoro Santos (DCC - UFMG)

Prof. Fabricio Murai Ferreira (DCC - UFMG)

Prof. Ricardo da Silva Torres (IC - UNICAMP)

 

22 de Outubro de 2019

13:30h

 

Sala 2077 do ICEX

Página 1 de 4