Consultar: Faculdade de Engenharia Elétrica e de Computação - FEEC

Título [Principal]: Extração automatica de palavras-chave na lingua portuguesa aplicada a dissertações e teses da area das engenharias
Autor(es): Maria Abadia Lacerda Dias
Palavras-chave [PT]:

Palavras-chave , Recuperação da informação , Algoritmos de computador , Processamento da linguagem natural (Computação) , Lingua portuguesa - Morfologia
Área de concentração: Eletronica, Microeletronica e Optoeletronica
Titulação: Mestre em Engenharia Eletrica
Banca:
Mauro Sergio Miskulin [Orientador]
Fernando Jose von Zuben
Marcelo Araujo Franco
Maria Isabel Santoro
Resumo:
Resumo: O objetivo desta dissertação é adaptar um algoritmo de extração automática de palavraschave para a língua portuguesa. Palavras-chave fornecem uma descrição adequada do conteúdo de um documento. Tal descrição facilita aos futuros leitores decidirem se o documento é ou não relevante para os mesmos. As palavras-chave têm também outras aplicações, já que estas resumem documentos de forma sucinta. Portanto podem ser usadas como uma medida eficiente de similaridade entre documentos, tornando possível organizá-los em grupos ao se medir a sobreposição entre as palavras-chave que estão associadas. Esta adaptação consiste na utilização de um algoritmo de radicalização de palavras na língua portuguesa, o qual foi aperfeiçoado neste estudo, e uma lista de stopwords da língua portuguesa, apresentada neste trabalho

Abstract: The goal of this dissertation is to adapt an automatic extraction algorithm of keywords for the Portuguese language. Keywords give an adequate description of a document's contents. Such description helps future readers to decide whether the document is relevant or not for them. The keywords have also other applications, because they summarize documents in a brief way. Therefore, they can be used as an efficient measure of similarity between documents, making possible to organize them in groups when measuring the overlap between the keywords they are associated to. This adaptation consists on the utilization of a stemming algorithm for words of the Portuguese language, which was improved in this study, and a list of stopwords of Portuguese language, also presented in this work
Data de Defesa: 28-10-2004
Código: vtls000382069
Informações adicionais:
Idioma: Português
Data de Publicação: 2004
Local de Publicação: Campinas, SP
Orientador: Mauro Sergio Miskulin
Instituição: Universidade Estadual de Campinas . Faculdade de Engenharia Eletrica e de Computação
Nível: Dissertação (mestrado)
UNICAMP: Programa de Pós-Graduação em Engenharia Elétrica

Dono: admin
Criado: 01-08-2006 09:21
Visitas: 10636
Downloads: 309

ArquivoFormatoTamanhoTempo estimado para download
Dias, Maria Abadia Lacerda .pdfDocumento PDF990 Kb(1014055 bytes)1 minuto(s) (Velocidade de conexão de 56 kb/s)Visualizar/Download