Consultar: Seminário Internacional de Bibliotecas Digitais Brasil - SIBDB, São Paulo, 2007

Título [PT]: Uma biblioteca digital de objetos sociais de empresas e a classificação automática nacional de atividades econômicas.
Autor(es): Patrick Marques Ciarelli; Wallece F. Henrique ; Lucas Veronese ; Rafael Zanoli ; Elias Oliveira
Palavras-chave [PT]:

Classificação automática, Biblioteca Digital, e-governo.
Palavras-chave [EN]:
Automatic categorization, Digital libraries, e-government.
Área de concentração: Eixo Temático: Tecnologia aplicada a Bibliotecas Digitais
Resumo:
Resumo: A burocracia para a criação de pequenas empresas no Brasil demora em media 3 meses. Parte do problema deste longo tempo de espera _e que o empreendedor precisa passar por uma longa cadeia de processos manuais, _as vezes em diferentes momentos nos três níveis do governo: Federal, Estadual e Municipal. Por esse motivo, através da criação de uma interface única e centralizada entre os cidadãos e todos os três níveis, o governo Brasileiro pretende diminuir este tempo para 15 dias, em sua maioria. Não obstante, um outro problema difícil que o governo precisa atacar e a classificação das atividades econômicas de cada companhia baseada nas descrições das atividades delas em texto de formato livre. Uma grande quantidade de companhias tem emergido a cada ano e o processo atual de classificação ao manual e extremamente lenta e sujeita a subjetividade humana. Neste artigo nos propomos uma abordagem para auxiliar o classificador humano com o objetivo de reduzir a influência da subjetividade e o tempo de classificação das atividades econômicas das companhias dentro desta imensa biblioteca digital de contratos das companhias que o governo começou a criar. O resultado obtido em nossos experimentos e encorajador, neles foram classificados 1973 documentos com descrição de atividades econômicas com 97,41% de precisão.

Abstract: The bureaucracy for the creation of small businesses takes about 3 months in average in Brazil. Part of the long time waiting problem is that the entrepreneur needs to pass through a long chain of manual processes, sometimes in different instances of the three government levels: Federal, State and County. Hence, by creating a unique, and centralized, interface between the citizen and all the three levels, the Brazilian government wants to drop this time down to 15 days, at most. Nevertheless, another diffcult problem the government needs to tackle is the classification of each economic activities of each company based on its free text business descriptions. A great amount of companies have been emerged each year and the manual process of today's classification is extremely slow and subjected to human subjective. In this paper we propose an approach to assist the human classifier in order to reduce the inuence of the subjectivity and the time of classification of the economic activities of the companies within this huge digital library of companies contracts the government has started to create. The results is encouraging as we are able to classify 1973 business economic-activities description documents with 97,41% of accuracy.
Código: 23483
Informações adicionais:
Trabalho apresentado no Seminário Internacional de Bibliotecas Digitais Brasil - SIBDB

Dono: admin
Criado: 24-10-2007 15:43
Visitas: 1760
Downloads: 10748

ArquivoFormatoTamanhoTempo estimado para download
Ciarelli, Patrick Marques.pdfDocumento PDF276 Kb(282631 bytes)1 minuto(s) (Velocidade de conexão de 56 kb/s)Visualizar/Download