Uma biblioteca digital de objetos sociais de empresas e a classificação automática nacional de atividades econômicas.

Capa:Uma biblioteca digital de objetos sociais de empresas e a classificação automática nacional de atividades econômicas.

Autor(es): Patrick Marques Ciarelli, Wallece F. Henrique, Lucas Veronese, Rafael Zanoli, Elias Oliveira


Resumo: Resumo: A burocracia para a criação de pequenas empresas no Brasil demora em media 3 meses. Parte do problema deste longo tempo de espera _e que o empreendedor precisa passar por uma longa cadeia de processos manuais, _as vezes em diferentes momentos nos três níveis do governo: Federal, Estadual e Municipal. Por esse motivo, através da criação de uma interface única e centralizada entre os cidadãos e todos os três níveis, o governo Brasileiro pretende diminuir este tempo para 15 dias, em sua maioria. Não obstante, um outro problema difícil que o governo precisa atacar e a classificação das atividades econômicas de cada companhia baseada nas descrições das atividades delas em texto de formato livre. Uma grande quantidade de companhias tem emergido a cada ano e o processo atual de classificação ao manual e extremamente lenta e sujeita a subjetividade humana. Neste artigo nos propomos uma abordagem para auxiliar o classificador humano com o objetivo de reduzir a influência da subjetividade e o tempo de classificação das atividades econômicas das companhias dentro desta imensa biblioteca digital de contratos das companhias que o governo começou a criar. O resultado obtido em nossos experimentos e encorajador, neles foram classificados 1973 documentos com descrição de atividades econômicas com 97,41% de precisão. Abstract: The bureaucracy for the creation of small businesses takes about 3 months in average in Brazil. Part of the long time waiting problem is that the entrepreneur needs to pass through a long chain of manual processes, sometimes in different instances of the three government levels: Federal, State and County. Hence, by creating a unique, and centralized, interface between the citizen and all the three levels, the Brazilian government wants to drop this time down to 15 days, at most. Nevertheless, another diffcult problem the government needs to tackle is the classification of each economic activities of each company based on its free text business descriptions. A great amount of companies have been emerged each year and the manual process of today's classification is extremely slow and subjected to human subjective. In this paper we propose an approach to assist the human classifier in order to reduce the inuence of the subjectivity and the time of classification of the economic activities of the companies within this huge digital library of companies contracts the government has started to create. The results is encouraging as we are able to classify 1973 business economic-activities description documents with 97,41% of accuracy.


Palavras-Chave: Classificação automática; Biblioteca digital; E-governo.