Consultar: Estudos da Linguagem - IEL

Título [PT]: Aspectos semânticos e computacionais de resolução de pronomes E-type em um corpus histórico do português
Autor(es): Daniel Alves da Silva Lopes Diniz
Palavras-chave [PT]:

Linguística computacional , Resolução de anáfora , Pronomes E-type
Palavras-chave [EN]:
Computational linguistics , Anaphora resolution , E-type pronouns
Titulação: Bacharel em Linguística
Banca:
Ruth Elisabeth Vasconcellos Lopes [Orientador]
Resumo:
Resumo: Um pronome anafórico (isto é, em uma leitura não-dêitica) parece poder, à primeira vista, ter como antecedente ou uma expressão referencial ou um sintagma nominal quantificado. Neste último caso, é uma variável tanto sintática quanto semanticamente ligada, de modo a ter como contraparte na proposição expressa pela sentença em que ocorre uma variável lógica ligada a um quantificador (existencial ou universal). Evans (1980) observa, no entanto, que, em certos contextos, pronomes que não podem ser ligados admitem, ainda assim, leituras notoriamente anafóricas. Tais pronomes foram denominados “E-type”. Esse fenômeno suscitou problemas sintático-semânticos que receberam dois tratamentos na literatura: i) na abordagem composicional da semântica formal, considerou-se que pronomes E-type podem ser substituídos por descrições correferentes; e ii) na Discourse Representation Theory (DRT), conforme Kamp (2002), os indivíduos referenciados e as proposições expressas em uma sequência de sentenças são adicionados ou removidos de conjuntos conforme o discurso é processado, o que permite um tratamento uniforme dos vários tipos de pronome. Esta pesquisa objetivou i) apresentar alguns dos problemas supra-citados; ii) comparar o tratamento a eles dispensado por essas duas semânticas; e iii) criar um algoritmo de resolução de anáforas que encontrasse o antecedente do pronome de terceira pessoa plural em contextos E-type ora pressupondo uma das semânticas analisadas em ii, ora pressupondo a outra, de modo a verificar se adotar uma ou outra tem algum efeito sobre a eficácia do algoritmo. Para este último objetivo, 30.126 sentenças de 19 textos do Corpus Histórico do Português Tycho Brahe foram analisadas com um programa de elaboração própria escrito em Python 3 que importa várias ferramentas da biblioteca Natural Language Toolkit (NLTK). Desse total, 234 sentenças tinham pronomes anafóricos do tipo procurado. Conseguiu-se fazer com que o programa detectasse relações de dominância, irmandade e c-comando entre sintagmas e selecionasse, de uma lista de possíveis antecedentes para um dado pronome “eles”, aquele com a maior probabilidade de realmente sê-lo. Não se pôde, no entanto, implementar as semânticas composicional e DRT de modo relevante para os procedimentos de decisão executados pelo programa. Considerando que esta pesquisa situa-se em uma interface pouco explorada, especialmente em um âmbito que não o da Ciência da Computação, entre Sintaxe Gerativa, Semântica Formal e Linguística Computacional, mesmo estes resultados bastante preliminares e aquém do inicialmente planejado parecem promissores. Espera-se que pesquisas subsequentes consigam implementar computacionalmente os modelos teóricos comentados aqui.

Abstract: An anaphoric pronoun (that is, in a non-deictic reading) seems, at first sight, to be able to have as its antecedent either a referential expression or a quantified nominal phrase. In the latter case it will be a variable both syntactically and semantically bound, so that it will have as its counterpart in the proposition expressed by the sentence in which it occurs a variable logically bound to a quantifier (existential or universal). Evans (1980) observes, however, that in certain contexts, pronouns which cannot be bound nevertheless admit notoriously anaphoric readings. Such pronouns were named “E-type”. This phenomenon has aroused syntactic-semantic problems which received two treatments in the literature: i) in the compositional approach of formal semantics, it has been thought that E-type pronouns can be replaced by coreferential definite descriptions; and ii) in the Discourse Representation Theory (DRT), according to Kamp (2002), referred individuals and expressed propositions in a sequence of sentences are added or removed from sets as the discourse is processed, which allows for a uniform treatment of the many types of pronouns. This research aimed i) to introduce some of the problems aforementioned; ii) to compare the treatment given to them by those two semantics; and iii) to create an algorithm of anaphora resolution that could find the antecedent of a third person plural pronoun in E-type contexts either assuming one of the semantics analyzed in ii, or the other, in such a way as to verify whether adopting either has any effect upon the algorithm’s efficiency. In order to accomplish this latter goal, 30,126 sentences from 19 texts of the Historical Corpus of Portuguese Tycho Brahe were analyzed by a self-made program written in Python that imports several tools from the Natural Language Toolkit (NLTK) library. From this total, 234 sentences had anaphoric pronouns such as those that were been looked for. It was managed to have the algorithm detecting dominance, sisterhood and c-command relations between phrases and to select, among a list of possible antecedents for a given “they” pronoun, that with the greatest probability of being it. It could not be implemented in a relevant way, however, the compositional and DRT semantics for the decision procedures executed by the program. Considering that this research is situated in a poorly explored interface, especially in a medium other than Computer Science, between Generative Syntax, Formal Semantics and Computational Linguistics, even such preliminary results that fall short from what was originally expected appear to be promising. It is expected that further research may computationally implement the theoretical models addressed here.
Data de Defesa: 2016
Código: 74301

Dono: admin
Criado: 23-05-2017 16:42
Visitas: 542
Downloads: 297

ArquivoFormatoTamanhoTempo estimado para download
Diniz, Daniel Alves da Silva Lopes.pdfDocumento PDF515 Kb(527025 bytes)1 minuto(s) (Velocidade de conexão de 56 kb/s)Visualizar/Download