El conocimiento lingüístico en la desambiguación semántica automática / Iulia Nica.
Material type:
- texto
- sin mediación
- volumen
- 8460804305
Item type | Current library | Call number | Status | Barcode | |
---|---|---|---|---|---|
![]() |
Facultad Regional Santa Fe | 025.4 N512 (Browse shelf(Opens below)) | 4 | 9214 |
Browsing Facultad Regional Santa Fe shelves Close shelf browser (Hides shelf browser)
CONTENIDO
I Fundamentos 13
1 La cuestión de la Desambiguación Semántica automática (DSA) 15
1.1. Definición de la DSA 15
1.2. Motivación de la DSA: necesidad y utilidad 16
1.3. Problemas que plantea la DSA 16
1.4. Tarea intermediaria, no independiente 17
1.5. La DSA y el PLN en otros niveles de la lengua 17
1.6. Existencia y factibilidad de la DSA 18
2 El significado desde la DSA 21
2.1. Delimitación de la polisemia 21
2.1.1. Polisemia vs. ambiguedad, homonimia, vaguedad, indeterminación 21
2.1.2. Tipología de la polisemia. Polisemia estricta. Polisemia VS. monosemia 22
2.2. Tratamiento de la polisemia desde la DSA 25
2.2.1. Modelos del significado adoptados en la DSA 26
2.2.1.1. Listas de control 27
2.2.1.2. Sentidos vs. usos 27
2.2.1.3. Enumeración vs. generación de sentidos 28
2.2.1.4. Potencial de significado 30
2.2.1.5. Modelo relacional 31
2.2.2. Problemas que plantea la polisemia para la DSA 32
2.2.2.1. Delimitación de los sentidos. Criterios 32
2.2.2.2. Número y granularidad de sentidos 33
2.2.2.3. Relatividad de los sentidos. Factores que condicionan el concepto de sentido en el marco del PLN 35
2.3. Significado y contexto 36
2A. Construcción del significado 38
2.5. Coordenadas linguísticas de la DSA 40
3 Metodología de la OSA (I): información usada 43
3.1. Fuentes de conocimiento léxico 44
3.1.1. Fuentes de información estructuradas 44
3.1.1.1. Diccionarios accesibles por ordenador 44
3.1.1.2. Tesauros 45
3.1.1.3. Redes semánticas 45
3.1.1.4. Lexicones generativos 50
3.1.2. Fuentes de información no estructuradas: corpus 50
3.1.2.1. Corpus no etiquetados 51
3.1.2.2. Corpus etiquetados 51
3.2. Tipos de conocimiento útiles para la DSA 55
3.3. La información contextual en la DSA 57
3.3.1. Contexto local 58
3.3.2. Contexto global 60
3.3.3. Modalidades de explotar el contexto en la DSA 61
4 Metodología de la DSA (II): métodos 63
4.1. Preliminares metodológicos 63
4.1.1. Clasificación de los métodos de DSA 63
4.1.2. Aprendizaje Automático 65
4.1.3. Métodos supervisados vs. métodos no supervisados 67
4.1.4. Problemas de los métodos basados en corpus. Soluciones 68
4.1.4.1. Escasez de datos 68
4.1.4.2. Dificultad de la adquisición de conocimiento léxico 70
4.1.4.3. Transportabilidad y adaptación 70
4.1.5. Estrategias para la combinación de la información en la DSA 71
4.1.6. Medidas para la evaluación de los sistemas de DSA 72
4.2. Métodos basados en fuentes estructuradas de conocimiento léxico 73
4.2.1. DSA basada en sistemas reducidos de la Inteligencia Artificial 73
4.2.1.1. Métodos simbólicos 73
4.2.1.2. Métodos subsimbólicos (conexionistas) 74
4.2.2. DSA basada en fuentes léxicas estructuradas amplias 75
4.2.2.1. DSA basada en diccionarios accesibles por ordenador 75
4.2.2.2. DSA basada en tesauros 79
4.2.2.3. DSA con bases de datos léxicas 80
4.2.2.4. DSA basada en diferentes fuentes léxicas estructuradas 85
4.3. Métodos basados en corpus 85
4.3.1. Métodos basados en corpus etiquetados con sentidos 85
4.3.1.1. Métodos estadísticos 86
4.3.1.2. Métodos basados en reglas 87
4.3.1.3. Métodos basados en memoria 89
4.3.1.4. Métodos basados en corpus bilingues 90
4.3.2. Métodos basados en corpus no etiquetados con sentidos 90
4.4. Métodos mixtos 92
4.4.1. Métodos que combinan diccionarios y corpus 92
4.4.2. Métodos que combinan tesauros y corpus 93
4.4.3. Métodos que combinan WordNet y corpus 93
4.4.4. Métodos que combinan diferentes fuentes léxicas estructuradas y corpus 98
4.4.5. Métodos basados en técnicas de combinaciones de clasificadores y en aprendizaje computacional 99
5 Metodología de la DSA (III): evaluación y comparación de los sistemas de DSA 101
5.1. El problema 101
5.2. Senseval 102
5.2.1. Senseval-1 102
5.2.2. Senseval-2 104
5.2.3. Senseval-3 106
5.3. Otras evaluaciones y comparaciones 108
II PROPUESTA: DESAMBIGUACION SEMANTICA AUTOMATICA BASADA EN LA EXPLOTACION DE PATRONES LEXICO-SINTACTICOS 111
6 Método de DSA 113
6.1. Espacio de análisis 113
6.2. Punto de partida: la intervención del conocimiento linguístíco en la DSA 114
6.3. Principios-guía en el estudio 116
6.4. Enfoque a la DSA 117
6.4.1. Aspectos críticos de la DSA que investigamos 117
6.4.2. Análisís y soluciones propuestas 119
6.4.2.1. Caracterización de la ocurrencia ambigua con información paradigmática extraída del corpus 119
6.4.2.2. Adquisición de conocimiento mediante el uso de relaciones paradigmáticas y sintagmáticas 119
6.4.2.3. Caracterización alternativa de los sentidos. Adaptación de EuroWordNet con discriminadores de sentido 120
6.4.2.4. El contexto local como patrones léxico-sintácticos 123
6.4.3. Estrategia de DSA: el uso de los patrones léxico-sintácticos para la asignación de sentido 126
6.5. Método básico 127
6.6. Estudio de caso: análísis de las limitaciones 129
6.7. Desarrollo del método 130
6.7.1. Identificación de los patrones léxico-sintácticos 131
6.7.2. Explotación de los patrones léxico-sintácticos: información asociada a la ocurrencia ambigua 134
6.7.3. Asignación de sentido: Prueba de Conmutabilidad 139
6.8. Sistema de DSA 141
7 Experimentación 147
7.1. Entorno experimental 147
7.2. Experimentos de control 150
7.3. Experimentos para el refinamiento del método 156
7.4. Evaluación parcial enel marco de Senseval-3 173
8 Investigación en curso y futura 177
8.1. Refinamiento y ampliación del método 177
8.2. Estudios de carácter teórico 181
8.3. Aplícaciones en el marco del PLN 182
8.4. Nuevo desarrollo del proceso de DSA 184
Conclusiones 185
1. Problemas abiertos en DSA 185
2. Contribución de la presente tesis 187
Bibliografía 191
Anexos 205
Anexo 1. Esquemas de búsqueda 207
Anexo 2. Reglas de descomposición 219
Anexo 3. Discriminadores de Sentido 229
There are no comments on this title.