Tecnologías de la lengua y sus aplicaciones
Contenido principal del artículo
Resumen
La investigación en Lingüística Computacional y Procesamiento del Lenguaje Natural ha dado lugar estos últimos años a las denominadas Tecnologías del Lenguaje, cuyo objetivo principal es el desarrollo de sistemas informáticos capaces de reconocer, comprender y generar lenguaje humano en todas sus formas. Con esta finalidad, se han desarrollado una serie de aplicaciones, como la Traducción Automática, la Extracción y Recuperación de la Información, la Clasificación de Documentos, etc., que procesan la información para facilitar el acceso, organización y transmisión del conocimiento que genera la llamada Sociedad de la Información en que vivimos. Como en otras disciplinas científicas, en el área de la Lingüística Computacional y del Procesamento del Lenguaje Natural se ha pasado de una etapa inicial centrada en la investigación básica de carácter experimental a otra en que se interacciona más con la sociedad y, por lo tanto, más interesada en la creación de productos y aplicaciones que resuelvan problemas reales. Esto significa desarrollar sistemas y recursos capaces de analizar el lenguaje sin restricciones, esto es, que ofrezcan una amplia cobertura lingüística. En este artículo se presenta de modo introductorio los recursos (lingüísticos) y las aplicaciones más características que se desarrollan actualmente en el marco de las Tecnologías del Lenguaje. En concreto, salientaremos dos recursos necesarios: los analizadores y desambiguadores morfológicos y sintácticos, los lexicones computacionales y los corpus lingüísticos, fundamentalmente los etiquetados. En cuanto a las aplicaciones, nos centraremos básicamente en la Recuperación y Extracción de la Información y en la Traducción Automática.
Palabras clave:
Descargas
Métricas
Detalles del artículo
Citas
Alonso, J.A. (2003): “La traducción automática”, dins Tecnologías del lenguaje: 94-129 (Barcelona: Editorial UOC).
Chomsky, N. (1957): Syntactic Structures (The Hague: Mouton).
Chomsky, N. (1965): Aspects of one Theory of Syntax (Cambridge, Mass.: The MIT Press).
Civit, M. (2003): Criterios de etiquetación y desambiguación morfosintáctica de corpus en español. Monografías, 3, de la SEPLN (Alicante: Sociedad Española para el Procesamiento del Lenguaje Natural).
Civit, M. / Martí, M. A (2004): ‘Building Cast3LB: a Spanish Treebank’, a Treebanks and Linguistic Theories, Kluwer Academic Publishers (en preparación).
Gazdar, G. / Klein, E. / Pullum, G. / Sag, I. (1985): Generalized Phrase Structure Grammar (Oxford: Basil Blackwell).
Gonzalo, J. / Verdejo, F. (2003) “La extracción y recuperación de información” dins Tecnologías del lenguaje: 157-192 (Barcelona: Editorial UOC).
Harris, Z.-H. (1993): The Linguistics Wars (Oxford: University Press Oxford).
Jakendoff, R. (1988): Semantics and Cognition (Massachussets: MIT Press).
Joshi, A (1984): ‘How Much Context-Sensitivity is Required to Provide Reasonable Structural Descriptions: Tree Adjoining Grammars’, a Dowty, D. / Karttunen, L. / Zwicky, A. (eds.), Natural Language Processing: Psycholinguistic, Computational and Theoretical Properties: 190-205 (New York: Cambridge University Press).
Kaplan / Bresnan (1982): ‘Lexical-Functional Grammar: A Formal System for grammatical Representation’, a Bresnan (ed.), The mental Representation of Grammatical Relations: 173-281 (Cambridge, Mass.: MIT Press).
Kay (1985): ‘Functional Unification Grammar: A Formalism for machine Translation’, a Proceedings of COLING 84: 75-78 (California: Menlo Park).
Kittredge, R. / Lehrberger, J. (1982): Sublanguage. Studies of language in restricted Semantic Domains (New York: Walter de Gruyte).
Koskeniemmi, K. (1983): Two-Level Morphology: A General Computational Model for Word-Form Recognition and Production. PhD Thesis, University of Helsinki, Department of General Linguistics.
Leech. G. (1997b): ‘Introducing Corpus Annotation, a Garside / Leech / McEnery (eds.), Corpus Annotation. Linguistic Information from Computer Text Corpora: 1-18 (London: Logman).
Llisterri, J. (2003) ‘Las tecnologías del habla’, dins Tecnologías del lenguaje: 249-281 (Barcelona: Editorial UOC).
Martí, M.A. (1988): Processament informàtic del Llenguatge Natural: un sistema d’anàlisi morfológica per ordinador. Tesi Doctoral, Dept. Filología Románica, Barcelona.
Martí, M.A. (2003): “Consideraciones sobre la polisemia”, dins Martí, M.A / Fernández, A. / Vázquez, G. (eds.): Lexicografía computacional y semántica: 61-103 (Barcelona: Edicions Universitat de Barcelona).
Martí, M. A. (coord.) (2003): Tecnologías del lenguaje (Barcelona: Editorial UOC).
Martí, A. / Castellón, I. (2001): Lingüística Computacional (Barcelona: Edicions Universitat de Barcelona).
Màrquez, Ll / Padró, Ll / i Rodríguez, H. (2001): ‘Mètodes robustos en l’anàlisi del llenguatge. El processament de text no restringit, Lingüística Computacional: 1- 68 (Barcelona: Edicions de la Universitat Oberta de Catalunya).
McEnery, G. / Wilson, A. (1996): Corpus Linguistics (Edinburgh: Edinburgh University).
Miller, G. A. / Fellbaum, Ch. (1991): “Semantic networks of Englis”, Cognition, 41: 197-229.
Moreno Sandoval, A. (2001): Gramáticas de unificación y rasgos. Col. Lingüística y Conocimiento. 32 (Madrid: A. Machado Libros, S.A.).
Oakley / Owen (1990): Alvey, Britain’s Strategic Computing Initiative (Cambridge, Mass: MIT Press).
Ooi, V. B. Y. (1998): Computer Corpus Lexicography (Edinburgh: Edinburgh University press).
Pollard, K. / Sag, I. (1987): Information-Based Syntax and Semantics. Volume 1: Fundamentals. CSLI, Lecture Notes, 13. (California: Stanford).
Pollard, K. / Sag, I. (1993): Head-Driven Phrase Structure Grammar. CSLI (Chicago / London: The University of Chicago Press).
Pustejovsky, J. (1995): The generative lexicon (Cambridge MA: The MIT Press).
Shieber, S. (1986): An introduction to unification-based approaches to grammar. CSLI, Lecture Notes, 4 (California: Stanford).
Sinclair, (1987): Looking Up (London: Collins ELT).
Taulé, M. / Martí, M. A. (2001): ‘Formalismes gramaticals’, Lingüística Computacional: 1-99 (Barcelona: Edicions de la Universitat Oberta de Catalunya).
Vicedo, J. L. (2003): Recuperación de información de alta precisión: los sistemas de búsqueda de respuestas. Monografías, 2, de la SEPLN (Alicante: Sociedad Española para el Procesamiento del Lenguaje Natural).