Contido principal do artigo

Marisa Moreda Leirado
Universidade da Coruña
Espanha
Ángeles S. Places
Universidade da Coruña
Espanha
https://orcid.org/0000-0001-8539-304X
Eloy Vázquez Fontenla
Universidade da Coruña
Espanha
Miguel R. Penabad
Universidade da Coruña
Espanha
Miguel R. Penabad
Universidade da Coruña
Espanha
Vol. 6 (2005), Artigos, Páxinas 73-91
DOI: https://doi.org/10.17979/rgf.2005.6.0.5316
Publicado: mai. 17, 2005
Como Citar

Resumo

Um dos serviços mais interessantes das bibliotecas digitais é o que permite a recuperação de documentos através do conteúdo, isto é, o que permite pesquisar textos que tratem determinado tema. Para as bibliotecas poderem implementar serviços deste tipo é preciso que existam recursos e ferramentas de recuperação de textos (corpora, dicionários eletrónicos, lematizadores, analisadores morfológicos, etc.) desenvolvidos para o idioma em que os documentos da biblioteca estiverem escritos. A quantidade e a qualidade dos recursos e ferramentas desenvolvidos dependerá do idioma em questão. O inglês supera todos e na Península Ibérica as bibliotecas digitais de textos escritos em galego são as que têm mais dificuldades para desenvolverem serviços de busca por conteúdo, já que não há, neste momento, ferramentas e recursos de apoio apropriados. Neste artigo apresentamos uma ferramenta de recuperação de textos desenvolvida para o galego, graças à colaboração de investigadores em Filologia Galego-Portuguesa e Informática da Universidade da Coruña. Trata-se de um lematizador que foi apresentado pela primeira vez no ano de 2002, e que nos últimos anos foi otimizado, completado e testado com corpora de diferente natureza para ser usado em serviços de busca por conteúdo de bibliotecas digitais.

Downloads

Não há dados estatísticos.

##plugins.generic.paperbuzz.metrics##

##plugins.generic.paperbuzz.loading##

Detalles do artigo

Referências

Brisaboa, N. R. / Fariña, A. / Navarro, G. / Iglesias, E. L / Paramá, J. R. / Esteller, M. F. (2002): “Compresión de textos en Lenguas Romances”, en Brisaboa, N. R. (ed.): Ingeniería del Software: 169-180 (Colombia: AECI).

Brisaboa, N. R. / Fernández, C. (2001): “Introdución ás Bibliotecas Dixitais”, Revista Galega de Filoloxía, 2: 27-51 (A Coruña: Baía Edicións).

Brisaboa, N. R. / Callón, C. / López, J. R. / Places, A. S. / Sanmartín, G. (2002): “Stemming Galician Texts”, en Laender, A. / Oliveira, A.: Proceedings of the 9th International Symposium, String Precessing and Information Retrieval (SPIRE’02) (Lisboa, 11/13-9-2002): 91-97 (Berlín: Springer-Verlag).

Crystal, D. (2000): Diccionario de Lingüística y Fonética (Barcelona: Octaedro).

Fernández, C. / Places, A. S. (2004): As bibliotecas dixitais (Santiago de Compostela: Laiovento).

Freixeiro, X. R. (1999): Gramática da Lingua Galega. III. Semántica (Vigo: A Nosa Terra).

Freixeiro, X. R. (2000): Gramática da Lingua Galega. II. Morfosintaxe (Vigo: A Nosa Terra).

Moreira, V. / Huyck, C. (2001): “A Stemming Algorithm for the Portuguese Language”, en Navarro, G.: Proceedings of the 8th International Symposium on String Processing and Information Retrieval (SPIRE’01) (Chile, 13/15-11-2001): 186-193 (USA: IEEE Computer Society).

Porter, M. (1980): http://www.tartarus.org/~martin/PorterStemmer.