AUTOMATIC CLASSIFICATION OF NOUNS INTO SEMANTIC GROUPS USING A CORPUS OF TEXTS
DOI:
https://doi.org/10.7494/csci.2003.5.1.3605Abstract
This article presents a method of classification of nouns into semantic groups based on statistical inference. The algorithm uses the infiectional dictionary o f the Polish language and a corpus of texts to ana yse adjective-noun relationships. The semantic groups are consistent with the categorization in the WordNet dictionary. The classification of nouns into semantic groups is a smali step towards constructing a semantic dictionary for the Polish language.
Downloads
References
Lubaszewski W., Wróbel H., Gaj cki M., Moskal B., Orzechowska A., Pietras P., Pisarek P., Rokicka T.: S ownik fleksyjny j zyka polskiego. Kraków, Wydawnictwo Prawnicze LexisNexis 2001
Fellbaum Ch. (red.): WordNet. An Electronic Lezical Database. MIT Press 1998
http://www.illc.uva.nl/EuroWordNet
Miller G. A.: Nouns in WordNet: A Lexical Inheritance System, [in:] International Journal of Lexicography, 3(4) 1990
Wróbel H.: Gramatyka j zyka polskiego. Kraków, OD NOWA 2001, 91-92.
Gaj cki M.: Serwer leksykalny j zyka polskiego. Computer Science, vol. 3, 2001,
-150
Gaj cki M.: Automatyczne generowanie s ownika asocjacyjnego na podstawie kor pusu tekstów. V Krajowa Konferencja Naukowa „In ynieria Wiedzy i Systemy Ekspertowe” , Wroc aw 2003
Zipf G.K.: The Psycho-Biology of Language: An Introduction to Dynamie Phi- lology. Houghton Mifflin 1935
Pola ski K.: S ownik syntaktyczno-generatywny czasowników polskich. Wroc aw- -Warszawa-Kraków, Ossolineum 1980-1992 (tom I-V)