AUTOMATIC CONTEXTUAL TEXT CORRECTION USING THE LINGUISTIC HABITS GRAPH LHG

Authors

  • Marcin Gadamer Akademia Górniczo-Hutnicza w Krakowie
  • Adrian Horzyk Akademia Górniczo-Hutnicza w Krakowie

DOI:

https://doi.org/10.7494/csci.2009.10.3.37

Keywords:

automatic text correction, graph LHG

Abstract

Automatic text correction is an essential problem of today text processors and editors. Thispaper introduces a novel algorithm for automation of contextual text correction using a LinguisticHabit Graph (LHG) also introduced in this paper. A specialist internet crawler hasbeen constructed for searching through web sites in order to build a Linguistic Habit Graphafter text corpuses gathered in polish web sites. The achieved correction results on a basis ofthis algorithm using this LHG were compared with commercial programs which also enableto make text correction: Microsoft Word 2007, Open Office Writer 3.0 and search engineGoogle. The achieved results of text correction were much better than correction made bythese commercial tools.

Downloads

Download data is not yet available.

Author Biographies

Marcin Gadamer, Akademia Górniczo-Hutnicza w Krakowie

Katedra Automatyki, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

Adrian Horzyk, Akademia Górniczo-Hutnicza w Krakowie

Katedra Automatyki, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki

References

Mykowiecka A.: Inzynieria lingwistyczna. Komputerowe przetwarzanie tekstów w jezyku naturalnym. Wydawnictwo Polsko-Japonskiej Wyzszej Szkoły Technik Komputerowych, 2007

Miró J., Rosselló F.: Czy w Unii Europejskiej mówiono po polsku?. Magazyn Delta, 05, 2004

Gawrysiak P.: Modelowanie jezyka. Politechnika Warszawska, 2006

Statistical Inference: n-gram Models over Sparse Data: http://mi007.wikispaces.com/file/view/rozdzial6.pdf, 2009

Debowski Ł.: Prawo Zipfa – próby objasnien. Instytut Podstaw Informatyki PAN, 2005

Microsoft Office Word 2007 2009: Opis programu Word.

http://office.microsoft.com/pl-pl/word/HA101650321045.aspx

OpenOffice.org Writer 2009: Opis programu. http://pl.openoffice.org/

Marciniak M.: MS Office kontra OpenOffice. PC Word 2000

KGLK Krakowska Grupa Lingwistyki Komputerowej: Słownik Frekwencyjny Jezyka Polskiego, 2009

Downloads

Published

2013-03-20

How to Cite

Gadamer, M., & Horzyk, A. (2013). AUTOMATIC CONTEXTUAL TEXT CORRECTION USING THE LINGUISTIC HABITS GRAPH LHG. Computer Science, 10(3), 37. https://doi.org/10.7494/csci.2009.10.3.37

Issue

Section

Articles