Нечеткий поиск похожих строк в системах повышения качества данных автоматизированных систем организационного управления

Кулик, А.С.; Чухрай, А.Г.; Завгородний, А.Ю.

View/Open

KulikChu.pdf (314.4Kb)

Date

2006

Author

Кулик, А.С.

Чухрай, А.Г.

Завгородний, А.Ю.

Metadata

Show full item record

Abstract

Проблема обнаружения дублирующейся информации часто встречается в системах повышения качества данных информационных систем. В работе предлагается новый критерий похожести двух строк, учитывающий возможность использования оператором аббревиатур и сокращений. На базе такого критерия разработаны эффективные методы поиска похожих строк. На основании данных о штатных должностях университета «ХАИ» проведены вычислительные эксперименты, показавшие высокое быстродействие предложенных методов.

Проблема виявлення інформації, що дублюється, часто зустрічається в системах підвищення якості даних інформаційних систем. У роботі пропонується новий критерій схожості двох рядків, що враховує можливість використання оператором абревіатур та скорочень. На основі такого критерію розроблено ефективні методи пошуку схожих рядків. На підставі даних про штатні посади університету «ХАІ» проведено обчислювальні експерименти, що показали високу швидкодію запропонованих методів.

URI

http://dspace.library.khai.edu/xmlui/handle/123456789/3119

Collections

Статті з наукових журналів та збірок