• українська
    • English
    • Deutsch
Institutional Digital Repository of National Aerospace University KHAI
  • Deutsch 
    • українська
    • English
    • Deutsch
  • Einloggen
Dokumentanzeige 
  •   DSpace Startseite
  • Факультет систем управління літальних апаратів (№ 3)
  • Наукові праці
  • Статті з наукових журналів та збірок
  • Dokumentanzeige
  •   DSpace Startseite
  • Факультет систем управління літальних апаратів (№ 3)
  • Наукові праці
  • Статті з наукових журналів та збірок
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Методы быстрого поиска похожих строк

Thumbnail
Öffnen
SidorRakov.pdf (383.2Kb)
Datum
2008
Autor
Сидоренко, А.Л.
Раков, С.А.
Кулик, А.С.
Чухрай, А.Г.
Завгородний, А.Ю.
Metadata
Zur Langanzeige
Zusammenfassung
Проблема обнаружения строк, не являющихся дубликатами, но представляющих одну сущность реального мира, часто встречается в системах повышения качества данных информационных систем. Такие похожие строки могут появляться в результате ошибок при вводе данных или использования аббревиатур. Исследуемая в работе проблема также тесно связана с проблемой слияния баз данных и является сложно решаемой, если требования высокой точности и скорости получения решения выдвигаются одновременно. В данной работе предлагаются два высокоточных метода поиска похожих строк для случаев, когда возможность использования аббревиатур может либо учитываться, либо нет. Показаны результаты применения методов на реальных данных, подтверждающие целесообразность их в системах повышения качества данных информационных систем.
 
Проблема виявлення рядків, які є дублікатами, але які мають одну сутність реального світу, часто зустрічається у системах підвищення якості даних інформаційних систем. Такі схожі рядки можуть з'являтися внаслідок помилок під час введення даних або використання абревіатур. Досліджувана в роботі проблема також тісно пов'язана з проблемою злиття баз даних і є складною, якщо вимоги високої точності та швидкості отримання рішення висуваються одночасно. У цій роботі пропонуються два високоточні методи пошуку схожих рядків для випадків, коли можливість використання абревіатур може або враховуватися, або ні. Показано результати застосування методів реальних даних, що підтверджують доцільність їх у системах підвищення якості даних інформаційних систем.
 
URI
http://dspace.library.khai.edu/xmlui/handle/123456789/3281
Collections
  • Статті з наукових журналів та збірок

DSpace software copyright © 2002-2016  DuraSpace
Kontakt | Feedback abschicken
Theme by 
Atmire NV
 

 

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelnSchlagwortenDiese SammlungErscheinungsdatumAutorenTitelnSchlagworten

Mein Benutzerkonto

EinloggenRegistrieren

DSpace software copyright © 2002-2016  DuraSpace
Kontakt | Feedback abschicken
Theme by 
Atmire NV