• українська
    • English
    • Deutsch
Institutional Digital Repository of National Aerospace University KHAI
  • українська 
    • українська
    • English
    • Deutsch
  • Ввійти
Перегляд матеріалів 
  •   Головна сторінка dKHAIIR
  • Факультет систем управління літальних апаратів (№ 3)
  • Наукові праці
  • Статті з наукових журналів та збірок
  • Перегляд матеріалів
  •   Головна сторінка dKHAIIR
  • Факультет систем управління літальних апаратів (№ 3)
  • Наукові праці
  • Статті з наукових журналів та збірок
  • Перегляд матеріалів
JavaScript is disabled for your browser. Some features of this site may not work without it.

Методы быстрого поиска похожих строк

Thumbnail
Переглянути
SidorRakov.pdf (383.2Kb)
Дата
2008
Автор
Сидоренко, А.Л.
Раков, С.А.
Кулик, А.С.
Чухрай, А.Г.
Завгородний, А.Ю.
Metadata
Показати повний опис матеріалу
Короткий опис(реферат)
Проблема обнаружения строк, не являющихся дубликатами, но представляющих одну сущность реального мира, часто встречается в системах повышения качества данных информационных систем. Такие похожие строки могут появляться в результате ошибок при вводе данных или использования аббревиатур. Исследуемая в работе проблема также тесно связана с проблемой слияния баз данных и является сложно решаемой, если требования высокой точности и скорости получения решения выдвигаются одновременно. В данной работе предлагаются два высокоточных метода поиска похожих строк для случаев, когда возможность использования аббревиатур может либо учитываться, либо нет. Показаны результаты применения методов на реальных данных, подтверждающие целесообразность их в системах повышения качества данных информационных систем.
 
Проблема виявлення рядків, які є дублікатами, але які мають одну сутність реального світу, часто зустрічається у системах підвищення якості даних інформаційних систем. Такі схожі рядки можуть з'являтися внаслідок помилок під час введення даних або використання абревіатур. Досліджувана в роботі проблема також тісно пов'язана з проблемою злиття баз даних і є складною, якщо вимоги високої точності та швидкості отримання рішення висуваються одночасно. У цій роботі пропонуються два високоточні методи пошуку схожих рядків для випадків, коли можливість використання абревіатур може або враховуватися, або ні. Показано результати застосування методів реальних даних, що підтверджують доцільність їх у системах підвищення якості даних інформаційних систем.
 
URI
http://dspace.library.khai.edu/xmlui/handle/123456789/3281
Collections
  • Статті з наукових журналів та збірок

DSpace software copyright © 2002-2016  DuraSpace
Контакти | Зворотній зв'язок
Theme by 
Atmire NV
 

 

Перегляд

Всі матеріалиФонди та колекціїЗа датою публікаціїАвториЗаголовкиТемиКолекціяЗа датою публікаціїАвториЗаголовкиТеми

Мій профіль

ВвійтиЗареєструватися

DSpace software copyright © 2002-2016  DuraSpace
Контакти | Зворотній зв'язок
Theme by 
Atmire NV