Показать сокращенную информацию

dc.contributor.authorСидоренко, А.Л.
dc.contributor.authorРаков, С.А.
dc.contributor.authorКулик, А.С.
dc.contributor.authorЧухрай, А.Г.
dc.contributor.authorЗавгородний, А.Ю.
dc.date.accessioned2022-12-15T09:00:18Z
dc.date.available2022-12-15T09:00:18Z
dc.date.issued2008
dc.identifier.citationМетоды быстрого поиска похожих строк / А. Л. Сидоренко, С. А. Раков, А. С. Кулик [и др.] // Радіоелектронні і комп'ютерні системи. – 2008. – № 4. – С. 51–59.uk_UA
dc.identifier.issn1814-4225
dc.identifier.urihttp://dspace.library.khai.edu/xmlui/handle/123456789/3281
dc.description.abstractПроблема обнаружения строк, не являющихся дубликатами, но представляющих одну сущность реального мира, часто встречается в системах повышения качества данных информационных систем. Такие похожие строки могут появляться в результате ошибок при вводе данных или использования аббревиатур. Исследуемая в работе проблема также тесно связана с проблемой слияния баз данных и является сложно решаемой, если требования высокой точности и скорости получения решения выдвигаются одновременно. В данной работе предлагаются два высокоточных метода поиска похожих строк для случаев, когда возможность использования аббревиатур может либо учитываться, либо нет. Показаны результаты применения методов на реальных данных, подтверждающие целесообразность их в системах повышения качества данных информационных систем.uk_UA
dc.description.abstractПроблема виявлення рядків, які є дублікатами, але які мають одну сутність реального світу, часто зустрічається у системах підвищення якості даних інформаційних систем. Такі схожі рядки можуть з'являтися внаслідок помилок під час введення даних або використання абревіатур. Досліджувана в роботі проблема також тісно пов'язана з проблемою злиття баз даних і є складною, якщо вимоги високої точності та швидкості отримання рішення висуваються одночасно. У цій роботі пропонуються два високоточні методи пошуку схожих рядків для випадків, коли можливість використання абревіатур може або враховуватися, або ні. Показано результати застосування методів реальних даних, що підтверджують доцільність їх у системах підвищення якості даних інформаційних систем.uk_UA
dc.language.isoruuk_UA
dc.publisherХАІuk_UA
dc.subjectинформационная системаuk_UA
dc.subjectрадиоэлектронные и компьютерные системыuk_UA
dc.subjectстрокаuk_UA
dc.subjectпоискuk_UA
dc.subjectкритерий похожестиuk_UA
dc.subjectрадіоелектронні і комп'ютерні системиuk_UA
dc.subjectінформаційна системаuk_UA
dc.subjectрядокuk_UA
dc.subjectпошукuk_UA
dc.subjectкритерій схожостіuk_UA
dc.titleМетоды быстрого поиска похожих строкuk_UA
dc.typeArticleuk_UA


Файлы в этом документе

Thumbnail

Данный элемент включен в следующие коллекции

Показать сокращенную информацию