Показать сокращенную информацию
Методы быстрого поиска похожих строк
dc.contributor.author | Сидоренко, А.Л. | |
dc.contributor.author | Раков, С.А. | |
dc.contributor.author | Кулик, А.С. | |
dc.contributor.author | Чухрай, А.Г. | |
dc.contributor.author | Завгородний, А.Ю. | |
dc.date.accessioned | 2022-12-15T09:00:18Z | |
dc.date.available | 2022-12-15T09:00:18Z | |
dc.date.issued | 2008 | |
dc.identifier.citation | Методы быстрого поиска похожих строк / А. Л. Сидоренко, С. А. Раков, А. С. Кулик [и др.] // Радіоелектронні і комп'ютерні системи. – 2008. – № 4. – С. 51–59. | uk_UA |
dc.identifier.issn | 1814-4225 | |
dc.identifier.uri | http://dspace.library.khai.edu/xmlui/handle/123456789/3281 | |
dc.description.abstract | Проблема обнаружения строк, не являющихся дубликатами, но представляющих одну сущность реального мира, часто встречается в системах повышения качества данных информационных систем. Такие похожие строки могут появляться в результате ошибок при вводе данных или использования аббревиатур. Исследуемая в работе проблема также тесно связана с проблемой слияния баз данных и является сложно решаемой, если требования высокой точности и скорости получения решения выдвигаются одновременно. В данной работе предлагаются два высокоточных метода поиска похожих строк для случаев, когда возможность использования аббревиатур может либо учитываться, либо нет. Показаны результаты применения методов на реальных данных, подтверждающие целесообразность их в системах повышения качества данных информационных систем. | uk_UA |
dc.description.abstract | Проблема виявлення рядків, які є дублікатами, але які мають одну сутність реального світу, часто зустрічається у системах підвищення якості даних інформаційних систем. Такі схожі рядки можуть з'являтися внаслідок помилок під час введення даних або використання абревіатур. Досліджувана в роботі проблема також тісно пов'язана з проблемою злиття баз даних і є складною, якщо вимоги високої точності та швидкості отримання рішення висуваються одночасно. У цій роботі пропонуються два високоточні методи пошуку схожих рядків для випадків, коли можливість використання абревіатур може або враховуватися, або ні. Показано результати застосування методів реальних даних, що підтверджують доцільність їх у системах підвищення якості даних інформаційних систем. | uk_UA |
dc.language.iso | ru | uk_UA |
dc.publisher | ХАІ | uk_UA |
dc.subject | информационная система | uk_UA |
dc.subject | радиоэлектронные и компьютерные системы | uk_UA |
dc.subject | строка | uk_UA |
dc.subject | поиск | uk_UA |
dc.subject | критерий похожести | uk_UA |
dc.subject | радіоелектронні і комп'ютерні системи | uk_UA |
dc.subject | інформаційна система | uk_UA |
dc.subject | рядок | uk_UA |
dc.subject | пошук | uk_UA |
dc.subject | критерій схожості | uk_UA |
dc.title | Методы быстрого поиска похожих строк | uk_UA |
dc.type | Article | uk_UA |