Syntactical method for reconstructing highly fragmented OOXML files
Abstract
This paper proposes a syntactical method for reconstructing OOXML documents based on knowledge about the internal structure of this file type, regardless of their content. The details of the implementation of the reconstruction algorithm and the peculiarities of restoring certain types of local elements of the document were considered. The efficiency of the algorithm was tested on the Govdocs1 and NapierOne datasets. У роботі пропонується синтаксичний метод реконструкції OOXML-документів, який базується на використанні знань про внутрішню структуру цього типу файлів незалежно від їх вмісту. Розглянуто деталі реалізації алгоритму відновлення та особливості відновлення окремих типів локальних елементів документу. Тестування ефективності алгоритму здійснювалося на наборах даних Govdocs1 і NapierOne.