IRChNUT
Електронний архів Національного університету "Чернігівська політехніка"

Исследование детерминированных регулярных выражений с использованием структуры данных xml-типа

ISSN 2415-363X

Показати скорочений опис матеріалу

dc.contributor.author Бабич, Ю. И.
dc.contributor.author Бабич, Н. И.
dc.contributor.author Павлышко, Е. Г.
dc.contributor.author Наконечная, В. И.
dc.date.accessioned 2021-02-16T07:45:06Z
dc.date.available 2021-02-16T07:45:06Z
dc.date.issued 2020
dc.identifier.uri http://ir.stu.cn.ua/123456789/21273
dc.description Бабич, Ю. И. Исследование детерминированных регулярных выражений с использованием структуры данных XML-типа / Ю. И. Бабич, Н. И. Бабич, Е. Г. Павлышко, В. И. Наконечная // Технічні науки та технології. - 2020. - № 2 (20). - С. 167-174. en_US
dc.description.abstract Актуальность темы исследования. В данной статье проведён глубокий анализ большого набора данных с помощью поисковых систем и хостинговых платформ. Использованы четыре стратегии сбора данных: анализ поисковой системы Google, сканирование адресного пути, анализ веб-сайтов, поиск потенциальных данных для получения большего количества файлов-схем из сети Интернет. Получил дальнейшее практическое исследование набор данных для изучения детерминированных регулярных выражений. Постановка проблемы. Современные языки описания структур данных XML-типа требуют применение детерминированных регулярных выражений, позволяющих считывать строки посимвольно. Поэтому исследование данных выражений позволит ускорить процесс обработки данных и получить более точный результат. Анализ последних исследований и публикаций. Проведённый анализ современных литературных источников и публикаций на данную тематику показал, что большинство из них используют небольшие объёмы данных, что является недостаточным для проведения эффективного анализа. Выделение неисследованных частей общей проблемы. Для эффективного анализ данных из сети Интернет был использован большой набор данных и четыре стратегии его сбора и анализа. Целью написания данной статьи является исследование детерминированных регулярных выражений, которые всё чаще применяются в структурах данных XML- типа. Изложение основного материала. Разработка четырёх стратегий сбора данных в сети Интернет дала возможность получить больше XML-схем, что в 35 раз больше, чем в ранее проведённых исследованиях. Применение детерминированных регулярных выражений в целом и их подклассов для анализа больших наборов данных. Выводы в соответствии со статьей. Впервые применены детерминированные регулярные выражения с использованием структуры данных XML- типа. Получен большой объём данных – 276371 файлов с помощью четырёх стратегий их сбора. en_US
dc.language.iso ru en_US
dc.publisher Чернігів: ЧНТУ en_US
dc.relation.ispartofseries 2;(20)
dc.subject набор данных en_US
dc.subject регулярные выражения en_US
dc.subject детерминированные регулярные выражения en_US
dc.subject XML-тип en_US
dc.subject data set en_US
dc.subject regular expressions en_US
dc.subject deterministic regular expressions en_US
dc.subject XML type en_US
dc.title Исследование детерминированных регулярных выражений с использованием структуры данных xml-типа en_US
dc.title.alternative Researching of determined regular expressions using the xml type data structure en_US
dc.type Article en_US
dc.description.abstractalt1 Urgency of the research. This article provides an in-depth analysis of a large data set using search engines and hosting platforms. Four data collection strategies analysis of the Google search engine, scanning of the address path, analysis of websites, searching for potential data were used to obtain more diagram files from the Internet. A data set for studying deterministic regular expressions received further practical research. Target setting. Modern XML-type data structure description languages require deterministic regular expressions to read lines character by character. Therefore, the study of these expressions will speed up the data processing and get a more accurate result. Actual scientific researches and issues analysis. The analysis of modern literary sources and publications on this topic showed that most of them use small amounts of data, which is insufficient to conduct an effective analysis. Uninvestigated parts of general matters defining. For effective analysis of data from the Internet, a large data set and four strategies for its collection and analysis were used. The research objective of this article is to study deterministic regular expressions, which are increasingly used in XMLtype data structures. The statement of basic materials. The development of four strategies for collecting data on the Internet made it possible to get more XML-schemes, which is 35 times more than in previous studies. The use of deterministic regular expressions in general and their subclasses for the analysis of large data sets. Conclusions. For the first time, deterministic regular expressions are applied using an XML-type data structure. A large amount of data was obtained - 276371 files using four strategies for their collection. en_US


Долучені файли

Даний матеріал зустрічається у наступних розділах

Показати скорочений опис матеріалу