ISSN 2415-363X

Показати скорочений опис матеріалу

dc.contributor.author Фоменко, В. А.
dc.contributor.author Луцький, Г. М.
dc.contributor.author Регіда, П. Г.
dc.contributor.author Волокита, А. М.
dc.date.accessioned 2015-09-22T12:38:53Z
dc.date.accessioned 2018-02-25T12:59:25Z
dc.date.available 2015-09-22T12:38:53Z
dc.date.available 2018-02-25T12:59:25Z
dc.date.issued 2017
dc.identifier.uri http://ir.stu.cn.ua/123456789/15832
dc.description Fomenko, Volodymyr Thematic texts generation issues based on recurrent neural networks and word2vec / Volodymyr Fomenko, Heorhii Loutskii, Pavlo Rehida, Artem Volokyta // Технічні науки та технології. – 2017. – № 4 (10). – C. 110-115. en_US
dc.description.abstract Urgency of the research. The problem of natural language generation is becoming more actual in recent days due to the growing demand for automated generation of object descriptions, article excerpts, news summaries, passages in microblogging services, response messages used by chat bots, etc. Thus, the problem is to generate a text given the context. This paper deals with the problem of generating text specifically in Russian since each language group requires an individual approach. Target setting. There is no method to generate thematic texts automatically, especially in Russian language, that gives well-interpreted and suitable results. Actual scientific researches and issues analysis. In the past few years, more articles have been devoted to the topic of generating thematic texts, due to the emergence of new methods for sequences generation using recurrent neural networks. However, approaches related specifically to thematic texts generations, in Russian are insufficiently explored. Uninvestigated parts of general matters defining. This article focuses on a study and analysis of the proposed approach for generating Russian-language thematic texts. It is specialized in one language group and specific approach in terms of model selection. The research objective. Create model trained on a group of short passages that identifies a context of a text and as output generates a well-interpreted natural text in Russian. The statement of basic materials. The analysis of the joint use of the RNN and word2vec models is conducted. Approaches for the transformation of the input text, analysis of sentences structure, prediction of subsequent parts of speech, prediction of following words and the general model structures are proposed. The results of the models are appeared to be well interpreted and meaningful. Conclusions. The iinterpretability, structure and parameters of the models that showed the best results for the generation were analyzed. The approach proved to be good for generating thematic texts. The results and analysis of the subsequent steps are given. en_US
dc.language.iso en en_US
dc.publisher Чернігів: ЧНТУ en_US
dc.relation.ispartofseries Технічні науки та технології; № 4 (10)
dc.subject генерація тексту en_US
dc.subject рекурентні нейронні мережі en_US
dc.subject довга короткочасна пам’ять en_US
dc.subject word2vec en_US
dc.subject text generation en_US
dc.subject recurrent neural networks en_US
dc.subject long short-term memory en_US
dc.subject word2vec en_US
dc.subject генерация текста en_US
dc.subject рекуррентные нейронные сети en_US
dc.subject долгая краткосрочная память en_US
dc.subject word2vec en_US
dc.title Thematic texts generation issues based on recurrent neural networks and word2vec en_US
dc.title.alternative Питання генерації тематичних текстів на основі рекурентних нейронних мереж та word2vec en_US
dc.title.alternative Вопросы генерации тематических текстов на основе рекуррентных нейронных сетей и word2vec en_US
dc.type Article en_US
dc.description.abstractalt1 Актуальність теми дослідження. Проблема генерації текстів стає більш актуальною в останні дні у зв’язку зі зростаючим попитом на автоматичне створення описів об’єктів, уривків статей, підсумків новин, повідомлень у службах мікроблогів, відповідей чат-ботів тощо. Таким чином, проблемою є створення текстів, що відповідають заданій тематиці. Ця робота присвячена проблемі генерації текстів саме російською мовою, оскільки кожна мовна група вимагає індивідуального підходу. Постановка проблеми. Відсутність добре інтерпретованого методу для автоматичного створення російськомовних тематичних текстів за допомогою рекурентних нейронних мереж. Аналіз останніх досліджень і публікацій. Протягом останніх років з’являється все більше статей, присвячених генерації тематичних текстів, зокрема, завдяки появі нових методів генерації послідовностей з використанням рекурентних нейронних мереж. Проте підходи специфічні для генерації тематичних текстів, особливо російською мовою, все ще недостатньо вивчені. Виділення не вирішених раніше частин загальної проблеми. Стаття присвячена вивченню та аналізу запропонованого підходу для генерації тематичних текстів, зокрема написаних російською мовою. Дослідження сфокусовано на вивченні застосування рекурентних нейронних мереж та word2vec. Постановка завдання. Завданням є створити модель, натреновану на групі уривків російськомовних статей, що навчиться визначати контекст тексту, і як результат видавати добре інтерпретований текст за тією ж самою тематикою. Виклад основного матеріалу. Проведено аналіз спільного використання моделей RNN та word2vec. Описано підходи для обробки вхідного тексту, аналізу структури речень, прогнозування наступних частин мови, прогнозування наступних слів та структури відповідних моделей. Результати виявились добре інтерпретованими та змістовними. Висновки. Проаналізовано зміст, структуру та параметри моделей, які показали найкращі результати для генерації текстів. Підхід показав себе добре для створення тематичних текстів. Наведені результати експериментів та аналіз наступних кроків. en_US
dc.description.abstractalt2 В статье рассматривается вопрос генерации псевдослучайных текстов на заданную тематику. Для генерации текстов используются рекуррентные нейронные сети (LSTM) с предварительной обработкой слов с помощью модели word2vec. Тема текста задается с помощью набора ключевых слов. Модели тренируются на наборе русскоязычных статей. en_US


Долучені файли

Даний матеріал зустрічається у наступних розділах

Показати скорочений опис матеріалу