Порівняльний аналіз алгоритмів машинного навчання для систем прогнозування серцево-судинних захво- рювань

Волокита, А. Герега, Б. 2022
dc.description.abstract Серцево-судиннi захворювання щорiчно вбивають близько 20,5 мiльйонiв людей. Раннє виявлення захворювання може допомогти людям змiнити свiй спосiб життя та забезпечити належне медичне лiкування. У роботi предста вленi рiзнi атрибути, пов’язанi з хворобами серця, та модель на основi таких алгоритмiв навчання: Logistic Regression, K-nearest neighbors, Support Vector Machine, Decision Tree Classifier, Random Forest Classifier та XGBoost Classifier. Модель використовує набiр даних iз Клiвлендської бази даних UCI для пацiєнтiв iз серцевими захворюваннями. Набiр даних мiстить 303 екземпляри та 76 атрибутiв. З цих 76 атрибутiв лише 14 атрибутiв розглядаються для тестування, що важливо для обґрунтування продуктивностi рiзних алгоритмiв. Результати показують, що найвищий бал точностi досягається з алгоритмом Support Vector Machine. Ця дослідницька робота має на метi продемонструвати ймовiрнiсть розвитку серцевих захворювань у пацiєнтiв використовуючи рiзнi алгоритми машинного навчання. uk_UA
dc.title Порівняльний аналіз алгоритмів машинного навчання для систем прогнозування серцево-судинних захво- рювань uk_UA
dc.title.alternative Comparative analysis of machine learning algorithms for cardiovascular diseases prediction systems uk_UA
dc.description.abstractalt1 Every year, around 20.5 million people die from cardiovascular disorders. People who are diagnosed with the disease early can alter their lifestyles and receive appropriate medical care. A model based on the learning algorithms Logistic Regression, K-nearest Neighbors, Support Vector Machine, Decision Tree Classifier, Random Forest Classifier, and XGBoost is presented in the paper along with various heart disease-related attributes. The Cleveland UCI database of heart disease patients is used in the model. There are 303 instances and 76 attributes in the data set. Only 14 of these 76 attributes—which are crucial to justifying the effectiveness of various algorithms—are taken into account during testing. The main contribution of this research work is the implementation of an intuitively understandable system of medical forecasts for the diagnosis of heart diseases using modern methods of machine learning. Algorithms used for predicting heart diseases are discussed in this work, and a comparison is made between existing systems. Six classification methods were used: Logistic Regression, K-nearest neighbors, Support Vector Machine, Decision Tree Classifier, Random Forest Classifier and XGBoost Classifier. 14 attributes were used to predict cardiovascular disease, which is a much better solution than using 5 or 10, as was the case in the reviewed papers. To ensure high accuracy, hyperparameters were adjusted for each classifier. As a result, good performance was obtained. In this work, the SVM classifier proved to be the most effective, providing an accuracy of 87.91 % on the test set. It was possible to achieve greater accuracy than in the studied works. uk_UA

