Демчук Л. Ю. ДОСЛІДЖЕННЯ МЕТОДІВ КРИТЕРІАЛЬНОГО ГРУПУВАННЯ В ЗАДАЧАХ КЛАСТЕРИЗАЦІЇ ДАНИХ ПАЦІЄНТІВ

Print

УДК 004.93'14

 

ДОСЛІДЖЕННЯ МЕТОДІВ КРИТЕРІАЛЬНОГО ГРУПУВАННЯ В ЗАДАЧАХ КЛАСТЕРИЗАЦІЇ ДАНИХ ПАЦІЄНТІВ

Демчук Л. Ю.

Національний технічний університет України «КПІ», Україна, м. Київ

 

У статті проведено аналіз існуючих методів критеріального групування в контексті задачі кластеризації даних пацієнтів, де у якості навчальної вибірки обрано БД пацієнтів. Запропоновано підхід до вирішення задачі кластеризації даних пацієнтів, а також наведено методику для оцінки точності роботи методів кластеризації.

Ключові слова: кластеризація, методи кластеризації, вибірка.

 

Демчук Л. Ю. Исследование методов критериальной группировки в задачах кластеризации данных пациентов/ Национальный технический университет Украины «КПИ», г. Киев

В статье проведен анализ существующих методов критериальной группировки в контексте задачи кластеризации данных пациентов, где в качестве обучающей выборки - БД пациентов. Предложен подход к решению задачи кластеризации данных пациентов, а также приведена методика для оценки точности работы методов кластеризации.

Ключевые слова: кластеризация, методы кластеризации, выборка.

 

Demchuk L. U. Researching methods of criterion grouping in patient data problems/ National Technical University of Ukraine "KPI", Kiev

The article analyzes the existing methods of grouping criterion in the context of clustering of these patients, where the training samples - a database of patients. An approach to solving the problem of clustering of these patients, as well as the technique for evaluating the accuracy of the clustering methods.

Key words: clustering, clustering methods, sampling.

 

Вступ

На даний час глобальний процес автоматизації зачепив практично всі сфери людської діяльності. Сучасні інформаційні технології дозволяють накопичувати досить велику кількість інформації, що є характерним, зокрема і для медичних закладів.

Дані про стан пацієнтів накопичуються роками та досить часто є різнорідними(невпорядкованими). Виникає необхідність отримання корисної інформації з такого набору даних. На сьогоднішній день досить відомою технологією аналізу даних є Data mining.

Data mining – це процес виявлення у необроблених даних раніше невідомих нетривіальних, практично корисних і доступних інтерпретацій знань, необхідних для прийняття рішень у різних сферах діяльності. Однією із задач, які вирішує Data mining є кластеризація - процес, що дозволяє групувати деякий набір об’єктів за схожим набором параметрів[1].

На разі існує велика кількість алгоритмів кластеризації, які відрізняються набором вхідних параметрів і в залежності від обраних параметрів результати кластеризації можуть відрізнятись. Оцінка результату кластеризації, у випадку, коли дані багато розмірні, є доволі складною задачею, яка потребує використання певної методики оцінки результатів кластеризації.

 

Повний текст статті за посиланням Stattya_Demchuk.doc

Tags: