Наукові конференції, Научные конференции » Сучасність, наука, час. (18-20.11.13) » Корлюк О. С. КЛАСИФІКАТОР ВЕБ-СТОРІНОК З АДАПТАЦІЄЮ ПАРАМЕТРІВ

Корлюк О. С. КЛАСИФІКАТОР ВЕБ-СТОРІНОК З АДАПТАЦІЄЮ ПАРАМЕТРІВ

Категорія: Сучасність, наука, час. (18-20.11.13), Технічні науки

Корлюк Олександр Сергійович

м. н. с. Інституту кібернетики ім. В. М. Глушкова НАН України

КЛАСИФІКАТОР ВЕБ-СТОРІНОК З АДАПТАЦІЄЮ ПАРАМЕТРІВ

 

При роботі з великими об’ємами текстової інформації природною мовоюв автоматичному режимі, наприклад веб-сторінками, актуальні різні задачі обробки текстової інформації.Однією з розповсюджених задач є задача класифікації документів (веб-сторінок). Суть її полягає в тому, щоб визначити приналежністьелектронного документу до однієї або декількохкатегорій, базуючись на його змісті.

Веб-сайти,як повнотекстові документи, являють собою складний набір даних,в яких крім змістовного тексту наявна значна кількість службової інформації, яка можезначно знизити якість роботи класифікатора. Таким чином, попередня обробка інформації, а саме видалення службових тегів розмітки (мета-тегів), типових даних, таких як навігаційні блоки, має критичне значення при класифікації веб-сторінок. Виділення змістовної частини веб-документу досить складно формалізувати. Також перед обробкою документів необхідно застосувати алгоритми видалення часто вживаних слів та алгоритм приведення слів до початкової словоформи[1].

Розглянемо модель класифікатора повнотекстових документів на природній мові на прикладі вибірки веб-сторінок. Розроблена методика передбачає самоналаштування алгоритму в процесі його виконання засобами адаптації параметрів функцій Ляпунова[2].

 

Повний варіант тексту за посиланням Tezi-Korlyuk.doc [87,5 Kb] (cкачиваний: 3)

 

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Добавление комментария

Имя:*
E-Mail:
Коментар:
Введите код: *

Карта сайту

^