канд. філол. наук, Вялікова О. О. ТЕОРІЯ МОДЕЛЮВАННЯ ТЕКСТУ

канд. філол. наук, Вялікова О. О.

Київський національний лінгвістичний університет , Україна, Київ

ТЕОРІЯ МОДЕЛЮВАННЯ ТЕКСТУ

 

При опрацюванні практичних задач обробки текстової інформації виявилося, що комп’ютер не може вирішувати їх повністю, оскільки немає формалізованих моделей природномовних об’єктів, а розв’язання відповідних завдань містить неформальні, творчі елементи, властиві лише людині [5, с. 1].

Ще у структуралізмі, починаючи з робіт Ф. де Соссюра, вирують ідеї формалізації мови. На теренах структуралізму формується математична лінгвістика, яка має на меті виведення математичних формул аналізу мови для більш точного, спрощеного та логічного опису структури живої мови. Це змусило вчених звернутися до поняття моделі.

Л. А. Алексієнко наголошує, що у зв’язку з тим, що модель – поняття загальнонаукове, використовуване в математичних, природничих, соціальних і гуманітарних науках, воно набуло різних значень (близько 30 різних дефініцій) [2]. Те, що у сучасній лінгвістиці називається терміном “модель”, раніше називалося “теорія”. Зараз вважається, що модель – це така теорія, яка достатньо повно викладена й формалізована (в ідеалі будь-яка модель повинна допускати комп'ютерну реалізацію) [13, с. 4]. В різних науках доводиться мати справу з різними моделями тих або інших процесів або об’єктів дослідження цих наук [9, с. 35]. З точки зору математичної лінгвістики [8, с. 302] шляхом побудови синтезувальних (породжувальних, дедуктивних) й аналітичних (індуктив¬них) математичних моделей виявляють і вивчають властивості відношення одиниць дослід¬жуваної знакової системи. Прикладна лінгвістика намагається будувати моделі, що відображають конкретні лінгвістичні об’єкти, їх системи, а також процеси мовленнєво-мислетворчої діяльності людини [9, с. 36]. У прикладній лінгвістиці модель об'єкта – це опис об'єкта, який показує його якості, це спрощений варіант реального або вигаданого об'єкту, тобто модель – це засіб представлення знань [13, с. 5]. У структурній лінгвістиці моделлю об’єкта, для якого суттєвими є тільки його функціональні властивості, має вважатися будь-яка побудова, функціонально схожа на нього [3, с. 79]. Загальна лінгвістика [6, с. 26] визначає модель як об’єкт, спеціально побудований дослідником з метою пізнання того або іншого фрагмента дійсності, тобто об’єкта-оригінала. Аналізуючи розуміння моделі від широко до вузького трактування, В. М. Томашевський синтезує визначення моделі як абстракції системи, що відображає деякі її властивості [12, с. 21-22].

Будь-яка модель, у тому числі лінгвістична, має бути формальною [3, с. 88]. Модель вважається формальною, якщо в неї явно і однозначно задані вихідні об’єкти, твердження, що їх пов’язують, та правила поводження з ними (правила створення та виділення нових об’єктів і тверджень) [там само]. У системному аналізі формальна модель – це математична залежність між величинами у вигляді формули, рівняння, системи рівнянь [7]. Формалізація, тобто переклад описової моделі на формальну, математичну мову, передбачає звертання до математичних методів. Використання математичних методів у лінгвістиці має на меті замінити зазвичай дифузну, інтуїтивно сформульовану лінгвістичну задачу, яка не має повного рішення, однією або декількома простішими, логічно сформульованими математичними задачами, які мають алгоритмічне рішення [10, с. 7].

Моделювання дозволяє перенести особливості побудови моделі на об’єкт, оскільки вона (модель) повторює поведінку об’єкту моделювання та його структуру. Моделюються ті характеристики лінгвістичного об’єкту, які пов’язані зі структурною його організацією [13, с. 6].

Якщо визнати, що найважливішим для прикладного використання лінгвістичних знань є оптимізація, тоді оптимізується, тобто моделюється, такий мовний компонент, який потрібен для вирішення конкретної поставленої проблеми, а модель як результат представлення конкретного мовного компонента виявляється тільки одним з етапів прикладного опису, повна схема якого за Барановим А. М. виглядає так: 1) складання технічного завдання; 2) аналіз проблемної області; 3) вибір засобів опису проблемної області; 4) моделювання проблемної області; 5) верифікація результату [13, с. 7].

Спеціальні методи моделювання систем, запропоновані О. А. Біловодською і О. Ф. Грищенко включають імітаційне моделювання, імітаційне динамічне моделювання, ситуаційне моделювання та структурно-лінгвістичне моделювання [7].

За О. Д. Шараповим, математичне моделювання включає імітаційне, інформаційне, структурне, ситуаційне моделювання тощо [14].

Конструювання моделі, як вважає Н. М. Філіппова, – це не тільки один із засобів відображення мовних явищ і процесів, але й об’єктивний практичний критерій перевірки (верифікації) правильності наших знань про мову. Таким чином, лінгвістичне моделювання – це засіб поглиблення пізнання механізмів мовленнєвої діяльності для повного розкриття суті мови [13, с. 4].

Системність і структурність мови дозволяють стверджувати, що у мовній системі можливе моделювання [13, с. 5]. Природний світ відображається у мові і моделюється тільки тоді, коли він представлений у вигляді текстів [там само]. Текст є первиною даністю усього гуманітарно-філософського мислення і є тією безпосередньою дійсністю, з якої тільки-но і можна виходити [4, с. 99]. Він може розглядатися як певна модель складного закінченого цілого і як конкретна реалізація даної моделі залежно від задачі дослідження [там само]. Досліджуючи моделювання літературного тексту, В. А. Сулімов пише, що літературний текст – це єдиний відомий спосіб інтелектуальної бутності людини [11, с. 73].

Найбільші можливості і найвищу якість аналізу тексту можна отримати по проведенню його повного аналізу. Однак складності, що виникають при створенні подібного аналізу такі, що на практиці досі не реалізовані всі теоретичні положення, розроблені на даний момент [1, с. 106]. Для повноцінної роботи система аналізу тексту повинна мати можливість проаналізувати текст, поданий користувачем на вхід, з точки зору синтаксису (структура речень), семантики (поняття, що використовуються у тексті) і прагматики (правильність використання понять та цілей їх вживання) [там само]. Частково таку проблему вирішує послідовність графематичного, морфологічного, синтаксичного та семантичного аналізів [1, с. 106-107], проте не всі типи тексту їм підлягають. Зокрема, графематичний аналіз як перший етап автоматичної обробки тексту виявляється неможливим у креолізованому типі тексту, де вербальна складова невід’ємна від невербальної, а невербальна сприймається як монолітний малюнок. Таким чином, моделювання окремих типів тексту, таких як креолізованний текст, може зняти проблему його структурного аналізу та наблизити до вирішення таких завдань прикладної лінгвістики як розпізнавання та автоматична обробка тексту.

 

Література:

1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е. И., Клышинский Э. С., Ландэ Д. В., Носков А. А., Пескова О. В., Ягунова Е. В. – М. : МИЭМ, 2011. – 272 с.

2. Алексієнко Л. А. Лінгвістичне моделювання: Спецсемінар. [Електронний ресурс] / Л. А. Алексієнко. – Режим доступу : http://linguist.univ.kiev.ua/courses_models.htm

3. Апресян Ю. Д. Идеи и методы современной структурной лингвистики / Юрий Дереникович Апресян. – М. : Просвещение, 1966. – 305 с.

4. Богуславская В. В. Особенности моделирования текста средств массовой коммуникации и информации / В. В. Богуславская // Вестник Воронежского государственного университета. Серия Филология. Журналистика. – 2004. – № 1. – С. 70-81.

5. Вавіленкова А. І. Методи та алгоритми автоматизованого формування логіко-лінгвістичних моделей текстової інформації : автореф. дис.... канд. філол. наук : спец. 05.13.06 “Інформаційні технології” / Анастасія Ігорівна Вавіленкова. – К., 2010. – 19 с.

6. Касевич В. Б. Элементы общей лингвистики / Вадим Борисович Касевич. – М. : Наука, 1977. – 183 с.

7. Конспект лекцій з дисципліни “Системний аналіз і прийняття інноваційних рішень” / укладачі: О. А. Біловодська, О. Ф. Грищенко. – Суми: Сумський державний університет, 2010. – 106 с.

8. Перебийніс В. С. Математична лінгвістика / В. С. Перебийніс // Українська мова : Енциклопедія. – К. : Українська енциклопедія ім. М. П. Бажана, 2000. – С. 302–303.

9. Пиотровский Р. Г. Математическая лингвистика. Учеб. пособие для пед. институтов / Р. Г. Пиотровский, К. Б. Бектаев, А. А. Пиотровская. – М. : Высшая школа, 1977. – 383 с.

10. Соснина Е. П. Введение в прикладную лингвистику : учебное пособие / Екатерина Петровна Соснина. – 2-е изд., испр. и доп. – Ульяновск : УлГТУ, 2012. – 110 с.

11. Сулимов В. А. Моделирование литературных текстов: от континуального знака к лингвосемиотическим конфигурациям / В. А. Сулимов // Вестник международной академии наук (русская секция). –№ 2. – М., 2008. – С. 70–75.

12. Томашевський В. М. Моделювання систем / Валентин Миколайович Томашевський. – К. : Видавнича група BHV, 2005. – 352 с.

13. Філіппова Н. М. Вступ до прикладної лінгвістики: Моделювання у мові: Навчальний посібник / Ніна Михайлівна Філіппова. – Миколаїв : НУК, 2004. – 36 с.

14. Шарапов О. Д. Системний аналіз: Навч.-метод. посібник для самост. вивч. дисц. / О. Д. Шарапов, В. Д. Дербенцев, Д. Э. Семьонов. – К. : КНЕУ, 2003. – 154 с.

Site search

Конференции

Please publish modules in offcanvas position.