Формування Масиву Вхідних Даних для Класифікації Друкованих Текстів в Технології Багаторівневого Інтелектуального Моніторингу
Ключові слова:
класифікація, текст, модель, МГУААнотація
В роботі описано процес розв’язання однієї із задач інтелектуального аналізу даних - класифікації текстових повідомлень. Подані результати досліджень процесу перетворення друкованого тексту до типової форми масиву вхідних даних синтезатора моделей. Синтезатор моделей є елементом моніторингової інтелектуальної системи. Він використовується для синтезу моделейкласифікаторів. Вони дозволяють згрупувати тексти за заданими вимогами. За кількістю вірно класифікованих текстів оцінюють ефективність результатів удосконалення процесу формування ознак та побудови точок спостереження. Запропоновано використати в якості показника інформативності ознаки ймовірність її викоирстання у окремому вікні тексту. Експериментально підтверджено доцільність використання такого показника інформативності ознаки.