Формалізація дедуктивних правил синтаксично-семантичних трансформацій у системі побудови онтології з текстових документів
Ключові слова:
побудова онтологій, дедуктивні правила, синтаксично-семантична трансформація, графова база даних, обробка природної мови, видобування знань, процес ETL, рефлексивний аналіз, правило-орієнтований підхідАнотація
В роботі представлено нову концептуальну структуру для формалізації та збереження дедуктивних правил, які визначають синтаксично-семантичні трансформації в автоматизованому процесі побудови онтологій на основі текстових даних. Оскільки неструктуровані тексти залишаються домінуючим джерелом інформації в сучасному цифровому середовищі, їх перетворення у структуровані, машиночитні знання є критично важливим для розвитку інтелектуальних систем. Використовуючи підхід, заснований на правилах і формалізованих лінгвістичних та логічних уявленнях, ми підкреслюємо його переваги у точності, інтерпретованості та адаптивності при вилученні онтологічних знань. У роботі запропоновано графову абстракцію для представлення правил трансформації та їх збереження в графових базах даних, що забезпечує ефективний пошук шаблонів, динамічне управління правилами та рефлексивний аналіз для постійної оптимізації. Моделювання таких трансформацій як процесів ETL (Extract, Transform, Load) дозволяє чітко структурувати етапи оцінювання та вдосконалення наборів правил. Запропонований підхід реалізовано на платформі CROCUS, яка поєднує синтаксичний аналіз на основі Stanford CoreNLP з семантичним збереженням у базі даних Apache Jena Fuseki. Результати експериментів демонструють практичну ефективність методу у контексті розвитку інтелектуальних агентів завдяки формалізації правил, яка є водночас надійною та прозорою.