Застосування алгоритму інтелектуального пошуку дезінформації до набору даних україномовних новин
Ключові слова:
disinformation, dataset, intelligent search for disinformation, detection of fakes and propaganda, accuracyАнотація
У статті аналізуються найпоширеніші відкриті набори даних, що використовуються для виявлення фейкових новин, дезінформації та пропаганди, включаючи LIAR, FakeNewsNet, Fakeddit, WELFake, FANG-COVID, PHEME, а також нові корпуси, орієнтовані на іспанський та італійський контекст. Особлива увага приділяється створенню україномовного набору даних, що містить понад 2000 записів, з метаданими та інформацією для верифікації. Представлено алгоритм інтелектуального пошуку дезінформації та виявлення ознак неавтентичної поведінки користувачів соціальних мереж. Результати можуть бути використані для розробки моделей машинного навчання та вивчення механізмів поширення фейкових новин.