3 структурная, прикладная и математическая лингвистика УДК: 004.81+004.82+004.912 DOi 10.30837/ bi.2020.2(95).01 В. А. Широков Український мовно-інформаційний фонд НАН України, Київ vshirokov48@gmail.com М. В. Надутенко Український мовно-інформаційний фонд НАН України, Київ maxkrb@gmail.com О. Є. Стрижак Національний центр «Мала академія наук України», Київ sae953@gmail.com С. С. Ющенко Український мовно-інформаційний фонд НАН України, Київ Yuschenko_Svetlana@i.ua ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА У статті обґрунтовано застосування інтелектуальних когнітивних комп’ютерних технологій в логіко- лінгвістичних дослідженнях законодавства України на прикладі проведеного авторами комплексного логіко- лінгвістичного дослідження Закону України «Про особливу процедуру усунення Президента України з посту (імпічмент)» № 39-IX від 10 вересня 2019 року на авторських програмних інструментах – Системі аналізу текстів та Когнітивній IТ-платформі «ПОЛІЕДР». Когнітивна IТ-платформа «ПОЛІЕДР», Система аналізу текстів, логіко-лінгвіс- тичне дослідження, онтологія, концептографічний аналіз, логіко-лінгвістичні дефекти V. А. Shyrokov, M. V. Nadutenko, О. Ye. Stryzhak, S. S. Yuschenko. Technological fundamentals of logical and lin- guistic research of legislation. The article substantiates and describes the use of the author's software products – the Text Analysis System and the Cognitive IT Platform «POLYHEDRON» in the prospective logical-linguistic studies of Ukrain- ian legislation. Authors use the complex logical and linguistic research of the Law of Ukraine "On special procedure for the removal of the President of Ukraine from office (impeachment) "No. 39-IX of September 10, 2019 as an example. Cognitive IT platform «POLYHEDRON», Text analysis system, logical and linguistic research, ontologies, conceptographical analysis ВСТУП Удосконалення національного законодавства є першочерговим завданням уряду будь-якої країни, оскільки від дієвості законів та інших нормативно- правових актів залежить ефективність їх правового впливу на політичні, економічні, соціальні та інші процеси, що відбуваються в країні. Проте жодне на- ціональне законодавство не можна назвати доскона- лим. Так, недоліком законодавства США визнається архаїчність, Російської Федерації – неузгодженість нормативно-правових актів федерального та місце- вого рівнів, Республіки Білорусь – постійне коригу- вання законів для досягнення відповідності з указами Президента; Грузії – істотний вплив національних традицій та культурних звичаїв, що ускладнює імпле- ментацію міжнародних нормативно-правових норм до грузинського законодавства; Великобританії – ве- лика кількість формально діючих законів, що фак- тично втратили актуальність; Індії – відсутність пра- вових наслідків за вчинення соціальних, правових та інших переслідувань на підставі расової, кастової та релігійної належності; Італії – істотний вплив кон- сервативного національного менталітету. Приклади такого типу можна продовжувати і продовжувати. Однією з наріжних проблем законодавства України є недієвість у вітчизняних реаліях правових норм, ско- пійованих із актів інших країн та таких, що дісталися у спадок від часів СРСР1. Зазначені недоліки стосуються юридичної сфе- ри, але не менш важливою для забезпечення дієвості законодавства є лінгвістична сфера, оскільки суб- стратом права, формою, в якій втілено правові акти є природна мова. Закон – це результат законотвор- чого процесу, етапами якого є розробка концепції, організація робочої групи, формування тексту за- конопроєкту, проведення експертиз та обговорень, врахування зауважень, редагування і, власне, про- цедура прийняття. Відома серед правників метафора «кола законодавчого пекла»2 відображає складність перебігу законодавчого процесу та почасти пояснює недостатність уваги до лінгвістичного оформлення законопроєктів «зацикленістю» учасників законот- ворчості на проходженні «кіл законодавчого пекла», 1 Огляд недоліків національних законодавств зроблено авторами статті виключно з ілюстративною метою на осно- ві аналітичних веб-публікацій, отриманих на запити «не- доліки законів <назва країни>». Автори не претендують на вичерпність наведеного переліку. 2 Див. напр. Ромовська З. В. Українське цивільне пра- во. Загальна частина: академічний курс: Підручник. – 3-тє вид., допов. – К.: «ВД «Дакор», 2013. – С. 112. 4 яке до того ж зазвичай відбувається в умовах сильно- го цейтноту. На нашу думку, наслідком такого стану справ, обтяженим імпліцитністю семантичних та ло- гічних дефектів у текстах законопроєктів, авральним режимом їх формування, великою завантаженістю нормопроєктувальників та іншими об’єктивними чинниками, є прийняття слабких у логічному та лінг- вістичному аспекті законів із руйнівним потенціа- лом. На авторів цієї статті, обов’язковість законодавчих вимог нівелюється недосконалим термінологічним апаратом, застосуванням лексичних та синтаксичних конструкцій з нечіткою семантикою, смисловими прогалинами (лакунами), інтертекстуальною неузго- дженістю правових приписів. Результати проведених в Українському мовно- інформаційному фонді НАН України (далі – Фонд) логіко-лінгвістичних досліджень вітчизняного за- конодавства переконливо свідчать, що юридична наука, декларуючи законодавство як систему, досі немає жодної її функціональної мовно-когнітивної моделі  – лексикографічної, концептографічної, он- тологічної або іншої. Унаслідок цього в текстах не- визначеної кількості законів (навіть у Конституції України), попри їх ретельне опрацювання високок- валіфікованими фахівцями, мають місце логіко-лінг- вістичні вади (дефекти; далі – ЛЛД), що проявляють- ся на всіх рівнях функціонування тексту. Зрозуміло, що для лінгвістичного вдосконалення законодавства недостатньо чітко визначити терміни та поняття в одному чи декількох законах або пере- формулювати неоднозначні приписи – це потрібно зробити в усій законодавчій базі й виключно засо- бами інтелектуальних когнітивних комп’ютерних технологій, оскільки обсяг нормативно-правової бази України3, з урахуванням динаміки її модифіка- ції, виключає будь-який інший підхід до її аналізу, спроможний забезпечити її смислову та логічну ко- ректність. Крім великого обсягу, іншою рисою законо- давства є слабка структурованість та різноплано- вість текстів, що його утворюють (див. виноску 3). Створення оптимальних умов для опрацьовування різнопланових інформаційних масивів визначає тех- нологію проведення логіко-лінгвістичних досліджень законодавства як таку, що відноситься до концепцій 3 Станом на 24 грудня 2020 року згідно з інформацією, наведеною на офіційному сайті rada.gov.ua до бази даних «Законодавство України» входять: 6860 законів України; 46 Кодексів; 89314 постанов; 34604 наказів; 6801 рішення; 29823 указів; 45579 розпоряджень; 83 декрети; 1356 актів; 840 вимог; 566 висновків; 107 вказівок; 334 директиви; 9 доктрин; 39 законопроєктів; 3879 інструкцій; 779 конвен- цій; 13010 міжнародних документів; 1762 правила та десят- ки інших позицій (режим доступу: https://zakon.rada.gov.ua/ laws/main/a/stru4#Typ). Big Data («великі дані»). Тобто комп’ютерні інстру- менти, орієнтовані на дослідження законодавства, мають реалізовувати когнітивні функції з урахуван- ням гіпервластивостей Big Data, основними з яких є рефлексія (здатність до саморозвитку), рекурсія (здатність до самовідтворення) та редукція (здатність до спрощення). Інтерпретація зазначених гіпервластивостей зу- мовлює використання таких підходів у дослідженні законодавства: 1) структурний аналіз інформаційних ресурсів; 2) визначення форми взаємодії з інформа- ційними ресурсами; 3) визначення критеріїв вибору потрібних для дослідження контекстів. Фонд є однією з небагатьох вітчизняних наукових установ, що володіють технологічним (повним) ци- клом розробки когнітивних інформаційно-аналітич- них інструментів роботи з масивами природномов- них текстів (далі – ПТ) відповідно до концепцій Big Data – від наукових теорій до промислових зразків. Метою цієї статті є огляд двох програмних інструмен- тів, розроблених у Фонді для проведення різного роду лінгвістичних досліджень, а саме: Системи аналізу текстів та Когнітивної IТ-платформи «ПОЛІЕДР», а також демонстрація їхніх функціональних можли- востей на прикладі проведеного авторами статті логі- ко-лінгвістичного дослідження Закону України «Про імпічмент Президента України». СИСТЕМА АНАЛІЗУ ТЕКСТІВ Система аналізу текстів (САТ) – комп’ютерний інструмент, розроблений на програмній платформі ULISS4, створеній на базі інформаційно-лінгвістич- них теорій [1  –  5]. Операціональною основою САТ є метод N-грам, згідно з яким ПТ моделюється лан- цюжками слів5 довжини n, що інтерпретуються як певні випадкові величини. САТ пройшла достатню апробацію на текстах реальної складності, що дає нам право стверджува- ти її практичну значимість як інструменту лінгвоек- спертних досліджень. Зокрема, з її допомогою було проаналізовано текст Конституції України, кіль- ка редакцій Податкового кодексу України, статути та передвиборчі програми українських політичних партій, низку лексикографічних праць (зокрема, Словник української мови в 20 томах) та ін. Універсальність САТ забезпечує роботу з текстами практично будь-якої структури, обсягу та складності. Якщо об’єктом дослідження виступає законопроєкт, САТ дозволяє оперативно оцінити його смислову відповідність загальносистемним вимогам вітчизня- ної правової системи (узгодженість із Конституцією 4 ULISS – Universal Lingua-Information Semantic Service. 5 Терміном «слово» в цьому контексті позначено лінійну послідовність (ланцюжок) певних символів з деякого скін- ченного алфавіту. Виділення в таких ланцюжках слів, як лек- сичних одиниць певної мови, становить окреме завдання. БИОНИКА ИНТЕЛЛЕКТА. 2020. № 2 (95). С. 3–14 хнурэ 5 ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА України, національним законодавством України, міжнародними угодами, згоду на обов’язковість яких надано Верховною Радою України та ін.) та вимогам законодавчої техніки до текстуального оформлення законопроєктів (послідовний, стислий, логічний ви- клад нормативного матеріалу, чіткість формулювань, уніфікованість правової, офіційно-ділової та галузе- вої термінології та ін.) [6, 7]. Користувач САТ має можливість: – прямого доступу до контекстів семантично на- вантажених лексичних та лексико-синтаксичних одиниць тексту (слова, словосполучення, сполучення слів, колокації тощо) в усіх граматичних значеннях із заданою лексичною відстанню між компонентами; – обчислення смислової узгодженості (близькос- ті) тексту аналізованого законопроєкту із текста- ми нормативно-правових актів, відповідність яким у ньому декларується; – обчислення смислової близькості альтерна- тивних законопроектів, підготовлених різними суб’єктами законодавчої ініціативи для розгляду Верховною Радою України; – дослідження законопроєктів на можливе автор- ство (співавторство), запозичення та імовірні інфор- маційно-текстові джерела; – обчислення обсягу та проведення змістового аналізу зроблених у тексті законопроєкту модифіка- цій на різних етапах законодавчого процесу; – локалізації та інтерпретації логіко-лінгвістич- них дефектів в аналізованому документі. Проілюструємо викладене результатами, отри- маними авторами цієї статті за допомогою САТ при комплексному логіко-лінгвістичному дослідженні Закону України «Про особливу процедуру усунення Президента України з посту (імпічмент)» № 39-IX від 10 вересня 2019 року (далі – «Закон № 39-IX»), про- єкт якого вніс Президент України В. О. Зеленський. Значимість цього закону полягає в тому, що він сто- сується не лише Президента України або згаданих у ньому посадових осіб, а й усього українського сус- пільства – як свідчення демократичного шляху роз- витку держави. Логіко-лінгвістичне дослідження Закону № 39-IX передбачало обчислення його семантичної близь- кості з: 1) проєктом Закону України «Про імпічмент Президента України», внесеним Президентом України В.  О.  Зеленським; 2) альтернативним законопроєк- том «Про імпічмент Президента України», внесе- ним народним депутатом України І.А. Артюшенком, 3) Конституцією України (у редакції від 21 лютого 2019 року), 4) Регламентом Верховної Ради України № 1861-VI (у редакціях він 16 липня 2019 року та 25 серпня 2019 року). САТ обчислює семантичну близь- кість текстів за формальними ранговими критеріями, сутність яких розкрито нижче. Зауважимо, що відношення семантичної близь- кості ПТ є симетричним лише для релевантних (об’єктивно рівнозначних) текстів, що було врахова- но при розробленні САТ. Наприклад, статут будь-якої політичної партії, зареєстрованої в Україні, повинен відповідати Закону про політичні партії, а не навпа- ки; локальні нормативні акти (правила внутрішньо- го розпорядку, інструкції, методичні рекомендації тощо) повинні відповідати кодифікованим актам, а не навпаки. Нехай є два ПТ, один з них (Т1) – еталонний, інший (Т2) – аналізований. Згідно з теорією слаб- кої синонімії текстів [3], підтвердженої численними статистичними експериментами на текстах реальної складності, текст Т2 є семантично еквівалентним («слабко синонімічним») тексту Т1, у разі виконання хоча би однієї з трьох умов: 1) у тексті Т2 наявні 50 % та більше уніграм (окремі лексеми у тих самих гра- матичних формах, тобто словоформи однієї лексеми, що утворюють її словозмінну парадигму) тексту Т1 (ранговий критерій Q1); 2) у тексті Т2 наявні більше 30% біграм (дві поруч розташовані словоформи) тек- сту Т1 (ранговий критерій Q2); 3) у тексті Т2 наявні 10% триграм (три поруч розташовані словоформи) тексту Т1 (ранговий критерій Q3) [5, 8]. Чим вище значення будь-якого рангового крите- рію, тим більш близьким за смислом є аналізований текст еталонному. Значення «одиниця» будь-якого рангового критерію означає текстуальну, а отже – й смислову тотожність аналізованого тексту еталон- ному. Результат обчислення САТ рангових критеріїв ви- водиться на екран у вигляді матриці аналізу (рис. 1). Порівняння висновків, зроблених за результатами аналізу отриманих за допомогою САТ даних із нео- фіційною інформацією з компетентних джерел про хід законодавчого процесу, результатом якого стало формування остаточної версії тексту Закону №  39- IX, підтвердило достовірність наших висновків. Так, високі (наближені до одиниці) значення рангових критеріїв Q1, Q2, Q3, обчислені Системою для Закону №  39-IX та Регламенту Верховної Ради України № 1861-VI в редакції від 16 липня 2019 року (Q1 = 0,8023; Q2 = 0,7357; Q3 = 0,6875) та низькі – об- числені для Закону № 39-IX та Регламенту Верховної Ради України № 1861-VI в редакції от 25 вересня 2019 року (Q1 = 0,1453; Q2 = 0,0764; Q3 = 0,0650) означають, що джерелом тексту Закону № 39-ІХ послугував текст Регламенту, конкретно – Глава 30 и стаття 133. Справді, для формування тексту Закону № 39-IX з Регламенту було вилучено 17 статей Глави  30 – з  171-ї до 188-ї. Низькі значення рангових критеріїв Q1, Q2, Q3 для законопроекту «Про імпічмент Президента України», внесеного народним депутатом України І.А.  Артюшенком та Глави  30 Регламенту Верховної 6 Широков В.А., Надутенко М.В., Стрижак О.Є., Ющенко С.С. Ради України в редакції від 16 липня 2019 року (Q1 = 0,2000; Q2 = 0,0760; Q3 = 0,0471), указують на те, що цей законопроєкт базувався не на Регламенті, а є самостійним текстом (хоча й не виключається інше текстуальне джерело). Рангові критерії менше одиниці для законопроєк- ту, внесеного Президентом України В.О. Зеленським та Закону України № 39-IX, в який втілився цей зако- нопроєкт після прийняття (Q1 = 0,9210; Q2 = 0,8421; Q3 = 0,7982) свідчить про наявність поправок, внесе- них до законопроєкту в ході розгляду, обговорення, доопрацювання та узгодження. Низькі значення рангових критеріїв для законо- проекту І.А. Артюшенка та Закону № 39-IX свідчать про істотні смислові відмінності цих двох документів – фактично лексика перетинається на рівні семан- тичного ядра юридичної мови та не відображає спе- цифіку змісту предметної галузі саме цього Закону. Процедура імпічменту Президента України згаду- ється у статтях 85, 105, 111, 151 Конституції України, проте обсягу їх тексту недостатньо для статистично імовірних (таких, що відображають реальні законо- мірності досліджуваної проблеми) висновків про сту- пінь відповідності аналізованих текстів Конституції України: обидва документи – Закон №  39-IX та законопроєкт І.  А.  Артюшенка мають низькі зна- чення рангових критеріїв із зазначеними статтями Конституції України (Закон № 39-IX: Q1 = 0,1976; Q2 = 0,0617; Q3 = 0,0306; законопроєкт І. А. Артюшенка: Q1 = 0,2531; Q2 = 0,0893; Q3 = 0,0394). Для зручності користувачів екранну форма САТ поділено на три поля (рис. 2). У лівому – список лан- цюжків словоформ, що збігаються (на рис. 2 обрано збіги за трійками словоформ), у центральному полі – аналізований текст, у правому – еталонний текст, із яким порівнюється аналізований. Ланцюжки словоформ, що збігаються, у цен- тральному та правому полях акцентовано шрифтови- ми виділеннями. У спливаючому вікні «Статистика» наведено результати обчислення рангових критеріїв для аналізованого та еталонного текстів за трьома N-грамами – довжиною в одну словоформу (значен- ня Q1), дві словоформи (значення Q2), три словофор- ми (значення Q3). Висока швидкість обробки великих текстових ма- сивів, простота інтерпретації, наукова надійність та наочність представлення результатів роблять САТ не- замінним помічником дослідника. КОГНІТИВНА IТ-ПЛАТФОРМА «ПОЛІЕДР» Когнітивну ІТ-платформу «ПОЛІЕДР»6, орієнто- вану на автоматичну обробку просторово-розподіле- ної неструктурованої текстової інформації великого обсягу (Big Data) та підтримку процесів раціонально- го вибору та прогнозування з наступним формуван- ням інформаційно-аналітичних WEB-орієнтованих рішень, створено в рамках проєкту з розвитку системи національних лінгвістичних ресурсів та національної лінгвістичної інфраструктури («Всеукраїнський лінг- вістичний діалог»). Когнітивна IТ-платформа «ПОЛІЕДР» забезпе- чує реалізацію таких інформаційних процесів, як: лінгвосемантичний аналіз мережевих інформацій- них ресурсів, створених на основі різних технологій і стандартів; трансдисциплінарна інтеграція з іншими інформаційними та автоматизованими системами; таксономізація документів з урахуванням міжконтек- стних зв’язків; формування онтологічних інтерактив- них документів; встановлення імпліцитної інформації 6 Свідоцтво про авторське право на твір. № 96078. Комп’ютерна програма «Когнітивна ІТ платформа ПОЛІЕДР» (КІТ ПОЛІЕДР) (англ. «POLYHEDRON»). Рис. 1. Сформована САТ матриця аналізу з результатами попарного обчислення рангового критерію Q1 для текстів, завантажених до САТ для проведення комплексного логіко-лінгвістичного дослідження Закону № 39-IX (фрагмент) 7 Рис. 2. Екранна форма Системи аналізу текстів із результатами обчислення рангових критеріїв для законопроєкту «Про імпічмент Президента України», внесеного Президентом України В. О. Зеленським та Закону України «Про особливу процедуру усунення Президента України з посту (імпічмент)» № 39-IX від 10 вересня 2019 року, в який втілився законопроєкт після прийняття в інформаційних ресурсах; глибинне та машинне на- вчання (Deep Learning, Machine Learning); викорис- тання форматів та протоколів Semantic Web та ін. Когнітивна IТ-платформа «ПОЛІЕДР» має в арсеналі інструменти, що дозволяють виконува- ти контекстно-семантичний, лінгвоструктурний та концептографічний аналіз ПТ, будувати таксономію документів, класифікувати та генерувати онтології предметних галузей та онтології вибору; конструюва- ти трансдисциплінарні онтології; надавати інформа- ційно-аналітичну підтримку при прийнятті рішень, забезпечувати багатокритеріальний аналіз та рейтин- гування; здійснювати семантичний пошук лексичних структур у розподілених мережевих текстових маси- вах; будувати лінгвістичні кластери – цифрові лінг- вістичні корпуси із засобами асоціативного пошуку семантично зв’язаних інформаційних масивів. Усі зазначені сервіси Когнітивної ІТ-платформи «ПОЛІЕДР» розподіляються на дві функціонально пов’язані групи – онтолого-семантичну та онтолого- аналітичну. Онтолого-семантична група включає сервіси лінгвосемантичної обробки інформаційних ресурсів. Зокрема, до цієї групи належать трансдисциплінар- ні сервіси, орієнтовані на обробку неструктурованої текстової інформації, а саме: 1) лінгвосемантичний аналіз текстових докумен- тів українською, російською та англійською мова- ми, що передбачає: формалізоване представлення синтактико-семантичної структури речень у XML; автоматичне виділення багатослівних термінів та контекстів, що їх містять; встановлення семантичних відношень багатослівних термінів за заданими ша- блонами їх описів; 2) таксономізація – процедура структурування текстових масивів на основі системологічного пред- ставлення їх термінологічної системи в ієрархічному вигляді, що має результатом експлікування структу- ри аналізованих текстів у вигляді графа, вершинами якого є терміни, їх семантичні описи та контексти, в яких терміни фігурують; 3) рекурсивна редукція – процедура багатоетап- ного послідовного перетворення первинної структу- ри тексту в онтологічний вигляд на основі виділен- ня первинних шаблонів, що включає лексичний та синтаксичний аналіз та забезпечує автоматичну по- будову таксономії, тезаурусу і онтології аналізованих текстових масивів; 4) систематизація документальних мережевих ресурсів (big data sources) – процедура, результатом якої є утворення цифрових колекцій з масиву ПТ за визначеними користувачем параметрами (мовними, понятійними, прагматичними, часовими, стильови- ми, функціональними, інтенціональними та ін.); 5) індексна розмітка інформаційних ресурсів – процедура, що ґрунтується на корпусних технологіях та теорії семантичних станів. Її результатом є марку- вання термінів з урахуванням їхньої ваги, на основі ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА 8 якої здійснюється семантико-синтаксичний аналіз трансдисциплінарних ПТ. 6) встановлення міжконтекстних зв`язків – про- цедура знаходження термінів та словосполучень у контекстах документів, що обробляються та визна- чення рівня їх семантичної еквівалентності та сис- темологічної належності; результатом застосування цієї процедури є відображення динамічного катало- гу пов’язаних таксономічних структур, у контекстах яких містяться зазначені терміни та словосполучення; 7) утворення полімовної синонімічної зони – процедура, що передбачає розвиток та використан- ня Електронного перекладного словника синонімів, який на сьогодні охоплює основну лексику україн- ської, російської, англійської, німецької, французь- кої та італійської мов; 8) інтерактивація онтологічних документів – про- цедура, що забезпечує інтерактивну взаємодію з тер- мінами та словосполученнями текстових масивів, що мають множину контекстних дефініцій, на основі їх таксономічного та онтологічного представлення. Інтерактивація забезпечує динамічну зміну порядку відображення контекстів терміносистеми тексту при взаємодії з іншими документами та інформаційними системами. Результатом інтерактивації є формування динамічного каталогу контекстів термінів, що вико- ристовуються у процесі взаємодії. Онтолого-аналітична група сервісів включає сер- віси, що забезпечують трансдисциплінарний аналіз та підтримку прийняття оптимальних організаційно- управлінських рішень в умовах складності та різно- маніття ситуацій вибору. До них належать: 1) багатокритеріальний порівняльний аналіз; 2) ранжування альтернатив – визначення кон- курентності альтернатив (реальних або абстрактних сутностей з притаманними їм станом, поведінкою та індивідуальністю) на основі їх статистичних характе- ристик; 3) конкурентна нормалізація критеріїв – відобра- ження варіантів концептів із функціональними влас- тивостями (об’єкти, стратегії, шляхи розвитку, про- гнози та ін.) за обраною користувачем сукупністю критеріїв для прийняття оптимального рішення; 4) обернене ранжування альтернатив – пост- аналіз результатів ранжування альтернатив з метою покращення отриманих результатів та доповнення вихідної онтологічної моделі предметної області но- вими властивостями об’єктів дослідження; 5) експертне оцінювання – аналіз проблеми, ста- ну об’єкта чи процесу експертним методом; 6) раціональний вибір – встановлення лінійно- го порядку на множині альтернатив з метою вибору найкращих за сукупністю критеріїв; 7) онтологічний інтерфейс – засіб взаємодії ко- ристувача з інформаційно-аналітичними системами, побудованими на різних комп’ютерних платфор- мах; 8) трансдисциплінарна категорізація контекстів – системологічне динамічне формування класів кон- текстних описів на основі стійких бінарних сполу- чень між визначеними користувачем об’єктами (тер- міни, фрази, словоформи тощо); 9) прогностичне оцінювання станів розвитку про- цесів – прогнозування перебігу процесу на основі інформації щодо його перебігу в контрольований пе- ріод часу; 10) система індикаторів – формування на осно- ві трансдисциплінарного аналізу стану інноваційних рішень, формування рейтингів об’єктів дослідження і пов’язаних з ними процесів, створення та моди- фікація об’єктів з урахуванням сукупності факторів впливу; 11) керуюча онтологія – операціональне роз- ширення інтерактивного документа для вирішення завдань, що виходять за рамки онтології, шляхом підключення додаткових модулів. Цільова функція інтерактивного документу є комбінацією цільових функцій підмножини підключених модулів. Отже, зазначені когнітивні трансдисциплінар- ні сервіси реалізують процеси лінгвосемантичного аналізу просторово-розподіленої неструктурованої інформації великого обсягу, її структуризацію, вста- новлення контекстних зв’язків між документами, прогнозування та підтримку процесів оптимального вибору з наступним формуванням інтелектуальних інформаційно-аналітичних WEB-орієнтованих рі- шень, забезпечують аналітичні сервіси структуру- вання даних та відповідають критеріям сучасного інформаційно-аналітичного середовища. Більш того, використання названих сервісів дозволяє інтегрувати інформаційні ресурси в єдиний інформаційний про- стір. Конфігурацію когнітивних сервісів трансдисци- плінарного інформаційно-аналітичного середовища наведено на рис. 3. Більш детальну інформацію про науково-технічні засади Когнітивної IТ-платформи «ПОЛІЕДР» мож- ливо дізнатися з робіт [9-15], наше завдання в кон- тексті цієї статті – продемонструвати її застосування в лінгвоекспертній діяльності на прикладі комплек- сного логіко-лінгвістичного дослідження Закону України № 39-IX. КОМПЛЕКСНЕ ЛОГІКО-ЛІНГВІСТИЧНЕ ДОСЛІДЖЕННЯ Закону України № 39-IX За результатами дослідження встановлено, що Закон України №  39-IX текстуально поґрунтовано на Регламенті Верховної Ради України №  1861-IV в редакції від 10 лютого 2010 року. Автори статті вста- новили, що Закон України №  1861-IV «спадкував» Широков В.А., Надутенко М.В., Стрижак О.Є., Ющенко С.С. 9 усі ЛЛД тексту-«донора», слабкого не лише в лінг- вістичному аспекті, але, як показали події 2014 року в Україні, в юридичному, оскільки процедуру імпіч- менту, описану в Регламенті, не змогли застосува- ти навіть до В. Ф . Я нуковича, що самоусунувся від здійснення конституційних повноважень Президента України, за що був оголошений в міжнародний роз- шук новою українською владою 26 лютого 2014 року. Всупереч вимогам законодавчої техніки щодо су- ворого дотримання норм літературної української мови при формуванні тексту нового закону «Про ім- пічмент Президента України», цьому ключовому по- казнику якості законодавчого тексту не було приді- лено достатньо уваги. Недосконалість формулювань тексту Закону України №  39-IX простежується на різних рівнях мови – лексичному, синтаксичному, стилістично- му, семантичному, логічному. Відсутність офіційної інтерпретації неоднозначних виловлювань та тлу- мачень ключових понять (особливо – поняття «дер- жавна зрада», яке, власне, й вмотивовує процедуру імпічменту), неточне слововживання, смислова не- повнота, підміна понять, хибна синонімія, порушен- ня логічних законів (несуперечливості, достатньої підстави) робить Закон України №  39-IX уразливим не лише в лінгвістичному або логічному сенсі, але й також у юридичному. ЛЛД представляється у вигляді загальної лекси- кографічної моделі [2], реєстровою одиницею якої виступає проблемний контекст із зазначенням його локалізації (позиції в тексті Закону – стаття, части- на статті), інтерпретаційною частиною – поля «Тип ЛЛД» та «Підтип ЛЛД». Поле «Коментар», що зв’язує проблемний контекст із типом та підтипом вста- новленого в ньому ЛЛД, заповнюється користува- чем вручну. Автоматизоване заповнення цього поля Рис. 3. Когнітивні сервіси трансдисциплінарного інформаційно-аналітичного середовища ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА 10 можливе для орфографічних, пунктуаційних та по- вторюваних ЛЛД, у разі яких у полі «Коментар» буде імпортовано наявні в базі коментарі або відповідні пункти «Українського правопису». Приклади опису встановлених ЛЛД в Законі України № 39-IX: Контекст: Імпічмент регулюється Конституцією України, цим Законом, Регламентом Верховної Ради України, а у випадках, передбачених цим Законом, – іншими законами України. Локалiзацiя: стаття 1 частина 2 Тип ЛЛД: семантичний Пiдтип ЛЛД: помилка у слововживаннi (слово без урахування значення) Коментар: в Конституції України та Регламенті Верховної Ради України імпічмент згадується; але про- цедуру імпічменту вони не регулюють. РЕГУЛЮВАТИСЯ, юється, недок. Пас. до регулювати. РЕГУЛЮВАТИ, юю, юєш, недок., перех. 1. Впоряд- ковувати що-небудь, керувати чимось, підкоряючи його відповідним правилам, певній системі. Див. Регламент Верховної Ради України, стаття 171: «Порядок дострокового припинення повноважень Прези- дента України у разі усунення Президента України з поста в порядку імпічменту. 1. Порядок дострокового припинення повноважень Президента України у разі усунення Президента України з поста в порядку імпічменту визначається Конституцією України, Законом України «Про особливу процедуру усу- нення Президента України з поста (імпічмент)», іншими законами України та цим Регламентом». Статті 171 – 188 виключено на підставі Закону № 39-IX від 10 вересня 2019 року. Контекст: Кандидат на посаду спеціального прокурора чи спеціального слідчого подає до Верховної Ради України особову картку, декларацію особи, уповноваженої на ви- конання функцій держави або місцевого самоврядування, за минулий рік в порядку, визначеному Законом України «Про запобігання корупції». Локалізація: стаття 4 частина 6 Тип ЛЛД: семантичний Підтип ЛЛД: смислова неповнота Коментар: відсутнє тлумачення поняття «минулий рік», що рівнозначно може розумітися як «календарний рік, що передував року, в якому розпочато процедуру імпічменту» або «рік, точкою зворотного відліку якого є подання канди- датами на посади спеціального прокурора чи спеціальних слідчих документів до Верховної Ради». Зазначимо, що Рубрикатор ЛЛД, розроблений у Ф онді, є результатом багаторічної роботи науков- ців, які збирають та описують колекцію ЛЛД та роз- вивають технологію багаторівневого маркування ЛЛД в ПТ [16]. За результатами пошуку та опису ЛЛД Закону №  39-IX було побудовано онтологію встановле- них у  ньому ЛЛД на Когнітивній IТ-платформі «ПОЛІЕДР» (рис. 4). Кореневими вершинами цієї онтології є найменші формально марковані структурні одиниці аналізова- ного Закону, що мають смислову завершеність – по- значені абзацами частини його статей, в яких вста- новлено той чи інший ЛЛД. Вершинами онтології другого та третього ярусів є підтипи та типи ЛЛД відповідно. Натискання на Рис. 4. Онтологія логіко-лінгвістичних дефектів Закону України «Про особливу процедуру усунення Президента України з посту (імпічмент)» № 39-IX від 10 вересня 2019 року, побудована на Когнітивній ІТ-платформі «ПОЛІЕДР» за результатами логіко-лінгвістичного дослідження (фрагмент) Широков В.А., Надутенко М.В., Стрижак О.Є., Ющенко С.С. 11 вершини другого ярусу відкриває контекст, в якому дослідник встановив ЛЛД, натискання на вершини третього ярусу – всі контексти в документі з ЛЛД відповідного типу. Структурні елементи аналізова- ного тексту, в яких ЛЛД не встановлено, в онтології не фігурують. При додаванні або видаленні вершин онтологія автоматично перебудовується так, щоби уникнути перетину зв’язків (ребер). Термінальна вершина – «Лінгвістичні недоліки ЗУ № 39-IX» об’єднує граф в одне ціле. На нашу думку, представлення ЛЛД у вигляді онтології, завдяки своїй наочності, є надзвичайно зручним для користувачів, оскільки дозволяє одним поглядом оцінити лінгвістичну якість усього докумен- ту. Зрозуміло, як складно це зробити в традиційний спосіб – гортаючи тисячі сторінок із підкресленими редакторами помилками. Онтологічне представлення ЛЛД також зручне у разі необхідності оцінити якість роботи кожного ав- тора (авторського колективу), що працював над окре- мою структурною одиницею (глава, розділ, частина) великого тексту (регламент, національна доповідь, кодекс та ін.), оскільки візуалізує зв’язок помилки з автором проблемного контексту. На Когнітивній ІТ-платформі «ПОЛІЕДР» також можливо проводити концептографічні дослідження ПТ (інша назва – глибокий лінгвосемантичний ана- ліз), що полягають у встановленні концептів (понять, що визначають смисл тексту), їхніх властивостей та зв’язків між ними на основі їх контекстних описів. Екранну форму глибокого лінгвосемантичного аналізу ПТ (у нашому прикладі – Закону України № 39-IX) наведено на рис. 5. Для зручності користу- вачів її поділено на три частини. У лівій частині (позначено цифрою 1) виво- диться список термінів Закону України №  39-IX зі зв’язаними термінами (верхнє вікно «Дерево тер- мінів») та контексти, в яких зустрічаються вибра- ні користувачем терміни в Законі України №  39-IX (нижнє вікно «Речення тексту»). При активації опції «підкреслити терміни» у вікні контекстів обрані ко- ристувачем терміни підкреслюються. У центральній частині (позначено цифрою 2) ви- водиться перелік усіх термінів із зазначенням кіль- кості входжень в аналізований текст та формою пошуку терміну за типом, що задається в умовах по- шуку вибором потрібного типу зі списку. У правій частині екранної форми (позначено цифрою 3) знаходиться зведена таблиця класів термі- нів кожної зі статей Закону України № 39-IX (рис. 6), сформирована за такою схемою: (клас термінів А-Z), (термін A), (термін B), (тер- мін C), ..., (термін Z) (термін C — клас термінів С1-n), (термін С1), (тер- мін С2), (термін С3), ..., (термін Сn) Рис. 5. Екранна форма глибокого лінгвосемантичного аналізу Закону України № 39-IX, виконаного на Когнітивній ІТ-платформі «ПОЛІЕДР» ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА 12 (термін C2 — клас термінів С21-n), (термін С21), (термін С22), (термін С23),..., (термін С2 n). За результатами концептографічного дослідження Закону України № 39-IX за допомогою Конструктора онтологій Когнітивної ІТ-платформи «ПОЛІЕДР» було побудовано онтологію – універсальну модель представлення знань про предметну галузь «ім- пічмент Президента України», вилучених із цього Закону, що дозволяє проводити будь-які операції над цими знаннями, включаючи їх транслювання до ін- шого програмного середовища (рис. 7). Побудована за результатами концептографічного дослідження Закону України №  39-IX онтологія до- зволила виявити сім невизначеностей (колізій) у його тексті. Кожна невизначеність (колізія) представляєть- ся програмній системі, що не розуміє смислу тек- сту, як неповнота або надлишковість зв’язків між вершинами онтології. Оскільки зазначені відхилен- ня безпосередньо обумовлюються змістово-логіч- ною неповнотою або надлишковістю аналізованого тексту, встановлені Когнітивною ІТ-платформою Рис. 6. Права частина екранної форми глибокого лінгвосемантичного аналізу Закону України № 39-IX презентує класи термінів кожної зі статей Закону в табличному вигляді Рис. 7. Онтологія Закону України «Про особливу процедуру усунення Президента України з поста (імпічмент)» № 39-IX от 10 вересня 2019 року, побудована на Когнітивній ІТ-платформі «ПОЛІЕДР» (фрагмент Широков В.А., Надутенко М.В., Стрижак О.Є., Ющенко С.С. 13 «ПОЛІЕДР» невизначеності (колізії) можливо вважа- ти об’єктивними фактами. Змістовно-логічна неповнота та надлишковість тексту закону однаково призводять до неоднозначної інтерпретації нормативних приписів, що, як свідчить практика, завжди закінчується конфліктом інтересів у правозастосуванні. Деталізовані фрагменти онтології Закону України № 39-IX, наведені нижче, демонструють колізії, вста- новлені Когнітивною ІТ-платформою «ПОЛІЕДР» на основі неповноти зав’язків між вершинами онто- логії (рис. 8) та надлишковості зв’язків між вершина- ми онтології (рис. 9). Колізії позначено символом $. Рис. 8. Фрагмент онтології Закону № 39-IX з експлікованою смисловою лакуною, зумовленою відсутністю у тексті жодних вказівок стосовно подальших дій Президента України, усуне- ного з посту в порядку імпічменту Рис. 9. Фрагмент онтології Закону № 39-IX, що вказує на потенційний конфлікт інтересів вищих судових органів України при прийняті рішень у справі про імпічмент Прези- дента України Когнітивна ІТ-платформа «ПОЛІЕДР» надає ко- ристувачам нові інструменти і засоби дослідження законодавства, що дозволяють експлікувати потен- ційні джерела конфліктів у правозастосуванні – нео- днозначні положення, терміни та поняття з некорек- тним або відсутнім офіційним тлумаченням. Слід також зазначити, що сервіси Когнітивної ІТ- платформи «ПОЛІЕДР», що забезпечують концеп- тографічне дослідження ПТ, реалізують відображен- ня зв’язності його концептів у форматі наративного дискурсу [11]. Іншими словами, реалізуються когні- тивно-комунікативні акти взаємодії між контекста- ми кожного концепту онтології аналізованих текстів. Це дозволяє виявляти семантичну зв’язність між контекстами концептів, з якою пов’язується логічна зв’язність. Сервіси Когнітивної ІТ-платформи «ПОЛІЕДР» забезпечують агрегування всіх контекстів досліджу- ваних концептів, відображення класів еквівалентнос- ті законодавчих актів за різними ознаками (смислова близькість концептів / понять / норм; гіпо-гіперо- німічні ланцюжки концептів та ін.), відображення та відстеження логіки взаємовпливу процесів, що регулюються аналізованими нормативно-правовими актами, побудова онтології аналізованих норматив- но-правових актів із можливістю деталізації фраг- ментів. ВИСНОВКИ Проведене в Українському мовно-інформаційно- му фонді НАН України комплексне логіко-лінгвіс- тичне дослідження Закону України «Про особливу процедуру усунення Президента України з посту (ім- пічмент)» № 39-IX от 10 вересня 2019 року із застосу- ванням авторських програмних продуктів – Системи аналізу текстів та Когнітивної ІТ-платформи «ПОЛІЕДР», що реалізують корпусні та концепто- графічні технології обробки та дослідження ПТ, а також технології онтологічного моделювання ПТ, по- казало, що попри політичну та соціальну значимість цього закону, в ньому мають місце логіко-лінгвістич- ні дефекти, що проявляються на різних рівнях функ- ціонування тексту – синтаксичному, семантичному, стилістичному, логічному, концептологічному. Звідси випливає цілком очевидний висновок: усу- нення недоліків вітчизняного законодавства є на- ріжною проблемою, розв’язання якої вимагає комп- лексного підходу. Крім розробки та впровадження у сферу законотворчості сучасних когнітивно-інфор- маційних комп’ютерних інструментів реалізація цьо- го підходу потребує ретельного аналізу та, можливо, навіть перегляду структури, модусу, змісту та інших характеристик законотворчого процесу. Аналогічні твердження справедливі й щодо до правозастосовної практики. Список літератури: [1] Теорія лексикографічних систем: Широков В. А. Інфор- маційна теорія лексикографічних систем. – К.: Довіра, 1998. – 331 с. В.А.Широков та ін. Лінгвістично-інформа- ційні студії: Праці Українського мовно-інформаційного фонду НАН України: у 5 т. Том 1. Наукова парадигма та основні мовно-інформаційні структури. Київ, Україн- ський мовно-інформаційний фонд НАН України. 2018. 271 с. ISBN 978-966-02-8683-2. ISBN 978-966-02-8684-9 (Т. 1). DOI 10.33190/978-966-02-8683-2/8684-9. https:// movoznavstvo.org.ua/files/tom_1_B5_print.pdf. [2] Теорія семантичних станів: Широков В .  А. Феноме- нологія лексикографічних систем. – К. : Наук. думка, 2004. –  327 с.; В.А.Широков та ін. Лінгвістично-інфор- маційні студії: Праці Українського мовно-інформацій- ного фонду НАН України: у 5 т. Том 1. Наукова парадигма та основні мовно-інформаційні структури. Київ, Україн- ський мовно-інформаційний фонд НАН України. 2018. 271 с. ISBN 978-966-02-8683-2. ISBN 978-966-02-8684-9 (Т. 1). DOI 10.33190/978-966-02-8683-2/8684-9. https:// movoznavstvo.org.ua/files/tom_1_B5_print.pdf. [3] Широков В. А. Язык. Информация. Система. Palmarium Academic Publishing, 2017. ISBN 978-3-659-72403-9. 280 c.; ТЕХНОЛОГІЧНІ ЗАСАДИ ЛОГІКО-ЛІНГВІСТИЧНИХ ДОСЛІДЖЕНЬ ЗАКОНОДАВСТВА 14 [4] Широков  В.  А.  . Феноменологические основания для грамматического описания языка. В кн. «Когнитивно- семиотические аспекты моделирования в гуманитарной сфере». Под. ред. В.  Л.  Стефанюка, Э.  А.  Тайсиной. Институт прикладной семиотики Академии наук Татар- стана. ISBN 978-5-9690-0386-6. Изд-во АН Татарстана. 2017, С. 98 – 144. [5] Теорія слабкої синонімії: В. А. Широков та ін. Корпусна лінгвістика. – К.: Довіра, 2005, С. 390 – 393. [6] Правила оформления проектов законов и основные требования законодательной техники. Методические рекомендации Аппарата Верховной Рады Украины. Издание четвертое, исправленное и дополненное. Киев. 2014. – 39 с. Режим доступа: http://static.rada.gov.ua/site/ bills/info/zak_rules.pdf. [7] Лінгвістично-інформаційні студії: праці Українського мовно-інформаційного фонду НАН України: у 5  т. / В. А. Широков, М. В. Надутенко, С. С. Ющенко та ін. Т. 4.: Корпусна та когнітивна лінгвістика. – Київ: Укра- їнський мовно-інформаційний фонд НАН України, 2018. – 280 с. [8] Крыгин М., Широков В. Корпусные технологии при про- ведении лингвистических экспертиз. Прикладна лінг- вістика та лінгвістичні технології. Зб. наук. праць. НАН України, Укр. мовно-інформ. фонд [та ін.] / редкол.: Л. П. Крисін [та ін.]. Київ: Довіра, 2010. С. 130-140. [9] Oleksandr Y. Stryzhak, Нrihorii M. Potapov, Vitalii V. Prychodniuk, Roman I. Chepkov. Еволюція управління – від ситуаційного до трансдисциплінарного. В зб. наук. праць «Екологічна безпека та природокористування». Том 30, № 2 (2019). [10] Приходнюк В. В, Стрижак О. Є, Гайко С. І., Чепков Р. І. Інформаційно-аналітичний комплекс підтримки про- цесів трансдисциплінарних досліджень. В зб. наук. праць «Екологічна безпека та природокористування», 2018. [11] Dovgyi S., Stryzhak O. (2020) Transdisciplinary Fundamentals of Information-Analytical Activity. In: Ilchenko M., Uryvsky L., Globa L. (eds) Advances in Infor-mation and Communi- cation Technology and Systems. MCT 2019. Lecture Notes in Networks and Systems, vol 152. Springer, Cham. https:// doi.org/10.1007/978-3-030-58359-0_7. [12] Онтологические методы и средства обработки предмет- ных знаний: монография / А. В. Палагин, С. Л. Крывый, Н. Г .  Петренко. – Луганск: изд-во ВНУ им. В.  Даля, 2012. – 324 с. [13] Volodymyr Shyrokov, Iryna Ostapova, Maksym Nadutenko, Yulia Verbynenko. Ontologized lexicographical systems in modern terminography // Cognitive Studies | Etudes cogni- tives. – Warsaw, 2016. – P. 90–99. [14] Надутенко Максим, Надутенко Маргарита. Специ- фікація основних системних компонентів лінгвоста- тистичних засобів концептографічного маркування інформаційних ресурсів // Методологія та історіографія мовознавства: матеріали VI науково-практичної Інтер- нет-конференції (Слов’янськ, 23–24 жовтня 2019 р.). – Слов’янськ : ДДПУ, 2019. – C. 79–82. [15] Надутенко М. В. Загальний огляд та перспективи ви- користання національних лінгвістичних цифрових ре- сурсів Українського мовно-інформаційного фонду НАН України // Зб. праць конфер. Національний університет «Києво-Могилянська академія», 2020. – http://ekmair. ukma.edu.ua/handle/123456789/17607 [16] Ющенко С. Концепция рубрикатора языковых девиаций в актах первичного законодательства Украины. При- кладна лінгвістика та лінгвістичні технології. Зб. наук. праць. Редкол.: Л.  П.  Крисін [та ін.]. НАН України, Укр. мовно-інформ. фонд [та ін.]. Київ: Довіра, 2010. С.  234–242. http://megaling.ulif.org.ua/tezi-2013-rik/ yuschenko-svetlana. Надійшла до редколегії 18.09.2020 Широков В.А., Надутенко М.В., Стрижак О.Є., Ющенко С.С.