Публікація:
Нейромережева технологія багатомовної класифікації електронних текстів

dc.contributor.authorДудник, М. П.
dc.contributor.authorУдовенко, С. Г.
dc.contributor.authorЧала, Л. Е.
dc.contributor.authorСоколовська, М. M.
dc.date.accessioned2023-11-22T18:11:15Z
dc.date.available2023-11-22T18:11:15Z
dc.date.issued2021
dc.description.abstractСтаттю присвячено розробці технології побудови багатомовних класифікаторів, яка основана на нейромережевій обробці векторного подання текстів, згенерованого за допомогою моделі XLM-RoBerta. Розглянуто переваги використання для векторизації текстів рекуррентної нейронної мережі на основі трансформеру моделі XLM-RoBerta. Наведено схему взаємодії розробленого класифікатору на основі мережі LSTM з моделлю векторизації текстів. Запропоноване архітектурне рішення обумовлено необхідністю оптимізації витрат ресурсів та їх економії під час використання моделі у релізному середовищі за допомогою розробленого веб-сервісу. Здійснено програмну реалізацію запропонованої технології класифікації. Програмний додаток реалізовано засобами мови програмування Python за допомогою бібліотеки для машинного навчання TensorFlow та комплексної платформи Tensorflow Extended. Серверну частину реалізовано з використанням фреймворку aiohttp. Експериментальне дослідження розробленого класифікатору текстів здійснено з використанням News Category Dataset, що представляє собою багатомовні заголовки текстових новин. Застосування запропонова ної технології класифікації характеризується незначним погіршенням показників якості під час зміни мови, що дозволяє розробляти багатомовні моделі без втрати їх продуктивності при зміні мови вхідних даних. Результати тестування підтверджують ефективність наведеного підходу.
dc.identifier.citationНейромережева технологія багатомовної класифікації електронних текстів / М. П. Дудник, С. Г. Удовенко, Л. Е. Чала, М. M. Соколовська // Бионика интеллекта : научно-технический журнал. – 2021. – № 2(97). – С. 3–12.
dc.identifier.urihttps://openarchive.nure.ua/handle/document/24891
dc.language.isouk
dc.publisherХНУРЕ
dc.subjectвекторизація багатомовних текстів
dc.subjectмодель xlm-roberta
dc.subjectнейромережевий класифікатор багатомовних текстів
dc.subjectмережа lstm
dc.subjectсервер обробки запитів
dc.titleНейромережева технологія багатомовної класифікації електронних текстів
dc.typeArticle
dspace.entity.typePublication

Файли

Оригінальний пакет
Зараз показано 1 - 1 з 1
Завантаження...
Зображення мініатюри
Назва:
Bionika_2021_N2_3-12.pdf
Розмір:
719.01 KB
Формат:
Adobe Portable Document Format
Ліцензійний пакет
Зараз показано 1 - 1 з 1
Немає доступних мініатюр
Назва:
license.txt
Розмір:
9.64 KB
Формат:
Item-specific license agreed upon to submission
Опис: