Публікація: Нейромережева технологія багатомовної класифікації електронних текстів
dc.contributor.author | Дудник, М. П. | |
dc.contributor.author | Удовенко, С. Г. | |
dc.contributor.author | Чала, Л. Е. | |
dc.contributor.author | Соколовська, М. M. | |
dc.date.accessioned | 2023-11-22T18:11:15Z | |
dc.date.available | 2023-11-22T18:11:15Z | |
dc.date.issued | 2021 | |
dc.description.abstract | Статтю присвячено розробці технології побудови багатомовних класифікаторів, яка основана на нейромережевій обробці векторного подання текстів, згенерованого за допомогою моделі XLM-RoBerta. Розглянуто переваги використання для векторизації текстів рекуррентної нейронної мережі на основі трансформеру моделі XLM-RoBerta. Наведено схему взаємодії розробленого класифікатору на основі мережі LSTM з моделлю векторизації текстів. Запропоноване архітектурне рішення обумовлено необхідністю оптимізації витрат ресурсів та їх економії під час використання моделі у релізному середовищі за допомогою розробленого веб-сервісу. Здійснено програмну реалізацію запропонованої технології класифікації. Програмний додаток реалізовано засобами мови програмування Python за допомогою бібліотеки для машинного навчання TensorFlow та комплексної платформи Tensorflow Extended. Серверну частину реалізовано з використанням фреймворку aiohttp. Експериментальне дослідження розробленого класифікатору текстів здійснено з використанням News Category Dataset, що представляє собою багатомовні заголовки текстових новин. Застосування запропонова ної технології класифікації характеризується незначним погіршенням показників якості під час зміни мови, що дозволяє розробляти багатомовні моделі без втрати їх продуктивності при зміні мови вхідних даних. Результати тестування підтверджують ефективність наведеного підходу. | |
dc.identifier.citation | Нейромережева технологія багатомовної класифікації електронних текстів / М. П. Дудник, С. Г. Удовенко, Л. Е. Чала, М. M. Соколовська // Бионика интеллекта : научно-технический журнал. – 2021. – № 2(97). – С. 3–12. | |
dc.identifier.uri | https://openarchive.nure.ua/handle/document/24891 | |
dc.language.iso | uk | |
dc.publisher | ХНУРЕ | |
dc.subject | векторизація багатомовних текстів | |
dc.subject | модель xlm-roberta | |
dc.subject | нейромережевий класифікатор багатомовних текстів | |
dc.subject | мережа lstm | |
dc.subject | сервер обробки запитів | |
dc.title | Нейромережева технологія багатомовної класифікації електронних текстів | |
dc.type | Article | |
dspace.entity.type | Publication |
Файли
Оригінальний пакет
1 - 1 з 1
Завантаження...
- Назва:
- Bionika_2021_N2_3-12.pdf
- Розмір:
- 719.01 KB
- Формат:
- Adobe Portable Document Format
Ліцензійний пакет
1 - 1 з 1
Немає доступних мініатюр
- Назва:
- license.txt
- Розмір:
- 9.64 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: