Міністерство реінтеграції тимчасово окупованих територій України працює над створенням Національного корпусу кримськотатарської мови (НККМ).
Онлайн-платформа служитиме центром дослідження та аналізу кримськотатарської мови на основі текстових матеріалів. Збір друкованих та електронних текстів для створення Корпусу розпочався у жовтні 2022 року.
За майже 8 місяців до каталогу внесли понад 800 матеріалів від більш як 200 авторів. Наразі 54% матеріалів пройшли процедуру розпізнавання та форматування. Завантаження на платформу Корпусу вже підготовлено на четверть від запланованого обсягу матеріалів.
Наразі команда працює над завершенням тестування програмних елементів платформи, а також розробкою інструкцій для майбутніх користувачів.
Проєкт Національного корпусу кримськотатарської мови представили на 17-й конференції Європейського відділення Асоціації комп’ютерної лінгвістики у Хорватії.
У каталозі вже представлені матеріали 4 графічними системами, що використовувалися в кримськотатарській мові: арабською графікою, довоєнною латиницею, кирилицею та сучасною латиницею. Найстаріший твір датований 13 століттям, а найсучасніший 2023 року.
Усі охочі можуть долучитися до створення онлайн-бази за посиланням.
Кримськотатарська мова — це рідна мова кримських татар, сформована у XIV-XVII століттях на основі кипчацьких мов у Криму. Поширена в Криму та інших районах проживання цього народу. На письмі використовують латинську або кириличну абетки. Мова втратила багатьох носіїв внаслідок депортації та русифікації кримських татар. ЮНЕСКО зарахувало її до списку мов, що вмирають.
Читати також:
- 64% опитаних вважають, що Україна має намагатися звільнити всю територію включно з Кримом, навіть якщо буде ризик зменшення підтримки Заходу та продовження війни.
- В Україні запустили курс про Крим та українську політику деокупації та реінтеграції.
- Листи до вільного Криму: В Україні запустили ініціативу з підтримки кримських політв’язнів.
Підписуйтесь на нас у Telegram і Facebook, переглядайте YouTube та TikTok.