http://www.w3.org/1999/xlink http://www.w3.org/1999/xlink

Статус проекта: победитель конкурса

Бурятско-русский онлайн-переводчик на основе нейросетевых моделей

  • Конкурс Конкурс субсидий СОНКО Бурятия в 2023 году
  • Грантовое направление Развитие межнационального сотрудничества, сохранение и защита самобытности, культуры, языков и традиций народов Российской Федерации
  • Рейтинг заявки 59,83
  • Номер заявки Р03-23-1-000126
  • Дата подачи 03.04.2023
  • Размер гранта 997 800,00
  • Cофинансирование 360 000,00
  • Общая сумма расходов на реализацию проекта  1 357 800,00
  • Сроки реализации 19.06.2023 - 12.06.2025
  • Организация РЕСПУБЛИКАНСКАЯ ОБЩЕСТВЕННАЯ ОРГАНИЗАЦИЯ "БАЙКАЛЬСКИЙ БУРЯТСКИЙ ЦЕНТР КОРЕННЫХ КУЛЬТУР"
  • ИНН 0326545627
  • ОГРН 1160327055536

Краткое описание

Проект будет направлен на создание бурятско-русского параллельного корпуса и онлайн-переводчика на основе нейросетевых моделей и . Переводчик будет размещен на web-сайте, подобно Яндекс-переводчику и Гугл-переводчику. Перевод текстов будет осуществляться с бурятского языка на русский язык, а также в обратную сторону. Целью данного проекта является популяризация и сохранение бурятского языка.

Цель

  1. Создание онлайн-переводчика, который поможет популяризации и сохранению бурятского языка. Использование онлайн-переводчика с возможностью переводить целиком предложения поможет взрослым и детям изучать родной бурятский язык.

Задачи

  1. Поиск в интернете монголо-русского параллельного корпуса, его подготовка для обучения нейросетевой модели;
  2. Поиск переводчиков и лингвистов по бурятскому языку, привлечение волонтеров для перевода текстов;
  3. Наполнение бурятско-русского параллельного корпуса переводами текстов, осуществленными переводчиками и волонтерами, минимум 100тыс. предложений;
  4. Разработка web-сайта;
  5. Обучение нейросетевой модели данными монголо-русского и бурятско-русского параллельного корпуса. Тестирование версий переводчика, исправление ошибок, корректировка модели, а также улучшение качества перевода;
  6. Доработка web-сайта. Запуск онлайн-переводчика.
  7. Предложить включить бурятский язык в Яндекс-переводчик. Для этого можно будет использовать обученные нейросетевые модели и накопленные материалы бурятско-русского параллельного корпуса.

Обоснование социальной значимости

Дети школьного возраста: 5000
Взрослые, заинтересованные в сохранении родного языка, также изучающие бурятский язык: 20000
Среди детей и молодежи продолжается процесс сокращения количества владеющих бурятским языком. Данные мониторинга уровня владения бурятским языком (2016 - 2018 гг.) свидетельствуют о том, что 27% из 42235 учащихся-бурят средних общеобразовательных школ не владеют родным языком. В общеобразовательных школах продолжает сокращаться объем часов изучения бурятского языка как государственного и как родного. В обучении бурятскому языку как государственному остается нерешенной проблема недостаточного развития у детей навыков устной коммуникации. Даже в сельских поселениях с бурятским населением дети говорят на русском языке. Бурятский язык как государственный все еще не стал рабочим языком в органах государственной и муниципальной власти Республики Бурятия и слабо представлен в других сферах общественной жизни. Одними из факторов, сдерживающих сохранение и развитие бурятского языка в Республике Бурятия это:
- недостаточно развитый уровень бурятской языковой среды в Республике Бурятия;
- очень мало создано современных цифровых и электронных средств обучения бурятскому языку (мобильных приложений, интерактивных игр, тренажеров, курсов и др.);
- почти полное отсутствие бурятского языка в сети Интернет;
Если бурятского языка не будет в Интернете, неважно, приложения это, соцсети или мессенджеры, то язык умрет вместе со старшим поколением, читающим газеты и журналы на родном языке.
Данные взяты из Постановления Правительства Республики Бурятия №228 от 08.05.2019 (http://publication.pravo.gov.ru/Document/View/0300201905160008?rangeSize=20).
https://gazeta-n1.ru/news/society/89437/

География проекта

Российская Федерация

Целевые группы

  1. Дети школьного возраста
  2. Взрослые, заинтересованные в сохранении родного языка, также изучающие бурятский язык.

Контактная информация

Респ Бурятия, г Улан-Удэ, Железнодорожный р-н, ул Юннатов, д 18, кв 1