Процесс перевода и синхронизации десятков тысяч предложений и разнообразных текстов помогает моделировать нейронная сеть
Ведущий ВУЗ Мордовии восполняет пробел в цифровизации двух национальных языков республики — эрзянского и мокшанского. Для них разрабатываются онлайн-переводчики на русский язык, которые призваны создать условия для сохранения и развития национальных языков в современных реалиях.
По данным Федерального агентства по делам национальностей, вплоть до последнего времени в России только шесть национальных языков имели возмозжность онлайн-перевода на русский. Сейчас этим инструментом могут воспользоваться жители Татарстана, Удмуртии, Башкирии, Чувашии, Бурятии и Марий-Эл. Скоро к ним присоединится и Мордовия.
В настоящее время ученые МГУ им.Н.П.Огарева в онлайн-переводчике с эрзянского сформировали так называемые выравненные тексты, содержащие около 50 тысяч предложений. В ближайшее время к этому показателю будет приближен и мокшанский язык. ВУЗ получил на эти цели грант в размере 8,5 миллионов рублей, и планирует закончить работу уже в этом году.
Примечательно, что в ходе перевода и синхронизации десятков тысяч предложений и разнообразных текстов ученые задействуют возможности нейросетей. Например, ведется сбор аудиозаписей на национальных языках для решения задач синтеза и распознавания речи. К слову, уже сейчас в телеграм в тестовом режиме работает чат-бот по переводу с эрзянского на русский и обратно.