О проекте внедрения чеченского языка в компьютерные технологии

В отделе прикладной семиотики Академии наук Чеченской Республики с 2014 года разрабатывается проект  «Чеченская локализация компьютерных программ».

Цель проекта.

  • Перевод на чеченский язык и адаптация к национальным традициям и обычаям часто используемых программ для компьютеров и мобильных устройств.
  • Автоматизированная проверка правописания текстов на чеченском языке.
  • Автоматизированный перевод чеченских текстов на другие языки и обратно.
  • Синтез и распознавание чеченской речи.

Этапы выполнения проекта.

  • Преобразование всех изданных словарей чеченского языка в цифровой машинно-обрабатываемый формат (выполнено, см. сайт отдела) .
  • Создание приложения для удобства набора на клавиатуре чеченских текстов (выполнено, компьютерная программа Elp-I).
  • Создание лексической базы данных чеченского языка (выполнено, база данных на основе словаря Мациева содержит 3 млн. слов и словоформ).
  • Создание системы автоматизированной системы проверки правописания (частично выполнено, для OS Linux создана система проверки орфографии чеченского языка).
  • На основе изданных словарей создан онлайн чеченско-русский, русско-чеченский словарь «Дикдошам» (выполнено, см. сайт отдела).
  • Подготовка предложений по изменению орфографии чеченского языка (выполнено).
  • Подготовка корпуса чеченского языка.
  • Подготовка 20-ти часовой звуковой базы языка (выполнено).
  • Создание системы синтеза чеченского языка (частично выполнено, online-система на компьютерах и смартфонах читает тексты на чеченском, http://dosh-speech.ru/ ).
  • Создание системы распознавания чеченского языка.
  • Создание систем машинного перевода чеченского языка.
  • Локализация компьютерных программ.

Состояние дел.

  1. В отделе прикладной семиотики АН ЧР работают 6 научных сотрудников – 4 программиста и 2 филолога (для реализации подобного проекта в Академии наук Татарстана в 1993 году создан НИИ Прикладной семиотики).

Созданная на основе изданного ещё в 1961 году словаря Мациева и существующей орфографии система проверки правописания несовершенна. На основе новой орфографии, утвержденной Указом Главы ЧР Р.А. Кадырова, модифицируется созданная лексическая база чеченского языка и планируется подготовка приложений для автоматического изменения текстов в соответствии с новой орфографией.