Прошел семинар

На еженедельном семинаре отдела прикладной семиотики выступил н.с. Хехаев Мохьмад-Салех с докладом на тему «Методы машинного обучения и нейронных сетей для решения актуальных проблем естественных языков». Выделены основные классификации нейросетевых алгоритмов и определен метод, который применим для распознавания омонимов в текстах на чеченском языке. Это Мультиномиальный Байессовский классификатор – популярный алгоритм, который хорошо зарекомендовал себя для решения проблем классификации. В отделе идет работа по созданию текстового корпуса, из которого извлекаются при помощи программы предложения с омонимами. В качестве входной информации для нейросети использовались эти базы, включающие предложения с омонимами в различных контекстах, размеченные по значениям. Было проведено экспериментальное обучение, которое показало вполне приемлемый результат по распознаванию омографов в текстах на чеченском языке (Дала – 88%, ча – 84 % точности распознавания). После обсуждения результатов эксперимента было решено провести дальнейшие исследования: увеличить базу предложений с омонимами и запустить обучение для других омонимов.