Искусственный интеллект научат понимать и генерировать текст на татарском языке

Искусственный интеллект научат понимать и генерировать текст на татарском языке

Академия наук Республики Татарстан, Университет Иннополис и Институт AIRI подписали соглашение в рамках XVI Международного экономического форума «Россия – Исламский мир: KazanForum». Организации обучат искусственный интеллект работе с языками малых народов России, в первую очередь, над татарским, сообщил вице-президент Академии наук Республики Татарстан Айрат Хасьянов.

ИИ будет работать в области Natural Language Processing (NLP) – это обработка естественного языка. Это направление изучает проблемы компьютерного анализа (понимания) и синтеза (генерации) текстов на естественных языках.

«Сегодня мы подписали соглашение с Институтом AIRI – это ведущая в России структура, которая занимается искусственным интеллектом. Наработки по NLP можно будет использовать для всех тюркских языков. Мы планируем двигаться в направлении трансляции результатов для применения в решении задач других языков России. Ближайшее, что мы планируем сделать – это провести совместную конференцию на Kazan Digital Week, посвященную ИИ, провести хакатон по технологиям обработки естественного языка», — отметил Хасьянов.

Руководитель группы «Domain-specific NLP» Института AIRI, доктор физико-математических наук Елена Тутубалина рассказала, что ее подразделение занимается исследованиями, связанными с обобщающей способностью языковых моделей.

«Одна из проблем при работе с языковыми моделями в том, что чаще всего мы не можем с уверенностью сказать, правдива ли информация, которую они предоставляют пользователю. Лучше ее фильтровать. Мы изучаем, как избежать неверной информации и не показывать ее пользователю, выбрать те сценарии, где клиенту можно с ней взаимодействовать. В рамках соглашения мы будем заниматься развитием языковых моделей, в том числе и на татарском языке», — отметила Тутубалина.

Партнером по аппаратному обеспечению выступает МГТУ им. Баумана. В университете занимаются суперкомпьютерами «Тераграф», на которых происходит перевод большого цифрового языкового наследия Татарстана, добавил Хасьянов.

«Мы создаем технологическую платформу для того, чтобы реализовывать перспективные языковые модели. Мы подразумеваем под этим использование графов знаний. Это некоторый уход от исключительно нейросетевого подхода к естественному представлению знаний в виде связанных фактов. Эту задачу мы рассматриваем как новую вычислительную идею, которая приводит к тому, что надо переделывать аппаратное обеспечение», — сказал руководитель лаборатории гетерогенных вычислительных систем DISC, руководитель проекта «Тераграф» МГТУ им. Баумана, доктор технических наук Алексей Попов.

***

Международный экономический форум «Россия – Исламский мир: KazanForum», который в 2022 году указом президента России получил федеральный статус, проходит 14-16 мая 2025 года в 16-й раз. В программе 200 мероприятий, включая: съезд министров транспорта исламских стран; съезд министров культуры исламских стран; съезд генеральных прокуроров исламских стран, съезд аудиторов исламских стран, крупнейшую мировую конференцию по исламским финансам, конференции по халяль индустрии, форум торгово-промышленных палат исламских стран, а также международные выставки по экономике, торговле и недвижимости более 40 тыс. кв. м. Регистрацию в 2025 году прошли представители 103 стран. В 2024 году мероприятие собрало более 20 тыс. участников из 87 стран мира, 87 субъектов РФ и более 40 дипломатических миссий.
Регистрация