Проект ТОП-ИИ

Отраслевой модуль

ТОП-ИИ

Искусственный интеллект
в лингвистике

(социальная сфера, история, культура)

Модуль разработан для внедрения
в образовательные программы вузов

Период проведения

Рекомендуется
студентам со 2 курса

Объем модуля

152 ак. часа

Формат обучения

Онлайн (очный с применением дистанционных технологий)

Узнать о внедрении модуля в ваш вуз

О модуле

Модуль ориентирован на подготовку специалистов в области лингвистики, прикладной филологии и языковых технологий, обладающих практическими навыками интеграции технологий искусственного интеллекта в профессиональную деятельность. В нём рассматриваются современные ИИ-решения и инструменты для задач автоматической обработки естественного языка, машинного перевода, анализа тональности и семантики текста, извлечения информации, автоматического реферирования, а также создания и исследования языковых корпусов.

Модуль разработан в рамках проекта ТОП-ИИ Минцифры России при участии АНО «Аналитический центр при Правительстве Российской Федерации» и предлагается вузам для внедрения в образовательные программы высшего образования.

Включение модуля в образовательный процесс позволяет усилить прикладную и отраслевую направленность подготовки, обеспечить связь лингвистических компетенций обучающихся с актуальными запросами индустрии и сформировать у студентов базовые навыки работы с языковыми данными, инструментами NLP и прикладными ИИ-решениями, востребованными в сфере языковых технологий, локализации, речевой аналитики и интеллектуальной обработки текста.

Для кого подготовлен

Модуль предполагается к прохождению студентами 2-ого курса бакалавриата и старше. Реализуется как компонент основной профессиональной образовательной программы (ОПОП) по следующим направлениям:

  • 42.03.01 - Реклама и связи с общественностью
  • 42.03.02 - Журналистика
  • 42.03.03 - Издательское дело
  • 45.03.01 - Филология
  • 45.03.02 - Лингвистика
  • 45.03.03 - Фундаментальная и прикладная лингвистика
  • 45.03.04 - Интеллектуальные системы в гуманитарной сфере
  • 42.04.01 - Реклама и связи с общественностью
  • 42.04.02 - Журналистика
  • 42.04.03 - Издательское дело
  • 45.04.01 - Филология
  • 45.04.02 - Лингвистика
  • 45.04.03 - Фундаментальная и прикладная лингвистика
  • 45.04.04 - Интеллектуальные системы в гуманитарной среде

Формат обучения

Продолжительность общая

1 семестр, 4 зачетные единицы

152 ак.ч.: 70 ак.ч. онлайн-курс, 28 ак.ч. семинары, 54 ак.ч. самостоятельная работа

Условия реализации

Сетевой договор о реализации дисциплины

Модуль должен быть включен в учебный план как обязательная дисциплина

Формат обучения Онлайн (очный с применением дистанционных технологий)
Язык обучения Русский

Программа обучения

Отраслевой модуль раскрывает возможности применения искусственного интеллекта для решения ключевых задач в области лингвистики и языковых технологий: автоматической обработки и анализа текста, машинного перевода и локализации, извлечения информации, анализа тональности и семантики, работы с языковыми корпусами, а также создания интеллектуальных речевых и диалоговых систем.

ИИ в лингвистике (19 ак.ч.)

Простая обработка текстов (19 ак.ч.)

Грамматика и выделение именованных сущностей (19 ак.ч.)

Анализ тональности (19 ак.ч.)

Тематическое моделирование (21 ак.ч.)

ИИ, этика и лингвистика (21 ак.ч.)

ИИ-агенты (совместно с компанией Яндекс)

Итоговый проект

Технологический стек модуля

Инструмент для автоматизации процессов, сбора и обработки данных
Alice AI — новое семейство моделей Яндекса. В нём собраны самые мощные модели Яндекса — Alice AI LLM (текстовая), Alice AI VLM (визуально-текстовая) и Alice AI ART (картиночная).
Диалоговая ИИ-модель от Сбера, которая отвечает на вопросы, сочиняет тексты, пишет код и рисует картинки.
Мощная линейка мультимодальных нейросетей и ИИ-ассистентов, разработанная китайским технологическим гигантом Alibaba
Передовая нейросеть и семейство больших языковых моделей (LLM), разработанные китайской исследовательской компанией DeepSeek-AI.

 

 

Разработан в партнерстве

Совместно с партнером разработана тема «ИИ-агенты» модуля

Разработчики, преподаватели, эксперты

Касьяненко Дарья Алексеевна

Департамент больших данных и информационного поиска: Заместитель руководителя департамента

Климов Александр Антонович

Школа лингвистики: Старший преподаватель

Никулин Тимофей Русланович

Факультет компьютерных наук: Руководитель проекта

Паршина Анастасия Алексеевна

Отдел развития цифровых компетенций: Методист

Рословцева Кристина Олеговна

Отдел развития цифровых компетенций: Начальник отдела

Сошников Дмитрий Валерьевич

Департамент программной инженерии: Доцент

 

Результаты обучения

Анализировать возможности применения ИИ в лингвистике

Слушатель сможет соотносить лингвистические задачи (морфологический и синтаксический разбор, семантический анализ, дискурсивный анализ, машинный перевод, терминологическая разметка) с подходящими ИИ‑подходами и инструментами и определять, в каких кейсах использование ИИ дает наибольший практический эффект для научных и прикладных проектов.

Работать с текстовыми корпусами и лингвистическими данными для задач ИИ

Слушатель сможет подбирать и формировать корпуса, очищать и аннотировать тексты, применять базовые методы препроцессинга (токенизация, лемматизация, разметка частей речи и синтаксических зависимостей) и подготавливать лингвистические данные к использованию в моделях машинного обучения и языковых моделях.

Применять модели ИИ к решению лингвистических задач

Слушатель сможет использовать современные модели (включая языковые модели и нейросетевые архитектуры) для решения задач классификации текстов, извлечения информации, машинного перевода, суммаризации, генерации текста и языкового моделирования, интерпретируя полученные результаты с точки зрения лингвистики.

Оценивать качество и ограничения ИИ‑подходов в лингвистике

Слушатель сможет подбирать метрики для оценки качества решений (точность, полнота, F‑мера, BLEU, METEOR и другие), анализировать типичные ошибки моделей на лингвистическом материале, выявлять влияние языковых и жанровых особенностей на результат и формулировать ограничения применимости конкретных моделей.

Учитывать междисциплинарные, этические и практические аспекты применения ИИ в лингвистике

Слушатель сможет учитывать взаимодействие ИИ и лингвистики с другими областями (образование, медиа, перевод, культурное наследие), выявлять этические и социальные риски (предвзятость данных, искажение языковых норм, влияние на профессию переводчика и лингвиста) и формулировать рекомендации по ответственному и научно обоснованному использованию ИИ в лингвистических проектах.

Преимущества и условия внедрения модуля

01

Повышение практикоориентированности подготовки за счет включения в образовательную программу актуальных сценариев применения ИИ в лингвистике

02

Усиление связи образования с запросами индустрии благодаря изучению востребованных инструментов и задач, связанных с безопасностью, качеством, эффективностью и управлением на основе данных

03

Расширение прикладных компетенций обучающихся через освоение современных подходов к работе с данными, автоматизации, аналитике и созданию прототипов ИИ решений

04

Модуль предлагается вузам, реализующим программы высшего образования соответствующего отраслевого профиля

Уже реализуют модуль

Федеральное государственное бюджетное образовательное учреждение
высшего образования «Череповецкий государственный университет»

Программа: «Лингвистика: Перевод и переводоведение» (бакалавриат). Период проведения: 1 курс 2 семестр

 

Что нужно знать студенту на старте

Пререквизиты. Учебные курсы, которые студент должен освоить перед началом обучения по модулю: 

  • Введение в языкознание
  • Введение в прикладную лингвистику
  • Компьютерная лингвистика (базовый курс)
  • Корпусная лингвистика
  • Цифровые технологии в гуманитарных исследованиях (опционально)
  • Основы программирования для лингвистов (опционально)