Enrolment options



Статистически машинен преводЕдносеместриален изборен курс (0+3+3) за
студенти от ФМИ на СУ
Преподавателски
екип
лектор: Преслав Наков

Калифорнийски университет в
Бъркли

демонстратор: Асен АлександровСУ „Св. Климент Охридски”, ФМИПрограма и
записване
Предварителна програма на курса:
https://learn.fmi.uni-sofia.bg/
За регистрационен ключ, моля пишете на preslav
-at- fmi.uni-sofia.bg.
Анотация
на курса
Целта
на „Статистически машинен превод” е да запознае студентите със съвременните , както от
теоретична, така и от практическа гледна точка. Курсът започва с кратък
исторически преглед и обзор на основните проблеми и подходи, след което се
фокусира върху доминиращите днес статистически методи, базирани на двуезиков
корпус: автоматично подравняване на ниво дума с моделите на IBM с последващо
автоматично извличане на фрази по метода на Pharaoh. Обърнато е внимание на
съпътващите детайли, включително: подобрения на моделите на IBM, марковски
модели, евристики при извличане на фрази, декодиране, оценка на качеството на
превода и др. Засегнати са и последните новости в областта: йерархичен модел на
Чианг и синтактичен машинен превод. Успоредно с теорията, студентите ще се
запознаят с най-важните свободнодостъпни програми и ресурси, и ще се научат да
ги комбинират в реални системи за машинен превод.

Изисквания:- Курсът изисква задължително добро владеене на английски език.- Някои от темите изискват добра математическа подготовка.- Предварителни познания по компютърна лингвистика и обработка на естествен
език биха били полезни, но не са задължителни.
Изпити и оценки:Курсът се провежда дистанционно. Всяка
седмица студентите ще четат една или две статии (около 8-15 страници), върху която
ще предават
резюме от 150 думи (За любознателните, сайтът на курса ще предлага допълнителни
материали по всяка тема: статии, презентации, връзки към ресурси и др.). По
време на семестъра ще има няколко
домашни
работи
, изискващи анализ на теоретичен или практически
проблем. В края на семестъра ще се защитава
практическикурсов проект в групи от
по 2-3 души. Ще има
два теста: един в средата на семестъра и един по време на сесията. Крайната
оценка се формира както следва: резюмета – 10%, домашни работи – 30%, курсов
проект – 30%, тестове – 30%.

%

Оценка

50 – 59%

Среден 3

60 – 69%

Добър 4

70 – 79%

Мн. добър 5

80 – 100%

Отличен 6



Self enrolment (Student)
Self enrolment (Student)