Настройки на записването
Статистически машинен превод
студенти от ФМИ на СУ
екип
Калифорнийски университет в
Бъркли
демонстратор: Асен Александров СУ „Св. Климент Охридски”, ФМИ Програма и
записване Предварителна програма на курса:
https://learn.fmi.uni-sofia.bg/ За регистрационен ключ, моля пишете на preslav
-at- fmi.uni-sofia.bg. Анотация
на курса Целта
на „Статистически машинен превод” е да запознае студентите със съвременните , както от
теоретична, така и от практическа гледна точка. Курсът започва с кратък
исторически преглед и обзор на основните проблеми и подходи, след което се
фокусира върху доминиращите днес статистически методи, базирани на двуезиков
корпус: автоматично подравняване на ниво дума с моделите на IBM с последващо
автоматично извличане на фрази по метода на Pharaoh. Обърнато е внимание на
съпътващите детайли, включително: подобрения на моделите на IBM, марковски
модели, евристики при извличане на фрази, декодиране, оценка на качеството на
превода и др. Засегнати са и последните новости в областта: йерархичен модел на
Чианг и синтактичен машинен превод. Успоредно с теорията, студентите ще се
запознаят с най-важните свободнодостъпни програми и ресурси, и ще се научат да
ги комбинират в реални системи за машинен превод.Изисквания: - Курсът изисква задължително добро владеене на английски език. - Някои от темите изискват добра математическа подготовка. - Предварителни познания по компютърна лингвистика и обработка на естествен
език биха били полезни, но не са задължителни. Изпити и оценки: Курсът се провежда дистанционно. Всяка
седмица студентите ще четат една или две статии (около 8-15 страници), върху която
ще предават резюме от 150 думи (За любознателните, сайтът на курса ще предлага допълнителни
материали по всяка тема: статии, презентации, връзки към ресурси и др.). По
време на семестъра ще има няколко домашни
работи, изискващи анализ на теоретичен или практически
проблем. В края на семестъра ще се защитава практическикурсов проект в групи от
по 2-3 души. Ще има два теста: един в средата на семестъра и един по време на сесията. Крайната
оценка се формира както следва: резюмета – 10%, домашни работи – 30%, курсов
проект – 30%, тестове – 30%.%
Оценка
50 – 59%
Среден 3
60 – 69%
Добър 4
70 – 79%
Мн. добър 5
80 – 100%
Отличен 6
език биха били полезни, но не са задължителни.
седмица студентите ще четат една или две статии (около 8-15 страници), върху която
ще предават резюме от 150 думи (За любознателните, сайтът на курса ще предлага допълнителни
материали по всяка тема: статии, презентации, връзки към ресурси и др.). По
време на семестъра ще има няколко домашни
работи, изискващи анализ на теоретичен или практически
проблем. В края на семестъра ще се защитава практическикурсов проект в групи от
по 2-3 души. Ще има два теста: един в средата на семестъра и един по време на сесията. Крайната
оценка се формира както следва: резюмета – 10%, домашни работи – 30%, курсов
проект – 30%, тестове – 30%.
% | Оценка |
50 – 59% | Среден 3 |
60 – 69% | Добър 4 |
70 – 79% | Мн. добър 5 |
80 – 100% | Отличен 6 |
- Преподавател: Preslav Nakov