Последната лекция от курса оставихме за сбирката на 30 Май, а следващия път пропускаме заради празници. Обсъдихме с дошлите студенти как да протече разработването на курсовите проекти, споменахме как бихме искали да изглеждат възможни задачи, както и че сме напълно отворени за предложения от ваша страна. Предвиждаме да имате някъде около месец за това начинание. Поговорихме и за предстоящия тест, който ще е затворен и ще съдържа само материали, влизащи в нашите презентации (ppt).

Реално тази дискусия запълни донякъде времето за лекция. Така имахме повече време за упражнения от обичайното. Продължихме борбата да подкараме inverted index примера, през голяма част от времето troubleshoot-вахме различни проблеми с Hadoop, не малко време и усилия ни отне и да накараме кода ни да се компилира. Все пак при някои от вас успяхме да run-нем въпросния job :)

За по-нататъшни идеи, имахме доброто желание да разширим примера, като се добави функционалност за търсене: за дадена дума да се изведат нейните срещания заедно с някакъв кратък заобикалящ я текст, с цел подсещане за контекста, в който е използвана. Както и да помислим за търсене, което поддържа AND и OR: например, може да погледнете тук.

А пък си мислехме, ако остане време, и да пробваме да пуснем Page Rank job върху някакво множество от Wikipedia страници, но това се оказаха май съвсем смели мечти :).


Поздрави,
Крум, Лазар.
Последно модифициране: събота, 12 ноември 2011, 17:38