Задача - структуироавть данные вебсайт Ted.com по такому принципу (смотри в табличке).
https://docs.google.com/spreadsheets/d/1Kf59MDfNcZfzxcZTAyRvyhUo3pxHl-Y5K7NHrfmH2JY/edit#gid=0
Часть начата для примера.
По такому принципу брать входные данные.
Первая часть http://screencast.com/t/KU9sObDmI
Вторая часть http://screencast.com/t/U52nm1eTZEF
Третья часть http://screencast.com/t/yVEoWD0hPheS
Часть четвертая http://screencast.com/t/lh8ewUUlE
Дополнительно будет оплачивать также каждый найденный email и ссылка на LinkedIn.
Всего на сайте около 2000 ролик. Но нужно добавить информацию о первых 500 роликов, то есть тех которые были снято раньше остальных.