Электронный каталог

как искать?

8 (800) 100-5790
8 (499) 557-0470
8 (495) 695-5790
На главную /  Сотрудничество /  / /  TEL (The European Library)  /  «Europeana Newspapers» — 20 миллионов страниц периодики

«Europeana Newspapers» — 20 миллионов страниц периодики

 


Но­вый про­ект Ев­ро­пей­ской биб­лио­те­ки «Europeana Newspapers» от­кры­ва­ет сво­бод­ный до­ступ к по­чти 12 мил­ли­о­нам оциф­ро­ван­ных га­зет­ных стра­ниц, предо­став­лен­ных 14 биб­лио­те­ка­ми из 8 стран на 16 язы­ках. Стра­ни­цы га­зет от­ска­ни­ро­ва­ны и об­ра­бо­та­ны: рас­по­знан текст ста­тей, до­сту­пен по­ста­тей­ный пол­но­тек­сто­вой по­иск, а так­же на­ви­га­ция по да­там, на­зва­ни­ям га­зет, стра­нам...

Ра­бо­та над про­ек­том на­ча­лась в 2012 го­ду при под­держ­ке Ев­ро­пей­ской ко­мис­сии. В нем участ­ву­ют 18 биб­лио­тек-парт­не­ров под ру­ко­вод­ством Бер­лин­ской го­су­дар­ствен­ной биб­лио­те­ки (Staatsbibliothek zu Berlin). Ос­нов­ным спон­со­ром про­ек­та выступила Ев­ро­пей­ская ко­мис­сия, предо­ста­вив­шая 4,1 млн ев­ро из 5,2 млн об­щего бюд­жета про­ек­та.

В са­мом на­ча­ле пу­ти, в 2012 го­ду, бы­ла про­ве­де­на ис­сле­до­ва­тель­ская часть ра­бо­ты — со­бра­на ин­фор­ма­ция по всем га­зет­ным кол­лек­ци­ям, оциф­ро­ван­ным на­ци­о­наль­ны­ми, на­уч­ны­ми и пуб­лич­ны­ми биб­лио­те­ка­ми Ев­ро­пы. Это вы­яви­ло ла­ку­ну в оциф­ров­ке: га­зе­ты ХХ ве­ка, или, как ска­зал ру­ко­во­ди­тель ав­стра­лий­ско­го про­ек­та по оциф­ров­ке пе­ри­о­ди­ки Тим Ше­ратт (Tim Sheratt), «кон­тент, раз­бив­ший­ся о ска­лу ко­пи­рай­та», ко­то­рый ока­зал­ся не­до­сту­пен вслед­ствие дей­ствия за­ко­на об ав­тор­ском пра­ве. Так­же об­на­ру­жи­лось, что мил­ли­о­ны уже оциф­ро­ван­ных стра­ниц — лишь ма­лая часть фон­дов бу­маж­ной пе­ри­о­ди­ки, ко­то­рые хра­нят­ся в биб­лио­те­ках и ар­хи­вах. От­рад­но, что прак­ти­че­ски все­гда биб­лио­те­ки, уже имев­шие свои циф­ро­вые кол­лек­ции, предо­став­ля­ли к ним бес­плат­ный до­ступ поль­зо­ва­те­лям и бы­ли го­то­вы де­лить­ся сво­и­ми элек­трон­ны­ми фон­да­ми.


Но глав­ная ра­бо­та над про­ек­том бы­ла впе­ре­ди. С 2013 по 2015 год сде­ла­но сле­ду­ю­щее:

  • От­ска­ни­ро­ва­но бо­лее 20 мил­ли­о­нов га­зет­ных стра­ниц. Глав­ной ха­рак­те­ри­сти­кой про­ек­та яв­ля­ет­ся огром­ный объ­ем. К кон­цу мар­та 2015 го­да на пор­тал «Europeana» за­гру­же­но 20 984 128 стра­ниц. Это со­став­ля­ет 3463 на­зва­ния, или 3 603 427 но­ме­ров га­зет. Вся кол­лек­ция охва­ты­ва­ет пе­ри­од с 1618 до 1990 го­дов.
  • 10 мил­ли­о­нов стра­ниц пе­ре­кон­вер­ти­ро­ва­но в элек­трон­ные ко­пии с рас­по­знан­ным тек­сто­вым сло­ем и воз­мож­но­стью пол­но­тек­сто­во­го по­ис­ка. В ре­зуль­та­те оциф­ров­ки чи­та­тель по­лу­ча­ет не про­сто кар­тин­ку, а пол­но­цен­ную га­зе­ту с воз­мож­но­стью по­ис­ка по пол­но­му тек­сту ста­тей. Тот факт, что эта ра­бо­та бы­ла про­де­ла­на все­го за три го­да, яв­ля­ет­ся пред­ме­том гор­до­сти ор­га­ни­за­то­ров про­ек­та. Те­перь они го­то­вы по­де­лить­ся сво­и­ми на­ра­бот­ка­ми со все­ми ор­га­ни­за­ци­я­ми, за­ин­те­ре­со­ван­ны­ми в оциф­ров­ке сво­их фон­дов. Ито­го­вая до­ку­мен­та­ция до­ступ­на на сай­те про­ек­та.
  • Со­зда­на спе­ци­аль­ная про­грам­ма про­смот­ра, обес­пе­чи­ва­ю­щая удоб­ный до­ступ к из­да­нию. Бла­го­да­ря ис­поль­зо­ва­нию но­вой струк­ту­ры ме­та­дан­ных каж­дый но­мер га­зе­ты свя­зан с дру­ги­ми ча­стя­ми кол­лек­ции, при про­смот­ре пред­ла­га­ет­ся на­ви­га­ция по да­там, на­зва­ни­ям и ме­сту из­да­ния. Удоб­ство на­ви­га­ции под­твер­жда­ет­ся вре­ме­нем, ко­то­рое поль­зо­ва­те­ли про­во­дят на сай­те: сред­нее вре­мя по­се­ще­ния про­ек­та — 15 ми­нут (для срав­не­ния, сред­нее вре­мя на сай­те Ев­ро­пей­ской биб­лио­те­ки — 5 ми­нут).
  • Со­здан ин­стру­мен­та­рий, ко­то­рый поз­во­лит упро­стить и усо­вер­шен­ство­вать про­цесс оциф­ров­ки. В рам­ках про­ек­та «Europeana Newspapers» раз­ра­бо­тан це­лый ряд бес­плат­ных про­грамм­ных про­дук­тов, ко­то­рые мо­гут по­мочь биб­лио­те­кам и дру­гим ор­га­ни­за­ци­ям усо­вер­шен­ство­вать свои циф­ро­вые фон­ды. Все эти про­грам­мы мож­но сво­бод­но ска­чать.
  • На­ла­же­на ко­ор­ди­на­ция меж­ду участ­ни­ка­ми. Все­го в кол­лек­ции пред­став­ле­ны фон­ды на 16 язы­ках в 5 раз­лич­ных ал­фа­ви­тах: ла­тин­ский — обыч­ный и го­ти­че­ский, ки­рил­ли­че­ский, иврит и араб­ский.


По объ­е­му кон­тен­та и предо­став­ля­е­мым воз­мож­но­стям по­ис­ка пор­тал ев­ро­пей­ских га­зет со­по­ста­вим с та­ки­ми ве­ду­щи­ми меж­ду­на­род­ны­ми про­грам­ма­ми по оциф­ров­ке пе­ри­о­ди­ки, как Chronicling America или ав­стра­лий­ский про­ект Trove. Та­ким об­ра­зом, Ев­ро­пей­ская биб­лио­те­ка ста­но­вит­ся в один ряд с ве­ду­щи­ми про­вай­де­ра­ми оциф­ро­ван­ной пе­ри­о­ди­ки.

«Europeana Newspapers» — это пер­вый пол­но­фор­мат­ный про­ект, в ко­то­ром «Europeana» предо­став­ля­ет и элек­трон­ные ко­пии, и рас­по­знан­ный текст не­по­сред­ствен­но на сво­ем пор­та­ле, без не­об­хо­ди­мо­сти ссы­лать­ся на сто­рон­ние ре­сур­сы. До се­го­дняш­не­го дня на пор­та­ле «Europeana» был ре­а­ли­зо­ван лишь пред­ва­ри­тель­ный про­смотр изоб­ра­же­ний с даль­ней­шим пе­ре­хо­дом на сайт дер­жа­те­ля кол­лек­ции. Бо­лее то­го, «Europeana Newspapers» от­кры­ва­ет до­ступ к боль­ше­му ко­ли­че­ству кон­тен­та, чем лю­бой про­ект Ев­ро­пей­ской биб­лио­те­ки до это­го.

По срав­не­нию с дру­ги­ми кол­лек­ци­я­ми оциф­ро­ван­ной пе­ри­о­ди­ки «Europeana Newspapers» об­ла­да­ет сле­ду­ю­щи­ми осо­бен­но­стя­ми:

  • воз­мож­ность пред­став­ле­ния раз­ных ти­пов со­дер­жи­мо­го (фо­то­гра­фии, текст, ме­та­дан­ные) из раз­лич­ных биб­лио­тек;
  • мно­го­языч­ный, ин­ту­и­тив­но по­нят­ный ин­тер­фейс с ши­ро­кими воз­мож­но­стями пол­но­тек­сто­во­го по­ис­ка, по­ис­ка по дер­жа­те­лю кол­лек­ции, стра­не, да­те пуб­ли­ка­ции, на­зва­нию га­зе­ты.


Боль­шин­ство га­зет в кол­лек­ции на­хо­дят­ся в об­ще­ствен­ном до­сто­я­нии и до­ступ­ны для про­смот­ра он­лайн. Три га­зе­ты, предо­став­лен­ные Бер­лин­ской го­су­дар­ствен­ной биб­лио­те­кой, На­ци­о­наль­ной биб­лио­те­кой Фран­ции и Лат­вий­ской на­ци­о­наль­ной биб­лио­те­кой, так­же до­ступ­ны для ска­чи­ва­ния (в ви­де экс­пе­ри­мен­та).

На­уч­ное со­об­ще­ство уже оце­ни­ло воз­мож­ность ра­бо­тать с циф­ро­вым кон­тен­том. На про­тя­же­нии все­го про­ек­та, а осо­бен­но на тре­тий год, ко­гда не­ма­лая часть пе­ри­о­ди­ки уже по­яви­лась в от­кры­том до­сту­пе, Ев­ро­пей­ские га­зе­ты взя­ли ин­тер­вью у не­ко­то­рых учё­ных, ко­то­рые ис­поль­зу­ют оциф­ро­ван­ные га­зе­ты в сво­их ис­сле­до­ва­ни­ях. Ре­зуль­та­ты этих опро­сов, под­твер­жда­ю­щие по­вы­шен­ный ин­те­рес к ре­сур­су, мож­но уви­деть в спе­ци­аль­ном бло­ге про­ек­та «От­ве­ча­ют ис­сле­до­ва­те­ли».

Ко­ор­ди­на­тор про­ек­та Ханс-Йорг Ли­дер (Hans-Jörg Lieder) из Бер­лин­ской го­су­дар­ствен­ной биб­лио­те­ки в сво­ем ин­тер­вью ска­зал: «Са­мым вдох­нов­ля­ю­щим во всем этом про­ек­те яв­ля­ют­ся от­кли­ки на­ших поль­зо­ва­те­лей, они про­сто по­ра­зи­ли ме­ня. Предо­став­ле­ние до­сту­па к этим ре­сур­сам на об­ще­ев­ро­пей­ском уров­не поз­во­ля­ет осу­ществ­лять от­кры­тия, ко­то­рые рань­ше ка­за­лись не­ве­ро­ят­ны­ми. Я гор­жусь тем, что я при­ча­стен к этой огром­ной ра­бо­те».

 

 

       
 
Сайт создан при финансовой поддержке Федерального агентства по печати и массовым коммуникациям РФ
Официальный сайт Российской государственной библиотеки
дизайн от студии Шире Шаг © 1999—2017 Российская государственная библиотека
Контактная информация
Электронная почта
Свидетельство о регистрации средства массовой информации:
Эл № ФС 77-20215 от 13 декабря 2004 года.

При использовании материалов прямая ссылка
на сайт www.rsl.ru обязательна.