Google существенно пополняет собственный цифровой каталог книг


Разработчики Google Books надеются добавить около 130 млн наименований книг (столько печатных изданий, по мнению Google, существует сейчас на свете) в каталог сервиса, который индексирует сведения о книгах в магазинах и библиотеках, а также публикует редкие издания онлайн.

Чтобы создать собственный цифровой каталог книг, Google пришлось исследовать существующие каталоги. В качестве источников использовалась база ISBN (мировой стандарт идентификаторов книг), библиотека Конгресса США и др.

«Когда работаешь в компании, которая взялась оцифровать все книги в мире, то непременно сталкиваешься с вопросом: а сколько же на свете книг?» – говорится в записи в официальном блоге Google.

Существующие каталоги, по словам представителей Google, обладают различными недостатками и не дают ответа на вопрос о реальном количестве книг, выпущенных на сегодняшний день. Так, ISBN распространен преимущественно на Западе, существует лишь с 1960-х годов, и в его базе нет более ранних изданий. Кроме того, порой ISBN используется не только для книг, но и для разных видов «печатной продукции» – от наклеек на CD-диски до бирок для одежды.

Подсчет усложняется еще и тем фактом, что большинство библиотек ведет учет лишь наименований, считая все издания одной книги как одну учетную единицу.

Таким образом, Google должен будет найти дополнительные источники данных, а также отработать более совершенные алгоритмы фильтрации полученного массива информации на предмет некорректных и дублирующихся записей.

На момент публикации сообщения сотрудники корпорации насчитали 129 865 млн наименований печатных изданий. Цифра будет уточняться, обещают в Google.

По материалам сайта РИА Новости