Самая большая база данных — в Yahoo на базе PostgreSQL

Компания Yahoo утверждает, что ей удалось побить мировой рекорд, создав наиболее большую и нагруженную базу данных в мире, которая работает на основе свободной СУБД PostgreSQL, сообщает «Постгресмен».

Объём запущенной Yahoo год назад базы данных достиг 2 петабайт. Система создана для аналитических целей, в ней хранится история поведения Web-пользователей (утверждается, что в месяц сохраняются данные о полумиллиарде пользователей). Помимо прочего, интернет-гигант заявляет, что это не только наиболее большая БД в мире, но ещё и наиболее нагруженная — в сутки в ней регистрируются данные о 24 млрд событиях.

Управлением базами данных занимается модифицированная версия СУБД PostgreSQL. Это стало возможным благодаря покупке Yahoo компании-стартапа Mahat Technologies, изначально работающей с PostgreSQL. Код свободной СУБД был модифицирован для работы с такими огромными объемами информации (одно из самых крупных изменений: ориентация на поколоночное хранение вместо традиционного построчного, что замедляет запись на диск, но обеспечивает лучшую скорость доступа к данным для аналитических целей). Положительный результат налицо: некоторые таблицы в базе содержат триллионы строк, которые не просто лежат мертвым грузом на дисках, но могут быть запрошены и обработаны стандартным SQL, в стандартной ACID-совместимой среде.

citcity.ru

публикации сходной тематики

Комментирование закрыто.

 

При наполнении сайта использована информация из открытых источников. Владелец сайта не несет ответственности за недостоверную и заведомо ложную информацию размещенную на страницах сайта. При использовании информации опубликованной на нашем сайте, ссылка обязательна.

Реклама на сайте: