Компания Yahoo утверждает, что ей удалось побить мировой рекорд, создав наиболее большую и нагруженную базу данных в мире, которая работает на основе свободной СУБД PostgreSQL, сообщает «Постгресмен».
Объём запущенной Yahoo год назад базы данных достиг 2 петабайт. Система создана для аналитических целей, в ней хранится история поведения Web-пользователей (утверждается, что в месяц сохраняются данные о полумиллиарде пользователей). Помимо прочего, интернет-гигант заявляет, что это не только наиболее большая БД в мире, но ещё и наиболее нагруженная — в сутки в ней регистрируются данные о 24 млрд событиях.
Управлением базами данных занимается модифицированная версия СУБД PostgreSQL. Это стало возможным благодаря покупке Yahoo компании-стартапа Mahat Technologies, изначально работающей с PostgreSQL. Код свободной СУБД был модифицирован для работы с такими огромными объемами информации (одно из самых крупных изменений: ориентация на поколоночное хранение вместо традиционного построчного, что замедляет запись на диск, но обеспечивает лучшую скорость доступа к данным для аналитических целей). Положительный результат налицо: некоторые таблицы в базе содержат триллионы строк, которые не просто лежат мертвым грузом на дисках, но могут быть запрошены и обработаны стандартным SQL, в стандартной ACID-совместимой среде.
citcity.ru
Опубликовано
30.05.2008 06:20 и размещено в рубрике IT новости.
Вы можете следить за комментариями, подписавшись на RSS 2.0 ленту этого сообщения.
Комментирование закрыто.
публикации сходной тематики