Новый амбициозный проект перевода тысяч редких исторических документов Библиотеки конгресса США в цифровой вид с помощью GNU/Linux и Open Source призван сохранить всеобщее достояние до того, как оно не обветшало окончательно.Финансовую поддержку акции «Оцифровка американских документов в Библиотеке конгресса» оказала организация Sloan Foundation. По словам Брюстера Кале (Brewster Kahle) из Internet Archive (крупного архива, который в свое время полностью отказался от Windows, перейдя на платформу GNU/Linux), занимающегося разработкой технологии оцифровки, программное обеспечение с открытым кодом (Open Source) сыграет «абсолютно критическую» роль в реализации проекта.В качестве главного инструмента будет использоваться программно-аппаратный комплекс Scribe: «Scribe — это система сканирования, которая снимает высококачественные изображения с книг и проводит над ними ряд операций, распознает текст и сжимает, так что на выходе вы получаете красивые печатные версии книг, для которых появляется функция поиска [подразумеваются файловые форматы документов PDF и DjVu — прим. перев.]», — пояснил Кале. Для манипуляции картинками используются различные Open Source-утилиты, среди которых, например, netpbm и ImageMagick.
Доктор Джереми Адамсон (Jeremy E. A. Adamson), директор по коллекциям и сервисам Библиотеки конгресса США, объяснил выбор Scribe для данного проекта тем, что Internet Archive, использующий в своей работе подобное Open Source-решение, уже продемонстрировал «эффективное производство высококачественным изображений» с его помощью.
www.nixp.ru
Опубликовано
31.03.2007 18:12 и размещено в рубрике IT новости.
Вы можете следить за комментариями, подписавшись на RSS 2.0 ленту этого сообщения.
Комментирование закрыто.
публикации сходной тематики