Продолжается создание технологий автоматического перевода в реальном времени
Управление перспективных исследований и разработок Министерства обороны США (DARPA) выделило грант в размере 14 млн долларов компании BBN Technologies, продолжающей исследования по проекту «Глобальная система автоматической обработки языков» (Global Autonomous Language Exploitation, GALE).
Всего по этой программе BBN уже получила от DARPA более 30 млн долларов.
BBN продолжает наращивать точность перевода и анализа иностранных текстов. В последние годы компания работала над машинным переводом арабских новостных текстов, радио- и теленовостей на английский. В отдельное направление выделены исследования, касающиеся информации на китайском языке. Созданные методики поддерживают разнообразные форматы исходных данных, включая печатные и рукописные документы, бумажные копии, файлы PDF, фотографии, газеты. Сообщается, что решения BBN способны адаптироваться к различным языкам, диалектам, индивидуальным особенностям произношения и семантическим нюансам речи.
В DARPA надеются, что проект GALE завершится к 2011 году, когда будут решены весьма амбициозные задачи автоматического предоставления военным информации из иностранных источников с целью предотвращения потенциальных угроз национальной безопасности.
Помимо BBN Technologies, свой вклад в GALE вносят такие организации и вузы, как Кембриджский университет, Технологический институт Джорджии, Language Computer Corporation, Language Weaver , Вычислительная лаборатория механики и машиноведения Национального центра научных исследований Франции (CNRS/LIMSI), Массачусетский технологический институт, Северо-Восточный университет, Sakhr Software, Колорадский университет, Эдинбургский университет, Мэрилендский университет, Пенсильванский университет и Институт научной информации Южнокалифорнийского университета.
Управление занимается также созданием «Предназначенной для тактического использования системы перевода и взаимодействия на разговорном языке» (Spoken Language Communication and Translation System for Tactical Use, TRANSTAC), которую обещают реализовать в виде устройства, в реальном времени воспринимающего и переводящего иностранную речь в обоих направлениях.
Параллельно под эгидой DARPA ведется разработка «Программы машинного чтения» (Machine Reading Program, MRP), которая позволит на основе обычного текста, подготовленного человеком, формировать набор знаний, пригодных для использования системами искусственного интеллекта. В итоге последние смогут самостоятельно обогащаться данными, черпая их из Интернета.
Подготовлено по материалам Network World, BBN Technologies и DARPA.
citcity.ru