Создана новая поисковая программа, способная разузнать абсолютно все по визуальным образам интересующего объекта

Галереи поисков программы LEVAN

Программисты из Вашингтонского университета (University of Washington) и Института искусственного интеллекта Аллена (Allen Institute for Artificial Intelligence), Сиэтл, создали автоматизированную компьютерную программу, которая по их словам "может разузнать буквально все о любом объекте по его визуальному образу". Программа LEVAN (Learning Everything about Anything) производит поиск среди миллионов книг, текстов и изображений в Сети, выискивая все возможные вариации объекта интереса, а результат предоставляется пользователям в виде галереи изображений, просматривая которую пользователь получает всестороннее представление об объекте.

"Основным принципом работы нашей программы является поиск ассоциаций между текстовыми и визуальными данными" - рассказывает Али Фаради (Ali Farhadi), профессор в области информатики из Вашингтонского университета, - "Программа обучается эффективно объединять богатые информацией текстовые данные с конфигурацией пикселов изображений. Это означает, что она сама сможет идентифицировать определенные объекты, "увидев" их на каком-нибудь снимке".

Также использованные в программе LEVAN алгоритмы позволяют ей определять сроки релевантности информации в тексте и в изображениях, идентифицируя временные изменения образов при помощи достаточно распространенных алгоритмов распознавания объектов. Предоставленные программой LEVAN результаты поиска дают пользователю более богатую информацию, нежели другие подобные сервисы, такие как Яндекс Картинки и Google Images, которые производят поиск только по информации, содержащейся в заголовках изображений.

В настоящее время пользователи могут лишь просмотреть галереи поисков, выполненных программой LEVAN, относительно 175 самых различных понятий и предметов. Однако, если объекта поиска еще не существует в базе данных программы, то программа автоматически начнет поиск по интересующей вас категории. Определив наиболее релевантные слова или фразы из запроса пользователя, программа начинает поиск по всем изображениям, доступным в Сети с целью получения представления о визуальном образе объекта запроса. После составления такого визуального образа программа производит еще один поиск, отбирая только те изображения, на которых присутствует искомый визуальный образ или его вариации.

Исследователи начали работать с программой LEVAN в марте этого года. Начальная база данных программы, созданная за время ее отладки, содержала очень малое количество понятий и образов. Но за время дальнейшей работы программа обработала более 13 миллионов изображений, сопоставив визуальные образы более чем с 65 тысячами ключевых слов и фраз.

В настоящее время функционирование программы ограничено требующимися для этого вычислительными мощностями. Время, требуемое для поиска по какому-либо обширному понятию, данных о котором еще не содержится в базе данных программы LEVAN, может превысить 12 часов. Но исследователи продолжают работать над оптимизацией алгоритмов и кода программы, что в будущем позволит увеличить скорость работы и расширить ее функциональные возможности.

Следует отметить, что программа LEVAN является свободной программой с открытым исходным кодом. Исследователи считают, что основным назначением программы является ее использование в качестве образовательного инструмента и в качестве некоего информационного банка для исследований в некоторых областях. А в скором времени будет разработано специализированное приложение для смартфонов и планшетных компьютеров, которое, используя программу LEVAN в качестве облачного сервиса, сможет автоматически разбирать и категорировать фотографии пользователей, которые, как правило, хранятся в виде большой "свалки".






Первоисточник
Вернуться назад