Гносеология многоканального видеонаблюдения
….Все теории стоят одна другой.
Есть среди них и такая, согласно которой
каждому будет дано по его вере.
«Мастер и Маргарита» М.А. Булгаков
Некоторые размышления о путях развития многоканальных видеотехнологий
или гносеология многоканалок.
Бурное развитие многоканального видео пришлось на последние 5-7 лет и не случайно, поскольку эти технологии возникли на границе между быстрым развитием ССD-видеорынка и компьютерных технологий, предложивших множество различных capture card, с одной стороны, и широкую гамму методик и программных библиотек, предназначенных для кодирования и анализа видеоизображении.
Потребность на эти технологии поступает главным образом от:
– сектора производства и распределения мировой экономики, где средства видеорегистрации, видеомониторинга, поиска и анализа в видеобазах данных позволяют значительно интенсифицировать процессы контроля и управления технологическими процессами производства и распределения.
– абсолютно новые возможности по планированию и управлению городским и региональным хозяйством получают соответствующие администрации. Видеомониторинговые методики позволяют, наконец, оперативно создавать эффективные модели обеспечения транспортных, градостроительных, экологических и т.п. проектов.
– правоохранительные структуры, обеспечивающие общественную коммерческую и личную безопасность граждан, наконец, получают новый оперативно-технический инструментарий, в том числе для обеспечения антикриминальных и антитеррористических проектов. И речь здесь идет не только об идентификации глаза лица и отпечатков пальцев, но и сканирование транспорта и людских потоков с детектированием групп риска и поиска по принципу «свой среди чужих» и «чужой среди чужих».
– шоу бизнес, где, например, на стыке методик видеомониторинга и FDC (скоростных купольных камер), наконец, удастся автоматизировать процесс операторской работы по обеспечению телевизионных и спортивных программ.
Таким образом, становится ясно, что безмятежному развитию универсальных многоканалок приходит конец и настало время очередного эволюционного этапа развития – деления
Новые группы специализированных видеотехнологий:
1. Цифровые многоканальные видеомагнитофоны – DVRы.
2. Мониторинговые видеосистемы- детекторы движения и события.(Spot/Trap).
3. Анализаторы баз видеоданных.
Эти основные ветви видеотехнологии обрастают тривиальным набором сервисов: Web-сервис, клиент-серверные приложения, телекоммуникационные модули, модули записи звука, и т.п.
Наиболее бурно в последнее время развивается первая ветвь. Основная масса видеосистем представляемых на различных форумах (2000-2003) годов – DVR-ы, как правило «желтой выпечки». Большинство сломанных копий в ожесточенных дискуссиях на различных ru-интернет порталах – DVR-ы.
Парадигма этих монстров такова: записать побольше видеоканалов, на скорости не меньше (24-30)fps, с компрессией MPEG, YUV, Wavelet, и т.п., с разрешением 704х240 и более, сотни часов в сутки. Продуктом их работы становятся Терабайты данных с видеозаписью, годными только для создания иллюзии об оперативном контроле за интересующими процессами.
Вероятно, в текущем году прихлопнет всю эту возню интенсивно выпекаемая во многих силиконовых анклавах capture card типа RealcopQ2W c аппаратным кодированием.
Понятно, что коллективы, владеющие кроссплатформенными технологиями, моментально возьмут такие карты на вооружение.
Безусловно, это эволюционный тупик. И образчик аналогового мышления на цифровой почве.
Куда интересней заглянуть на мониторинговую ветвь развития видеотехнологий. Именно здесь создаются алгоритмы, позволяющие в процессе «заливки» текущего полукадра (50 Гц) вычислять те или иные функции.
Отечественные традиции на этом поле закладывались на факультете психологии МГУ (акад. А. Леонтьев и профессор Б. Величковский), в работах в области роботозрения Мосстанкинпрома и по заказу МАПа, Средмаша СССР.
Сейчас у нас в стране над этими материями трудятся всего несколько разрозненных коллективов, в том числе и наши лаборатории.
В результате этих работ удалось создать и реализовать в ПО несколько базовых алгоритмов детектирования, которые были впервые апробированы в 1994 г. и приобрели свою законченную формулу в собственном программном продукте в 2001г.
С применением MMX технологии в 2002 году были произведены успешные испытания этих алгоритмов в Германии.
Рамки этой публикации не позволяют детально раскрыть механизмы работы этих алгоритмов.
Можно сказать, что в отличие от тривиальных детекторов движения (ДД) класса Spot, имеющих коренные ограничения в применении из-за своей топологической ограниченности, был разработан ДД типа Trap, который благодаря своей макротопологической конструкции позволил детектировать события, в том числе и при шумах превышающих пороговые значения(*).
За этой удачей последовали ряд прорывных методик:
– вентильное детектирование, позволяющее определять векторы изменений в кадре.
– трехмерная видеолокация, позволяющая детектировать события в кадре с учетом третьего вектора.
Таким образом, впервые был получен надежный инструментарий для осуществления ответственных оперативно-технических проектов.
Отдельно хочу отметить работу детектора «пропаж-закладок», который на подобии «явления послеобраза» способен регистрировать события по принципу «ожоговой памяти».
Весь этот алгоритмический арсенал на протяжении нескольких лет эксплуатации наших систем позволил серьезным инсталляторам создать целую библиотеку оперативно-технических методик, число которых все время увеличивается уже независимо от нас.
Именно на этой ветви эволюционного развития многоканалок реализуются наиболее честолюбивые амбиции и происходят наиболее интересные прорывы.
Сейчас она подвергнется дальнейшему развитию и делению.
В первую очередь, выделяются детекторы «распознавания образов», такие как идентификаторы лица и авто, текстов и номеров машин, сетчатки глаза и отпечатка пальцев.
В самостоятельное направление выделяются оперативно-технические детекторы типа Spot/Trap, пропаж/закладок, трехмерное детектирование и т.п., которые предназначены для создания полного семантического инструментария необходимого для инсталляции серьезных оперативных заданий, в том числе и антитеррористического свойства.
Абсолютно самостоятельной отраслью являются анализаторы баз видеоданных.
Если не учитывать вульгарный поиск файлов по дате, камере и т.п., то можно сказать, что этими разработками занимаются только несколько коллективов, обладающих для этого необходимой культурой.
Назначение анализаторов в том, чтобы выполнять за оператора работу по поиску и селекции баз видеоданных.
Конечно, преимуществом здесь является отвязанность от realtime-процессов заливки фреймов, а недостатком - гигантские объемы разреженных баз видеоданных.
Отсюда вывод:
– надо прекращать «лить из DVR на винт воду»;
– DVR-ы нужны только тогда, когда запись по детекторам бессмысленна или для обеспечения метода (отката) по каждому зарегистрированному сенсорами видеособытию.
Сразу хочу отметить, что кодеки, которые используются в продвинутых DVR?ах, абсолютно непригодны для покадрового поиска в Терабайтных базах видеоданных.
Алгоритмы поиска видеоданных сейчас на самой ранней стадии своего развития и здесь сделаны только первые шаги.
В тоже время для анализаторов теоретически доступен весь арсенал методик размещенных на мониторинговой-realtime ветви многоканалок. Однако такое решение вопроса в лоб чрезвычайно емко для доступных вычислительных сред. Поэтому потребовалось создание специфических для анализаторов методик, делающих приемлемым время обработки баз видеоданных.
Например пакет поисковых фильтров от Баратунг-Видео представляет собой несколько программ, которые позволяют создавать несколько сценариев итерационного поиска:
– Статистический фильтр, позволяет получить графический и числовой отчет об искомом событии. Профессиональные аналитики в полученных числах и графиках зачастую заинтересованы больше, чем в просмотре самих изображений. Например, красный график информирует о том, сколько и с какой интенсивностью посетителей входили на объект, а синий - сколько выходили; в результате, получается результирующий график - сколько посетителей в данный момент на объекте.
– Криминалистический фильтр, позволяет произвести поиск людей, транспорта и других объектов по их маске. Принцип “свой среди чужих или чужой среди чужих”. Например, есть необходимость получить сводку обо всех перемещениях в городе авто. Здесь используется библиотека масок или оперативно формируется новая маска искомого авто-принцип фоторобота.
– Поиск по униформе позволяет сортировать кадры по топологичски размещенным и взвешенным цветовым пятнам. Здесь возникает возможность поиска объекта не по его дифференциальной образующей компоненте типа контурных линий используемых для идентификации сетчатки глаза, отпечатка пальцев и т.п., а по его интегральной компоненте . Например в нашей полосе, когда зачастую 6 месяцев снег и соль надежнее идентифицировать корпоративное авто не по номеру (его не видно или фальшивый), а по всему кузову.
– Траекторный фильтр позволяет выполнять поиск “групп риска” людей и транспорта по характеру их перемещений. Инсталляция задания здесь формируется профессионалом с использованием Булевых функций алгебры логики (и) (или) (не) с учетом времени по каждому шагу поиска.
В частности именно здесь с помощью одной камеры можно определять нарушителей скоростного режима с точностью до 10 км/час и по каждой полосе, при этом разделяя грузовые и легковые машины.
Заключение:
В рамках этой публикации удалось только слегка коснуться нескольких важных понятий в области современных видеотехнологий.
Конечно, есть понимание, что без популяризации своих разработок не может быть их серьезного внедрения на рынке. В тоже время, если у нас самые продаваемые авто - «Жигули», то это не значит, что это лучший авто. Таков наш рынок и дело здесь не только в цене.
В России и Германии для своих администраторов в клубе Баратунг-Видео мы проводим ежемесячно семинары по всему кругу вопросов связанных с развитием видеотехнологии и нашего программного продукта.
Андрей Константинович Баратов
Генеральный директор
http://www.baratung.net
Допускается использование этого текста или его фрагментов только с разрешения автора.
(*) Отечественный Патент на изобретение № 2159960.22.12.1998.
