В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций
Гельмгольц давно доказал, что у глаз оптическая нерезкость близка к 5 мин угла зрения и что ее зрительное восприятие компенсирует поочередной оценкой яркости двух сторон прослеживаемых контуров3. Поэтому время прослеживания, оценка четкости и качества ТВИ зависят от контраста контуров.
Чувствительность зрительного восприятия к плавным изменениям яркости крупных деталей мала. Двумерный анализ-синтез изображений (ДАСИ)2, 3 основан на этих особенностях зрительного восприятия. В ДАСИ телевизионное изображение анализируют несколько апертур разной величины, создающих сигналы о деталях изображения различной величины. Эти "расфокусированные апертуры" формируют нерезкие изображения и являются низкочастотными двумерными фильтрами (НДФ) пространственных частот. Увеличение эффективного диаметра апертуры (ЭДА) убирает детали изображения, меньшие ЭДА, повышает нерезкость контрастных границ и сокращает полосу пропускания НДФ пропорционально квадрату ЭДА. Все НДФ для ДАСИ были реализованы на камерах с нерезкой перезаписью изображения. Малая задержка перезаписи была незаметна вследствие инерционности зрительного восприятия даже при быстрых сменах сюжета. Разность сигналов двух НДФ при нулевом общем весе соответствует апертуре с участками "положительной и отрицательной прозрачности" – полосовому двумерному фильтру (ПДФ), выделяющему только контуры переходов яркости.
Наибольшее повышение качества телевизионного изображения обеспечивает ДАСИ с несколькими компонентами сигналов НДФ и ПДФ. Увеличение уровня контурных сигналов при синтезе ДАСИ облегчает их зрительное восприятие и повышает качество и оценку четкости изображения. У первого ПДФ при весе центрального элемента +1 отрицательные веса смежных четырех элементов (слева, справа, сверху и снизу) были 0,25. Чересстрочная развертка отодвигала верхний и нижний элементы, но из-за нерезкости зрительного восприятия (5 мин) это было незаметно. Головной телевизионный НИИ (ВНИИТ) не верил, что ДАСИ при чересстрочной развертке телевизионного изображения2, 3 изотропно разделит информацию о деталях разной величины, и отрицал возможность повышения качества сжатого изображения. Испытания ДАСИ были проведены на Московском телецентре при поддержке главного инженера Александра Михайловича Варбанского с выходом в эфир. После этого ВНИИТ признал свои ошибки, но много лет не мог развивать ДАСИ.
Для исследований ДАСИ на Московском телецентре был создан тест-фильм (350 м), содержащий более 25 типичных сюжетов телевизионного изображения3. Два кинопроектора с одинаковыми фильмами подстраивали по таблице "0249" для совмещения растров по размерам, линейности и центровке. Их сигналы – позитив и негатив – суммировали, чтобы облегчить настройку совмещения. После прогрева в центральной части таблицы несовпадение растров было меньше 2 элементов, а на краях кадра – меньше 5. У второго проектора можно было вводить нерезкость от 2 до 30 элементов с уровнями от +0,6 (позитив) до - 1,0 (негатив), а также опережение и отставание. Для цифрового кодирования обычного кадра изображения нужны 128 ступеней квантования (7 бит), так как при шкале квантования 6 бит на крупных деталях с плавным изменением яркости возникают "ложные контуры". Объем такого цифрового сигнала кадра с 400 тыс. элементами был 2,8 млн бит (скорость 70 Мбит/с). Эксперименты на тест-фильме позволили выбрать оптимальные шкалы квантования и сжать сигналы ДАСИ.
При ДАСИ с пятью апертурами с эффективным диаметром 1, 2, 4, 8, 25 элементов были получены четыре ПДФ с границами (1–2), (2–4), (4–8), (8–25) элементов и НДФ с ЭДА 25 элементов. Для сигнала ПДФ (1–2) достаточны два дискретных уровня (1 бит), а для ПДФ (2–4), (4–8) и (8– 25) достаточны соответственно 4, 8, 16 уровней (2, 3, 4 бит). Для сигнала НДФ достаточны 16 уровней и 4 бита, так как ложные контуры квантования отфильтровывает синтез. Количество отсчетов на кадре с 400 тыс. элементов у этих ПДФ – 400, 100, 25; 6,25 тыс., а у НДФ – 0,7 тыс. отсчетов. Объем их сигналов на кадре – 400, 200, 75, 25 и 2,8 тыс. бит и общий объем – 703 тыс. бит. Кадр сжат в 4 раза при улучшенном качестве.
Инерционное (трехмерное) сжатие использует медленное прослеживание контуров и подобие смежных кадров. На тест-фильмах отставание или опережение на 6 кадров (0,24 с) компонент НДФ, расфокусированных на 8 элементов, были заметны только при сменах сюжета и при очень быстром движении, но это не ухудшало качества изображения. При сдвигах на 4 кадра компонент НДФ с нерезкостью 2, 4, 8, 25 элементов искажения были незаметны. Это доказало возможность предсказания компонент следующих кадров по предыдущим и прореживания сигналов ПДФ (1–2), (2–4), (4–8), (8–25) элементов и их повторения в нескольких кадрах. Компоненту (1–2) повторяли только 2 раза из-за опасений осложнить восприятие четкости, а другие – 4 раза и получили 200, 50, 18, 6 и 0,7 тыс. бит соответственно, а всего – 275 тыс. бит, что соответствует сжатию кадра в 10 раз при высоком качестве изображения.
Сокращение статистической избыточности сигнала телевизионного изображения "сверточным сжатием" описано мною в начале 1960-х и 1980-х гг.5–7. "Характеристические сдвиги" сверточного сжатия задавали отводы двоичных анализаторов (АС) синдрома в точках, заданных генераторными полиномами малоизбыточных сверточных кодеков помехозащиты МППЧ. Для сигнала ПДФ (1–2) сверточное сжатие было исследовано во ВНИИ Радио на МППЧ с кодовой скоростью R=4/56. Двоичный контурный сигнал эти генераторные полиномы преобразовывали в 4 последовательности, которые поступали на 4 входа АС, где их в четырех генераторных полиномах обрабатывали подобно обработке четырех ветвей информационного сигнала при формировании проверочной последовательности МППЧ и при синтезе из них восстанавливали исходный контурный сигнал. Возникающие на хаотических позициях темные точки ошибок "интерференции" были совершенно незаметны. Это сверточное сжатие снизило объем прореженного сигнала ПДФ (1–2) объемом 200 тыс. бит на кадре в 4 раза – до 50 тыс. бит и общий объем сигнала кадра изображения – до 125 тыс. бит, что соответствует сжатию сигнала изображения в 22 раза – до скорости около 3,2 Мбит/с при высоком качестве изображения. Испытать более высокое сверточное сжатие компонент ПДФ (1–2) и (2–4) не удалось из-за математических трудностей поиска нужных генераторных полиномов, которые были созданы для кодеков МППЧ значительно позже на базе совершенных разностных множеств. Сигналы смежных ПДФ сильно коррелированы, что дает возможность увеличить сверточное сжатие, улучшив подавление интерференционных помех нестационарными генераторными полиномами c изменяемыми характеристическими сдвигами от кадра к кадру. Исследования сжатия телевизионного изображения более чем в 30 раз остановил ГКРТ, потребовавший разработок для Московского телецентра аппаратуры ДАСИ, повышающей качество изображения8–11.
Исследования8 были проведены на упомянутом тест-фильме. В обычных мониторах Московского телецентра "ореол рассеяния" добавлял к яркости исходного изображения около 25– 30% расфокусированного до 20–30 элементов изображения, что ослабляло контрастные переходы и полезный диапазон яркостей. Добавление расфокусированного до 20–30 элементов негатива сигнала НДФ компенсировало ореол, усиливало контрастные переходы и повышало оценки четкости и качества изображения. Оптимальное качество сюжетных изображений было при уровне негатива 70%. При уровне негатива 80% уже была заметна перекоррекция на крупных черных фрагментах на белом фоне.
Двумерный апертурный корректор на базе ПДФ (1–4) описан в публикациях начала 1960-х г г.9, 10. Каждую ультразвуковую задержку на строку дополняли элементы подстройки, управляемые строчной синхронизацией. Они учитывали изменения длительности строк в диапазоне 63,75–64,25 мкс, соответствующем норме нестабильности частоты сети 50±0,2 Гц. Сигнал центральной строки имел два участка с отрицательным весом длиной 3 элемента вокруг центрального длиной 1 элемент с положительным весом. Сигналы верхней и нижней строки имели сглаженную форму длиной 5 элементов. Общий "вес" апертуры этого ПДФ был равен нулю. Его сигнал обрабатывал нелинейный усилитель с ограничением максимального и минимального уровней, который убирал шумы и исключал перекоррекции. Сигнал коррекции выключали гасящие и синхронизирующие импульсы и сигналы темных участков изображения. Контрастность мелких деталей и контуров возрастала независимо от их направления и создавала эффект повышения четкости и качества изображения, подобный двукратному увеличению строк кадра. Чересстрочная развертка кадра не создавала неприятных эффектов. Однако при частотах сети меньше нормы возникали неприятности.
После испытаний апертурного корректора10 ГКРТ заказал для Московского телецентра корректор ореола и второй апертурный корректор с двумя ПДФ (1–4) и (4–8), выполненными на ультразвуковых линиях задержки с расширенным диапазоном регулировок 64,65–63,6 мкс, учитывающим, что реальные уходы частоты сети (диапазон 49,5– 50,3 Гц) выше нормы11. В отличие от апертурного корректора сигналы ДПФ имели переменные пороги ограничения по минимуму, управляемые оценками уровня шумов и возможности увеличения уровня коррекции до 80% в зависимости от источника изображения и сюжета. Уровень коррекции сигнала первого ПДФ обычно был в 2–3 раза выше, чем у второго. Наибольшей коррекции требовали нерезкие и малоконтрастные изображения. Аппаратура, выполненная на лампах, занимала типовую стойку, где места для корректора ореола не было. Он был внешним. Эту аппаратуру на Московском телецентре берегли и включали только на сюжетах с очень плохим качеством. При передаче телевизионного сигнала из космоса с 10 кадр/с, 400 строками, 400 элементами в строке и полосой частот видеосигнала 800 к Гц качество откорректированного изображения не уступало качеству обычного изображения.
В Интернете можно найти множество алгоритмов сжатия телевизионного изображения (JPEG, DivX, DivX 3.11 Alpha, AVC, H.264, MPEG, MPEG-4, HEVC). Все они очень сложны, ухудшают качество изображения и не всегда пригодны для видеоконтроля в системах охраны.
Наиболее интересен алгоритм HEVC – High Efficiency Video Coding, работающий при чересстрочной и прогрессивной развертке изображения. В кодере HEVC первый кадр изображения кодируют предсказанием отсчета кадра по соседним отсчетам, подобным двумерному кодированию. В следующих кадрах используют межкадровое предсказание. Движение компенсируют с помощью векторов движения, передаваемых как дополнительная информация. 29 февраля 2012 г. компания Qualcomm показала HEVC-декодер на двухъядерном процессоре Qualcomm Snapdragon S4 с частотой 1,5 ГГц, реализованом на микросхемах с технологией 45 и 28 нм типа SoC (система на кристалле) с огромной собственной памятью 32 ГГбит, которая более, чем в 1000 раз превышает память самого сложного кодера ДАСИ с инерционным и сверточным сжатием.
Постановление Правительства РФ № 809 от 26.11.07 "Развитие электронной компонентной базы и радиоэлектроники на 2008–2015 гг." требует разработок на микросхемах аппаратуры, конкурентной на мировом уровне. Оно предусматривает реализацию технологии 45 нм в 2015 г. Современные технологии позволяют реализовать ДАСИ со сверточным сжатием простыми средствами на базе отечественных микросхем. Двумерный анализ-синтез изображений (ДАСИ) является единственным алгоритмом, использующим простейшие аппаратные средства, подобные ранее успешно испытанным микросхемам помехоустойчивого и криптографического кодирования. В НПК "Технологический центр МИЭТ" уже освоен выпуск БМК серий 5529 и 5521 с КМОП-технологиями 0,25 и 0,18 мкм. Есть опыт совместных работ с МИЭТ. Максимальный объем этих БМК – 1500 тыс. УВ в 5 раз превышает объем, нужный для реализации ДАСИ со сверточным сжатием. Необходимые МБИС с КМОП-технологиями с ПН до 0,13 мкм уже изготовляют компании "Ангстрем" и "Микрон" (Зеленоград). ОАО "НИИ полупроводниковых приборов" (Томск) для диапазона 3,1–5,1 ГГц разработал комплект интегральных микросхем для ВРС и технических средств охраны с частотами выше 30 ГГц по арсенид-галлиевой технологии 0,5 мкм.
Многие новейшие способы сжатия объема телевизионного сигнала очень сложны и не улучшают качество изображения. Современные мегапиксельные камеры незначительно повышают качество восприятия изображения. Известный более 30 лет двумерный анализ-синтез изображений (ДАСИ) обеспечивает сжатие сигнала изображения более чем в 20 раз – до скорости 3,2 Мбит/с – и улучшает качество изображения.
Возможно дальнейшее увеличение сжатия изображения инерционным и сверточным сжатием в 30 и более раз. У восстановленного после сжатия изображения качество более высокое, чем у исходного, что невозможно для других способов. Аппаратная реализация ДАСИ, инерционного и сверточного сжатия в несколько раз проще при реализации на микросхемах, чем у других способов. Структуру аппаратуры, реализующей ДАСИ на микросхемах, полезно детально рассмотреть в отдельной статье.
Опубликовано: Журнал "Системы безопасности" #5, 2014
Посещений: 10216
Автор
| |||
В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций