Як тренди відеоспостереження зумовлюють потребу в камерах безпеки зі штучним інтелектом

Нові технології, такі як штучний інтелект (ШІ) і машинне навчання, допомагають зрозуміти, що можна “побачити” на відеозаписах систем безпеки

Ринок безпеки переповнений відеокамерами

Поширеність мережевого зв’язку, в тому числі бездротового для віддалених місць, а також прогрес в області потужності і можливостей відеокамер, не кажучи вже про бажання суспільства відчувати себе в більшій безпеці, призвели до того, що в усьому світі з’явилися мільярди камер безпеки, які генерують тисячі петабайт відеоданих щодня.

Що робити з усім цим відео? Це і є виклик. У більшості випадків відео з камер безпеки зберігається далеко (ми можемо подякувати хмарним обчисленням за необмежений обсяг пам’яті), поки щось не трапиться і не буде потрібно перевірити відзнятий матеріал, чи то в супермаркеті, чи то вдома.

Для більш безпосередніх застосувань у сфері безпеки – спостереження, моніторингу дорожнього руху, нового класу рішень для “розумного міста” – відео часто передається мережею, в тому числі через хмару, до комп’ютерної системи, де воно аналізується.

Саме там нові технології, такі як штучний інтелект (ШІ) і машинне навчання, допомагають зрозуміти, що можна “побачити” в цьому відео.

Для сучасних застосувань у сфері безпеки комп’ютерний зір – це розробка систем, які можуть ідентифікувати і розуміти людей і об’єкти на відео – людину в біді на стадіоні, сумку, залишену на залізничній платформі, номерний знак автомобіля, що перевищив швидкість. І сьогодні комп’ютерний зір переживає значну еволюцію, яка перетворить його зі спеціалізованого додатку на майже повсюдну функцію систем безпеки, що завжди захищає. Ключ до цього – розумніші камери.

Тренди комп’ютерного зору

Комп’ютерний зір – це зростаючий ринок, який впливає на все: від доповненої реальності до автономного водіння і розумного сільського господарства. У сфері безпеки комп’ютерний зір на основі штучного інтелекту обіцяє більшу особисту безпеку та більш автоматизований, проактивний захист об’єктів та інфраструктури на основі здатності технології аналізувати відеодані.

Але осмислення всього відео, згенерованого встановленою базою відеокамер, має свої складнощі. І для того, щоб комп’ютерний зір проникав у системи безпеки, рішення для камер повинні відповідати декільком тенденціям:

Вища роздільна здатність. У побутовій електроніці відео високої роздільної здатності є нормою. Навіть відеодзвінки Ring почали створювати з роздільною здатністю вище Full HD, 1080p. Камери безпеки також рухаються в цьому напрямку, відкриваючи двері для нових застосувань комп’ютерного зору.

Всі ці додаткові пікселі, а також ширококутні об’єктиви дозволяють краще ідентифікувати людей, речі або навіть поведінку в більшому полі зору. Хитрість полягає в тому, щоб зберегти цю роздільну здатність, коли відео рухається від камери до аналітичної системи. Часто відео доводиться зменшувати для економії пропускної здатності мережі, що може обмежити ефективність комп’ютерного зору.

Image courtesy of Hailo

  • Захист приватності. Оскільки відеокамери стають усюдисущими, а їхня роздільна здатність покращується, стає все легше ідентифікувати людей у відеопотоці. Ця можливість особливо важлива для додатків повторної ідентифікації, в яких одна і та ж особа відстежується кілька разів на одній і тій же камері в різні часові відмітки або на декількох камерах.

Ця програма використовується як для статистичних цілей, так і для розслідування подій та відстеження підозрілої активності. У цих випадках стає все більш важливим вирішувати питання захисту приватності.

Це може включати автоматичне розмиття облич, процес, який зазвичай називають анонімізацією, або обробку відеопотоків локально на межі і призначення метаданих для опису людей або речей. Іншими словами, замість того, щоб просто передавати і зберігати відео людини в червоній сорочці, система комп’ютерного зору передає і зберігає лише метадані, які вказують на те, що вона сприйняла людину в червоній сорочці.

Доступ до самого відео відкривається лише в разі необхідності знайти всіх людей у червоних сорочках з міркувань безпеки. Як би там не було, захист приватності повинен розвиватися паралельно з комп’ютерним зором.

  • Диверсифікація аналітики. До недавнього часу комп’ютерний зір і аналітика були пов’язані з безпекою і захистом – виявленням потенційних загроз для людей і місць. Однак все частіше організації хочуть дізнатися більше з встановленої бази відеокамер.

Наприклад, роздрібний магазин може захотіти виявити крадіїв, але зараз він також зацікавлений в аналізі переміщення покупців через простір, щоб зрозуміти, наприклад, ефективність дизайну магазину, розміщення продуктів або маркетингових вивісок.

Розумні міста використовують відео не лише для забезпечення безпеки, але й для виявлення закономірностей руху. В обох випадках до різних відеопотоків однієї і тієї ж сцени можуть застосовуватися різні аналітичні алгоритми, що вимагає більш потужного та ефективного рішення комп’ютерного зору.

  • Поява відеопроцесорів (VPU). Це більш потужне, ефективне рішення з’являється у вигляді нових процесорів технічного зору. Ці системи на кристалі (SoC) мають багато можливостей, включаючи відео з високою роздільною здатністю, рішення для захисту конфіденційності і потенційно кілька форм аналітичної обробки.

Існують усталені технології для покращення якості відео за допомогою стабілізації зображення, зменшення розмиття та інших методів. Поєднайте ці можливості з обробкою комп’ютерного зору на основі штучного інтелекту, і камери не тільки “бачать” краще і чіткіше, але й краще розуміють те, що бачать, і створюють кращий візуальний образ сцени.

Більш того, завдяки застосуванню ШІ до звичайних конвеєрів покращення зору, наприклад, зменшення “шуму” зображення в умовах низької освітленості, цей новий клас VPU працює швидше і ефективніше, навіть при меншій кількості доступного світла.

  • Розподілена аналітика. Досі ці два завдання обробки відео – покращення зображення та відеоаналітика – відбувалися окремо. Камера сама покращує картинку, але покращене відео надсилається в хмарну систему або центр управління для аналізу.

Є кілька причин, чому це неефективно. По-перше, це затримка і споживання пропускної здатності при постійному надсиланні відео через мережу. Друга, пов’язана з цим, полягає в тому, що для багатьох систем безпеки та інших “розумних” відеозастосунків дії повинні виконуватися в режимі реального часу, тобто аналіз повинен відбуватися там, де розташована камера. Це означає, що аналітика комп’ютерного зору стає все більш розподіленою, а не централізованою.

Комп’ютерний зір на межі

З точки зору обчислень, ці розподілені місця знаходяться на периферії. В останні роки успіх хмарних обчислень, де додатки і обробка виконуються у великих центрах обробки даних, породив відповідний інтерес до периферійних обчислень, де додатки і обробка виконуються на пристроях, розташованих ближче до місця, де вони потрібні.

ШІ особливо виграє від периферійної моделі, оскільки в багатьох випадках дані, що обробляються, генеруються там, де обробка та аналітика ШІ потрібні найбільше. Наприклад, виробнича промисловість використовує ШІ разом з робототехнікою, щоб швидко виявляти проблеми з якістю на заводі. Медичні установи використовують ШІ в системах візуалізації, щоб краще виявляти небезпечні для життя стани і покращувати результати лікування пацієнтів.

Периферійні АІ-процесори для комп’ютерного зору

У світлі досягнень в області комп’ютерного зору і попиту на ШІ-аналітику на периферії системи безпеки – там, де відбуваються події – галузь розробила спеціалізовані периферійні ШІ-процесори. Ці процесори можуть бути інтегровані в інтелектуальні камери або в агрегатори, розташовані на периферії, такі як системи управління відео (VMS) або мережеві відеореєстратори (NVR), які приймають потоки з існуючих відеокамер і застосовують алгоритми ШІ до цього відео.

Граничний ШІ може бути потужним інструментом у двох ключових аспектах. По-перше, виявляючи людей, події або ситуації за допомогою різних аналітичних даних і автоматично запускаючи оповіщення або реакцію. Другий – це автоматичний аналіз відео та застосування метаданих для полегшення подальшого пошуку.

Наприклад, замість того, щоб шукати людину в червоній сорочці у відеозаписах, фахівець з безпеки може ввести запит “червона сорочка” і отримати всі відповідні відеозаписи.

Звичайно, заміна мільярда камер безпеки по всьому світу на розумні камери з процесорами штучного інтелекту – завдання не з легких. Але кінцева мета полягає в тому, щоб перенести якомога більше обробки комп’ютерного зору – як ШІ, так і обробку відео для покращення якості – на периферію камери, де вона може принести найбільше користі.

Незалежно від того, чи це розумні камери, чи камери, які стали розумнішими завдяки підключенню до системи з процесорами машинного зору, індустрія безпеки знаходиться в кращому становищі, ніж будь-коли раніше, щоб використовувати ШІ для загального блага.

Матеріали статті запозичені з ресурсу: https://www.securitysales.com/surveillance/management/trends-computer-vision-ai-security-cameras/