Как компьютерное зрение применяется в бизнесе?

Владимир: Что из себя представляет современное компьютерное зрение? Владимир: Это технология, с помощью которой можно обнаруживать, отслеживать и классифицировать объекты. То есть компьютерное зрение проводит захват-анализ видеопотока с видеокамер, впоследствии классифицирует полученные данные, обнаруженные объекты и так далее. Владимир: Вспомним фильм «Терминатор» — у него в глазах было видно, как он захватывает объекты, строит мишень, стреляет, анализирует информацию — фактически то же самое, только в современном мире это уже реальность, а не фантастика. Филипп: Да, мы говорим про «Скайнет», про все в одном. В комплексе с компьютерным зрением у нас также используются нейросети. Это искусственный интеллект, некая математическая модель, а также ее программное и аппаратное воплощение, построенное по принципу организации и хранения биологических нейронных сетей. Владимир: Мы понимаем нейросеть как нечто самообучающееся, как штука, которая видит или получает информацию и со временем становится лучше. Это так? Филипп: Это искусственный интеллект по сути. Только мы на данный момент используем нейронную сеть и обучаем ее сами для того, чтобы она могла определять какие-либо объекты. Архитектура строится так, что с камер видеонаблюдения видеопоток передается в нейросеть, а нейросеть классифицирует объект для определения или выявления каких-либо нарушений. Владимир: Но, в частности, ваша компания специализируется на внедрении компьютерного зрения на различных производствах. Вот могли бы какие-то кейсы сказать? Как ваш продукт интегрируется в конкретные производственные процессы? И чем он может быть полезен? Филипп: Расскажу чуть предысторию. Начинали мы всю разработку и обследование в 2016 году. К нам обратилась одна из нефтесервисных компаний, у которой была необходимость выявлять процессы нарушения бизнес-, технологических и, в первую очередь, процессов безопасности. Они сами говорят, что их правила безопасности писаны кровью, поэтому им нужно было как раз захватывать видеопоток с видеокамер и отслеживать нарушения в части несоблюдения требований техники безопасности. Например, нарушения ношения спецодежды. Человек, который работает в нефтяной и газовой отрасли, по правилам и техникам безопасности должен носить каску на голове, иметь защиту рук и ног. То есть средства защиты рук, ног, жилеты и так далее. Собственно, мы справились с этой задачей — разработали систему, которая позволяет в онлайне отслеживать какие-либо нарушения, и вовремя их предупреждать. Владимир: То есть фактически камера смотрит на большое количество людей, которые работают, видит, кто из них не одет в спецодежду, и сообщает курирующему менеджеру об этом? Филипп: Да. На текущий момент во многих сервисных и нефтедобывающих компаниях, где ведется производство на непосредственно месторождении, стоят видеокамеры. Но проблема заключается в следующем. Фактически, вся эта информация собирается, но не анализируется в онлайн-режиме. Постфактум, если произошло какое-то происшествие, тогда уже разбираются, делаются определенные выводы. Наша система позволяет, скажем так, минимизировать человеческий фактор, в автоматическом режиме контролировать и выявлять проблемы, нарушения, которые мы туда закладываем. Владимир: Вы рассказали, как компьютерное зрение помогло одному из ваших клиентов в спасении жизни, соблюдении правил безопасности на производстве. Тем не менее, ближе к земле. Что еще может делать ваш программный продукт в области современного компьютерного зрения? Филипп: Сфера применения нашего продукта достаточно широка — практически на любом производстве. В любой области, где используется видеонаблюдение. На текущий момент у нас достаточно много заказчиков из области ритейла, компаний, занимающихся железнодорожными перевозками, крупных агрохолдингов, производственных площадок. Владимир: Что конкретно может делать технология? Вы же сказали, что она, например, может видеть людей, не одетых в спецодежду. Что еще конкретно она может? Филипп: Кейсов у нас достаточно много. Можно начать с промышленности. У нас был запрос от одной из областей России. У них была задача — минимизация воровства леса. Нужно было отслеживать лесовозы, смотреть кубатуру, сколько везет лесовоз, и сравнивать номера лесовозов с белым и черным списком, вовремя оповещать ближайший пункт ГИБДД. Владимир: Фактически можно камерой и при помощи программного продукта узнать сколько «кубов» в одном конкретном грузовике? Владимир, Филипп: Да. Владимир: Хорошо. А, например, маркетинговые какие-то активности есть? Владимир: Да. У нас была интересная задача. К нам обратилась большая аптечная сеть. В сети были повешены мониторы, нужно было смотреть и отслеживать какой возрастной категории заходит человек. В зависимости от категории показывать ту или иную рекламу. Данная технология используется для помощи продавцам. Есть какие-то акционные продукты, которые предлагаются тем или иным возрастным категориям людей, и, если продавец видит подсказку у себя на мониторе о том, что большинство людей, присутствующих в магазине сейчас, находятся в целевой аудитории от стольких до стольких лет, она, не задумываясь, может предлагать акционную продукцию. Как помощник это очень удобно. Филипп: Программный продукт «Морриган» может распознавать возраст, пол людей. Компьютерное зрение может отмечать передвижения людей, следить за их поведением Владимир: Наверняка, еще в банках можно это каким-то образом использовать? Например, я слышал, что распознавание лиц используется для анализа количества посетителей, их возрастных характеристик и так далее. Для того чтобы собирать их данные, собирать биг дату по клиентам. Владимир: У нас вообще много разных задач используется. Была задача по распознаванию лиц для того, чтобы перед VIP-клиентами двери открывались автоматически, и секретарши видели, кто к ним заходит. Владимир: Что еще было интересного? Владимир: В банковской сфере много интересных задач. Во многих банках происходит следующее: сначала происходит нарушение — ограбление, задымление — и постфактум смотрят за тем, что случилось. Сейчас же компьютерное зрение позволяет предупредить какие-либо нарушения. Это можно сделать по разным маркерам. Например, заходит взрослый человек в киоск, где расположены банкоматы, он присел на корточки и сидит больше минуты, всяко не шнурки завязывает. Значит, что-то затеял. Что-то он хочет с банкоматом сделать точно. Камеры видеонаблюдения, фиксируя такое нестандартное поведение человека, перенаправляют видеопоток в службу безопасности банка, где сотрудники уже глазами могут проследить то, что в данный момент происходит в самом киоске. Либо какое-то нарушение целостности периметра — это если разбивают стекло, днем, когда датчики отключены и не сработают, мы также можем это отследить и вовремя перенаправить видеопоток, чтобы предотвратить аварию. Владимир: Это реально интересно. Расскажите, каким образом внедряется ваш программный продукт, из чего он состоит? Как происходит процесс внедрения технологии в жизнь? Владимир: Если говорить о маркерах, то это заданный алгоритм нарушения. Мы разработали типовые маркеры для определенных отраслей, в которых мы видим спрос, но основным заказчиком маркеров является непосредственно клиент, который знает свое производство, анализирует те узкие моменты, которые он должен увидеть. Он ставит перед нами задачу, мы разрабатываем маркер и потом начинаем внедрение, организационное, техническое, аппаратное. Филипп: Отвечу на первый вопрос. Что касается видеокамер. Преимущество нашего программного продукта «Морриган» в том, что мы можем работать с любым оснащением камеры. Заказчика необязательно переоснащать камерами видеонаблюдения, если у него уже есть архитектура данных. Если говорить простым языком, то программный продукт видит все то же самое, что видит человеческий глаз. Отвечаю на вопрос о качестве. Если человеческий глаз не видит какие-то нарушения, то программа может это различить. Владимир: Недавно я смотрел видео с американской технологической выставки, где ребята, ваши коллеги, тоже занимаются компьютерным зрением. Их концепция отличалась от остальных тем, что они не показывают конкретную картинку. Они строят скелет человека, при этом распознавая его, и показывают взаимодействия этих скелетов в пространстве. Например, можно ограничить выход ребенка на улицу из дома, или, например, если взрослый человек лежит на полу больше двух минут — это опасность для здоровья. Они говорят, что эта концепция будет выгодна тем, что есть некие вопросы приватности. Потому что показывать конкретно чем занимается человек, не всегда пристойно, правильно и так далее. Даже своим близким, домашним. Как вы и ваши клиенты относитесь к вопросу приватности, потому что на производствах случаются служебные романы, например, какие-то еще вещи. Насколько должен заказчик видеть это все? Насколько это применимо в частном секторе и в производстве? Филипп: Спасибо за вопрос. Прежде всего, мы работаем в инфраструктуре заказчика, те или иные ограничения, о которых вы сказали, решаются локально между заказчиком и его потребителями или клиентами. Если у него уже установлены камеры видеонаблюдения, то, наверное, это должно быть каким-то образом прописано в соглашениях с клиентами, сотрудниками. А наш программный продукт — всего лишь дополнительная надстройка, которая дает возможности. Пригодится технология и в труднодоступных местах Владимир: Это понятно, но, тем не менее, как вы лично относитесь к этому примеру? Если у вас дома или в офисе установлен такого рода программный продукт. Филипп: Все зависит от области применения. Нужно ли нам видеть скелет? Возможно, нам, наоборот, нужно опознать человека. Например, многим нашим заказчикам нужно идентифицировать людей, каких-то рабочих. Сейчас мы ведем переговоры с одним из заказчиков по установке маркировок на каске, чтоб мы могли конкретно распознать человека, кто это, из какой он бригады, есть ли у него допуск, обучение и так далее. Владимир: Я лично не против такой технологии, расскажу почему. В первую очередь, камера видит не скелет, а реального человека. После идентификации самого человека она переводит картинку в скелет для того, чтобы обезличить саму картинку. Знаю саму технологию и принцип ее использования, в этом нет ничего страшного, это наоборот большой плюс. Если вдруг со мной что-то случится, и вовремя службы среагируют — приедут и помогут мне — как я могу быть против этой технологии? Учитывая то, что сама камера на выходе дает меня как обезличенное существо в виде скелета. Сейчас у нас есть такие проработки, что мы устанавливаем камеры видеонаблюдения на крышах домов для отслеживания свободных парковочных мест. И когда люди ходят внизу по дороге, они не должны быть обезличены. Мы их закрашиваем. Владимир: Что же нам ждать от компьютерного зрения? Можно уже идентифицировать человека, понять, кто он. Наверное, можно послать какой-то запрос в базу данных и узнать, является ли он преступником или наоборот, входит в белый лист сотрудников предприятия. Или входит в белый лист вхожих в ваш дом людей. Какие задачи и проблемы сейчас стоят перед технологией, и чего нам ждать в ближайшие два-три-пять лет? Филипп: Мы все знаем, что живем в эпоху новых технологий. В последние десятилетия вопрос стоял по сбору информации, сейчас этот вопрос решен. Сейчас стоит вопрос по обработке этой информации, по хранению информации. Сейчас также эпоха потребления, эпоха маркетинговых определенных инструментов, с помощью правильной обработки информации можно построить правильный маркетинг. Владимир: Страшно что-то искать в интернете. Коллеги понимают, что ты искал. Вот я захожу на любой сайт, где есть Яндекс.Директ, вижу там путевки в Египет. Я понимаю, что скоро кто-то в отпуск собирается из моих сотрудников. Филипп: Да, именно так. Поэтому, прежде всего, сейчас стоит вопрос в обработке информации, а также адресному ее направлению, персонифицированному направлению. Если мы возьмем ритейл — консолидируется информация определенного пользователя, которая ему нужна в данный момент и в данную минуту. И она ему предлагается. Владимир: Вообще я представляю — заходишь в магазин, тебя сосканировали, перед тобой шоу девушек на тележках, которые предлагают тебе продукты, которые ты постоянно покупаешь. Я сейчас поднабрал вес и беру продукты диетические. Думаю, это не за горами. Владимир: Я согласен с тем, что эта технология довольно широко развивается. Тяжело заглянуть и ответить, что будет через два года, особенно через три или через пять. Очень быстро идет развитие технологии, нейронных сетей и компьютерного зрения. Владимир: Вы постоянно общаетесь с клиентами, чего еще пока нельзя делать, но очень бы хотелось? Какие задачи пока не реализуются? Чего хочется делать, но пока технологически невозможно? Владимир: Я бы сказал, что можно улучшать технологию «фейс детекшн». Это определение человека по лицу для того, чтобы можно было в большей мере сотрудничать с какими-либо службами. Владимир: Понимаю. Сейчас более четкое распознавание. В московских аэропортах есть стойки, они работают в тестовом режиме, когда система распознает человека. Конечно, качественно делать это с помощью тех технологий сложно. Владимир: Да. Почему я заговорил про эту технологию? Про места общего пользования вы верно говорите. Я говорю про такие запросы, которые приходили к нам от служб. Например, люди находятся в поиске алиментов. Компьютеры видят то, что человек пропускает Владимир: То есть ставить камеры в районе, где он живет, и накидывать на него сетки. Экспериментов с компьютерным зрением много — точки контроля в аэропортах, компания «Гугл» со своими «гугл-очками». На мой взгляд, это немного преждевременно, хотя сама технология очень крутая. Почему помощь компьютерному зрению в виде «гугл-очков» не взлетела? Филипп: Это не взлетело в розницу. Если говорить об узкоспециализированной направленности использования девайса, то он широко применяется на производствах. В принципе, «гугл-очки» – это хорошая база для внедрения других программных продуктов на базе этих очков, которые будут давать определенные возможности. Расскажем один из кейсов, связанных с «гугл-очками». Владимир: Да, у нас было одно производство, где внедряют рекомендательную систему. Они закупили «гугл-очки» и аналог. На производстве много брака. Для того чтобы минимизировать его количество, человек надевает «гугл-очки», они интегрируются с нашей системой, и она выступает как рекомендательная в части направления. Например, людям надо соединить красную и синюю клеммы. Из-за человеческого фактора возможны ошибки, но «гугл-очки» подсказывают, куда какую клемму нужно подсоединить. Все клеммы черные, а мы во время рекомендации подсвечиваем их цветом. Количество брака снизилось. Владимир: То есть на больших операциях это действующая штука. Что нам ждать в будущем? Все-таки с камерами уже появляются часы, суперумные наушники, браслеты и все что угодно. Владимир: Сейчас широко развиваются технологии, связанные с дронами и квадрокоптерами. У нас система работает в части обнаружения каких-либо нарушений. Дрон летает по территории, где ведется стройка, либо это запрещеная территория, где нельзя разводить костры, кемпинги, рыбачить в области дамб… Владимир: Или, например, лес или поле, где сельское хозяйство, жуки-короеды напали, например. Наверное, если б можно было это как-то визуально определять, то тоже можно работать. Филипп: Ну да. Представляете, насколько снижается себестоимость всей этой истории, когда не нужно ни человека использовать, ни вертолет, никакие средства. Просто квадрокоптер летает, к примеру, по заданному алгоритму, по заданной территории, прилетает на базу, а уже идет анализ того потока, который он отснял, люди, специально обученные, знают, где и в каком месте находится нарушитель. Владимир: Мы реально уже живем в будущем. Спасибо, дорогие друзья, что пришли ко мне в гости.

Как компьютерное зрение применяется в бизнесе?
© RB.ru