Software Supreme – компютърното зрение, път към глобалните пазари
Само за три години българският разработчик на една от най-иновативните технологии става част от редица международни партньорства
Компютърното зрение е област на изкуствения интелект, която позволява на компютрите да извличат смислена информация от цифрови изображения, видеоклипове и други визуални данни. Основните аспекти на технологията включват разпознаване на изображения - идентифициране на конкретни обекти, хора или действия, разпознаване на обекти - определяне на местоположението на множество обекти в една снимка, сегментиране на изображения - разделяне на изображението на сегменти с цел опростяване на анализа, анализ на движението - разбиране на траекторията на движещи се обекти в даден видеоклип, както и нашумялото в последно време лицево разпознаване.
„Тази технология е толкова нова, че още не са намерени всички нейни приложения. Хората все още експериментират какво може да се прави с компютърното зрение, което е много интересно и за нас, тъй като всеки нов проект е ново предизвикателство“, обяснява ми Александър Соклев, главен изпълнителен директор на българската компания Software Supreme, която разработва подобни системи, и добавя:
„Но и към днешна дата приложенията на технологията са много. Пример за такова са автоматизираните системи в големите вериги магазини, които разпознават автоматично номера на колата и вдигат бариерата. Това е едно удобство, което е изцяло базирано на компютърно зрение“.
Технологията има широко приложение и в медицинските устройства като томографските апарати, като вече има модели, които засичат ракови клетки в ранен стадий, още преди дори лекарите да могат да го направят.
Земеделието е друга сфера, в която компютърното зрение играе все по-голяма роля, както и интелигентните градове, където камери, снабдени с подобен софтуер, следят трафика в реално време, засичат броя и типа на колите и на базата на това регулират светофарите спрямо пътната обстановка във всеки един момент.
Именно широкото приложение, което има компютърното зрение - дори в момент, в който пълният му обхват все още остава загадка – мотивира Александър Соклев и неговият екип да се впуснат в технологичното приключение, наречено Software Supreme.
Първият проект и оттам нататък
След като натрупват експертиза в сферата на високопроизводителните изчисления и конкретно в работата с видеокарти, през 2021 г. те създават компанията с една конкретна цел – да се включат в един от най-иновативните пазари и то на глобално ниво.
„Това беше идеален момент, в който можехме да използваме нашите умения, за да помогнем на хората в този сектор. В него видеокартите имат широко приложение, тъй като на практика те са един процесор, създаден с идеята да обработва милиони пиксели в секунда, а тогава се появи достатъчно добър хардуер, който да върши това в периферията. Ние пък знаехме как да го програмираме и да извличаме информация от камерите в близост“, спомня си Александър Соклев.
За да се отличи от засилената конкуренция, още от първите си дни Software Supreme залага на една от най-сложните области на компютърното зрение - анализа на потоци от кадри в реално време.
„В най-разпространените случаи в момента се използват хора, които следят какво виждат камерите, или съдържанието се записва в някаква среда и когато се наложи, този запис се проверява. Ние разработваме софтуер, който анализира веднага данните от камерите и може бъде настроен да засича всичко – хора, животни, коли, пътни знаци и маркировка и т.н.“, обяснява ми главният изпълнителен директор на разработчика.
И първият глобален проект на компанията не закъснява. Той идва от автомобилния сектор и е свързан със създаването на камера за повишаване на безопасността на автомобилите. В неговите рамки трябва да бъде изградена система, която да работи в реално време и да сигнализира на шофьорите за потенциални рискове и опасности.
„Тя разполагаше с много широкоъгълна камера, която виждаше на 180 градуса всичко пред колата, след което използаше невронни мрежи в реално време за анализ на евентуални заплахи. Камерата беше 8 мегапискела, но това голямо зрително поле водеше до невъзможност за надеждно улавяне на фини детайли от разстояние. Тя предаваше общата картина, но когато нещо ти направи впечатление, не можеше да си сигурен дали наистина това, което виждаш, е това, което си мислиш, че виждаш. Така невронната мрежа засичаше потенциалните рискове, но даваше ниски нива на увереност дали това наистина са рискове“, обрисува проблема Александър Соклев.
Software Supreme решава това предизвикателство като интегрира втора камера - телескопична, която има много по-тясно зрително поле, но за сметка на това много по-добра разделителна способност в него. По този начин, когато първата камера засече дадена опасност, втората конкретизира дали това наистина е опасност.
Намесата на българския разработчик е от особено значение, тъй като екипът на възложителя вече е стигнал до етапа на доказване на концепция на продукта, той е представен пред инвеститори и одобрен, но се затруднява с неговото реално пускане на пазара. Именно включването на Software Supreme помага разработката да се превърне в пазарна реалност, което ѝ отваря пътя към нови проекти на глобалния терен.
Към днешна дата компанията работи по две начинания в сферата на земеделието и животновъдството, като едното от тях се реализира в България, въпреки че вътрешният пазар не е неин фокус. В неговите рамки тя спомага за разработката на робот за автоматично плевене и поддръжка на лавандулови полета, чиято основна задача е да обикаля по полето, да разпознава плевелите от лавандула и така да тори посевите, унищожавайки ненужните растения в същото време.
Вторият проект пък помага за оптимизацията на работата на развъдник за риба, като следи популацията. Освен че засича самите риби и дава информация в реално време за тяхната дължина и размери, системата може да сигнализира при появата на външни белези за заболявания, което помага за своевременната реакция на стопаните на развъдника.
„В момента работим и в сферата на транспортната индустрия с израелска компания, която предлага решение за големи корабни контейнери. Става дума за кораби, които пренасят автомобили от Япония за САЩ. Те имат 12 палуби, дълги по 200 метра, и превозват хиляди автомобили, които трябва да бъдат следени постоянно. Затова на кораба има над 130 камери“, обяснява ми основателят на Software Supreme и акцентира:
„Следенето им е непосилно дори за няколко човека, тъй като според проучвания един човек адекватно може да следи не повече от четири камери. Машината обаче няма този проблем - тя може да следи всичко без умора. На тези кораби нашият софтуер е пригоден да засича пушек - ако се появи такъв, системата активира сирена, за да могат моряците да реагират веднага, тъй като това е изключително опасна ситуация в морето. Засичаме разливи на масло, дали хората носят обезопасителна екипировка и дали навлизат в определени зони, в които е забранено“.
За да се постигнат всички тези възможности на една система обаче, разработчиците трябва да се справят с редица предизвикателства.
Предизвикателства, възможности и бъдеще
Най-голямото от тях е системата да се направи така, че да работи надеждно. В основата си невронните модели са статистически методи и като такива винаги има статистически грешки. Това принуждава софтуерните инженери да свършат много допълнителна работа, за да подсигурят, че системите базирани на изкуствен интелект, отговарят на конкретните изисквания на различните крайни клиенти. В този процес те използват много похвати, с които вкарват различни слоеве за допълнителен анализ върху невронната мрежа, за да са сигурни, че това, което системата дава като резултат, е смислено, надеждно, повтаряемо и работи стабилно във времето.
Често софтуерните инженери, занимаващи се с компютърно зрение, се сблъскват и с друг сериозен проблем – липсата на достатъчно данни за персонализацията на платформите за конкретни случаи на употреба. Неговото решаване е трудоемък процес, който изисква дълги периоди на събиране на информация, анотация и обучение на моделите.
Водени от амбицията си за глобално присъствие, Software Supreme се сблъсква с предизвикателства и от бизнес естество.
„Глобалният пазар е огромен и за една българска компания е много трудно да изпъкне и да вдъхне доверие. Когато си малка компания от държава, която много хора не са чували, това е голямо предизвикателство. Американците, например, често пъти гледат на света като „САЩ и всичко останало“. Ако една американска компания е имала проблеми заради това, че е потърсила евтин доставчик в чужбина, обикновено в страна от третия свят, и нещата не са се случили по най-добрия начин, става много трудно да ѝ докажеш, че ти можеш да реализираш успешно дадена задача, защото в техните очи ти си чужденец и следователно същият като предишния. Затова всяка компания, която иска да работи на глобалните пазари, трябва да има достатъчно голямо портфолио и истории на успеха, за да изгради нужното доверие“, категоричен е основателят на българския разработчик.
Но веднъж преодолени тези трудности, технологията предоставя на крайните потребители редица предимства. На първо място е познанието, което тя дава. С помощта на компютърно зрение не е нужно потребителят да търси кога се е случило дадено събитие – то може да бъде засечено автоматично и да бъде оповестено в реално време. Това, от една страна, намалява разходите за видеонаблюдение, а от друга – повишава качеството. Технологията също така оптимизира много процеси, какъвто е случаят със системите за контрол на достъпа, базирани на компютърно зрение. И всичко това, при положение, че полето все още е ново и пред него има широки хоризонти за развитие.
„Видеокартите се развиват, като повишават възможностите на компютърното зрение. През 2012 г. света гръмна с първата невронна мрежа за разпознаване и класифициране, която можеше единствено да каже какво има на дадена картинка - например котка или куче. Към днешна дата тази технология се е развила толкова, че не само може да определи какво има на дадена картинка, но и да го различи от хиляди други неща в нея. Съществуват модели, които могат да засичат 8 400 обекта върху една снимка, да ги разграничат един от друг и да очертаят контура им. И това е само началото“, категоричен е Александър Соклев.
А попитан за бъдещето на Software Supreme в пътешествието ѝ в тази все още неизследвана технология, той добавя:
„Моделът, който в момента предлагаме, е успешен и ще продължим да работим по него. Но се опитваме да разширим капацитета си – на първо място чрез нови партньорства. Досега сме работили с доставчици като Nvidia, но разширяваме тази база. Вече работим с Qualcomm, NXP, Mediatek и други производители на крайни устройства. Създадохме и Image Quality екип, съставен от инженери, чиито специалности са по-близо до фотографията. Те много добре разбират как работи една камера и нужда от каква обработка има, за да се продуцира изображение, което отговаря на нуждите на крайния потребител. При нас той често не е човек, а невронен модел, чиито нужди са много по-различни от тези на хората“.
Какво е бъдещето на технологията за компютърно зрение тепърва предстои да видим, но относно това на Software Supreme има поне едно сигурно нещо – то е глобално.