Зір робота - як це влаштовано та сфери застосування

Зміст:

  1. Введення
  2. Історія розвитку машинного зору
  3. Сфери застосування машинного зору
  4. Плани на майбутнє
  5. Висновок

 

Введення

Ми знаємо, що основну частину інформації про зовнішній світ людина отримує за допомогою зору і далі обробляє отриману інформацію за допомогою апарату аналізу і інтерпретації візуальної інформації. Тому ще в минулому столітті постало питання про можливість машинної реалізації цього процесу. Машинний зір - необхідний компонент сучасних технологій. Цей елемент є одним з найбільш перспективних методів автоматизації дій із застосуванням комп'ютерних технологій і робототехники. Системи машинного зору мають на увазі перетворення даних, що поступають з облаштувань захоплення зображення, з виконанням подальших операцій на основі цих даних.

Нині машинний зір найбільш затребуваний в медицині, робототехнике, автомобільній промисловості, військовій галузі і біотехнології. Це пов'язано з тим, що в цих галузях вже є чітко сформульовані завдання для комп'ютерного зору, рішенням яких займаються провідні дослідницькі центри і компанії. При цьому можливе поле застосування машинного зору, по-справжньому, величезно - ці технології можуть бути використані практично в усіх сферах життєдіяльності. За рахунок зростання складності вирішуваних науково-технічних завдань, автоматична обробка і аналіз візуальної інформації стають усе більш актуальними питаннями. Крім того, можна сказати, що успіх сучасного бізнесу грунтується головним чином на якості пропонованої продукції. А для його забезпечення потрібно візуальний контроль. Так з'явилися цифрові і інтелектуальні камери, а також програмне забезпечення, оброблювальне зображення для виконання усіх перевірок.

Необхідність в машинному зорі виникає в ситуаціях, пов'язаних з ризиком для життя, і буває обумовлена особливостями людини як живого організму, якому властиво швидко стомлюватися, пропускати через себе обмежений об'єм інформації, а також обробляти дані з відносно низькою швидкістю. Звичайно, в ідеалі йдеться про створення універсальної самонавчальної системи, яка б "росла" і "зріла" так само, як це відбувається з людиною з моменту його народження. Керуючись такими високими цілями, розробники в області комп'ютерного зору сьогодні вирішують непрості завдання. Можна сказати, що область комп'ютерного зору має недовгу за мірками фундаментальних наук, але дуже бурхливу історію зародження і розвитку.

Історія розвитку машинного зору

Історія комп'ютерного зору як науки бере свій відлік з 50-х років XX століття. Саме у цей період комп'ютери почали ставати загальнодоступним засобом обробки і аналізу інформації. Проте слід зазначити, що перші системи оцифрування візуальної інформації були дуже примітивними, а зображення - малоформатними. У історії розвитку машинного зору можна виділити наступні важливі роки: 1958 г - вчений Френк Розенблатт з університету Корнеля створив комп'ютерну реалізацію персептрона. Цей пристрій моделював схему розпізнавання образів людським мозком. Апаратний варіант Mark I Perceptron був побудований в 1960 р. і призначався для розпізнавання зорових образів.

Mark I Perceptron

Mark I Perceptron

Проте розгляд завдань машинного зору носив швидше умоглядний характер, оскільки ні техніки, ні математичного забезпечення для вирішення таких складних проблем ще не було. 1960-і гг - з'явилися перші програмні системи обробки зображень, стали розвиватися прикладні дослідження в області розпізнавання друкарських символів. Проте все ще існували обмеження в розвитку цієї області науки, такі як відсутність дешевих оптичних систем введення даних, обмеженість і досить вузька спеціалізація обчислювальних систем.

На початок 60-х років завдання комп'ютерного зору в основному охоплювали область космічних досліджень, що вимагали обробки великої кількості цифрової інформації. 1970-і рр. - Лауренс Робертс, аспірант МТИ, висунув концепцію машинної побудови тривимірних образів об'єктів на основі аналізу їх двовимірних зображень. На цьому етапі став проводитися глибший аналіз даних. Почали розвиватися різні підходи до розпізнавання об'єктів на зображенні, наприклад структурні, ознакові і текстурні.

1979 р. - професор Ганс-Хельмут Нагель з Гамбургського університету заклав основи теорії аналізу динамічних сцен для розпізнавання об'єктів, що рухалися, у відеопотоці. У кінці 1980-х років були створені роботи, здатні більш-менш задовільно оцінювати навколишній світ і самостійно виконувати дії в природному середовищі. 80-і і 90-і роки ознаменувалися появою нового покоління датчиків двомірних цифрових інформаційних полів різної фізичної природи. Вдосконалення ж технологій виробництва цих датчиків дозволило істотним чином понизити їх вартість, тобто значно розширити сферу їх застосування.

З початку 90-х років в алгоритмічному аспекті послідовність дій з обробки зображення прийнято розглядати у згоді з так званою модульною парадигмою. Ця парадигма, запропонована Д. Марром, стверджує, що обробка зображень повинна спиратися на декілька послідовних рівнів висхідної інформаційної лінії : від неструктурованої форми до їх символічного представлення(векторні і атрибутивні дані в структурованій формі, реляційні структури і т. п.). В середині 90-х років з'явилися перші комерційні системи автоматичної навігації автомобілів. Трохи пізніше в кінці 20-го століття вдалося розробити ефективні засоби комп'ютерного аналізу рухів.

2003 г - на ринок були випущені перші досить надійні корпоративні системи розпізнавання осіб. До справжнього моменту теорія комп'ютерного зору повністю склалася як самостійний розділ кібернетики, що спирається на солідну наукову і практичну базу знань. Щорічно з цієї тематики видаються сотні книг і монографій, проводяться десятки конференцій і симпозіумів, випускається різне програмне і апаратно-програмне забезпечення.

Сфери застосування машинного зору

У сучасному світі машинний зір використовується практично в усіх технологічних процесах. Найбільш яскравими прикладами добре фінансованих наукових центрів по розвитку машинного зору можуть служити Лабораторія Штучного Інтелекту Массачусетсского Технологічного Інституту(MIT Artificial Intelligence Laboratory), UC Berkeley Computer Vision Group, Vision and Autonomous Systems Center Університету Корнеги-Меллона, Stanford Vision Laboratory.

Основними глобальними виробниками систем машинного зору є компанії Cognex, Sensopart, Visionics, Eyematic і інші. У Росії - SPIRIT, Лабораторія комп'ютерного зору Інституту Інформаційних Технологій, Науково-технічний центр "Модуль", "Проминформ" і ряд інших організацій. Особливо затребувані системи машинного зору в робототехнике.

Експерти вважають, що ці технології - найпростіший спосіб навчити апарати автономним діям у природному світі. Так, за допомогою машинного зору роботи орієнтуються в довкіллі і допомагають здійснювати відеоконференції. У промисловості машинний зір - популярний метод автоматизації виробництва із застосуванням сучасних роботів.

У промисловості

Застосування промислових роботів на виробництві для переміщення предметів вимагає високої точності позиціонування. У цьому допомагають просунуті системи машинного зору. З їх допомогою роботи здатні проводити автоматичний аналіз предметів. Облаштування захоплення зображень, а також облаштування аналізу і обробки зображень в робочій зоні маніпулятора є головними складовими системи машинного зору. Це не лише прискорює виконання робіт, але і виключає помилки, обумовлені людським чинником.

Найчастіше технології машинного зору застосовуються в автомобільній, харчовій і легкій промисловості. Сучасні цифрові камери випускаються переважно у форматі 3D і можуть сприяти головному комп'ютеру виконувати одночасно декілька операцій - наприклад, вимірювати рівень рідини в тарі, прочитувати штрих-код і перевіряти чи на місці кришка.

Досить часто для організації машинного зору потрібно додаткові пристрої. В першу чергу це датчики, які виконують операції, недоступні основному пристрою - камері. Це можуть бути сенсори руху, інфрачервоні, фотоелектричні датчики і так далі. Наприклад, компанія Clearpath Robotics використовує як основний елемент бачення у своїх роботах-транспортерах датчик 2D і 3D LIDAR. Взагалі цей датчик має широке поширення в автомобільній промисловості. За допомогою його автономні автомобілі можуть "бачити" свій шлях і уникати перешкод. Виробники KUKA, Kawasaki, ABB, Epson використовують технології машинного зору для точної і ефективної роботи своїх маніпуляторів.

Удома

Важливу роль машинний зір грає в соціальній і домашній робототехнике. Системами бачення оснащені навіть роботи-пилососи, приміром, останній пилосос від Samsung POWERbot VR9000H оснащений бортовою камерою і датчиками, які сканують простір і дозволяють роботові легко орієнтуватися в приміщенні. А останній автоматизований пилосос LG НОМ- BOT Turbo + має датчики камери Triple Eye, які відстежують місця, вже очищені раніше. Камера розташована на передній частині пристрою і дозволяє виконувати смарт-функцию під назвою Home - Guard. У iRobot також з'явився новий роботизований пилосос Roomba 980 з камерою, яка нахиляється вперед і вгору приблизно на 45 градусів і технологією VSLAM для ефективної побудови карти і логічного проходження по маршруту.

Окреме досягнення - це інноваційна система OMOTE. Це технологія машинного бачення, яка здатна в режимі реального часу визначити форму особи, розпізнати усі об'єкти на нім і проектувати точно підібрані зображення. Система може відсканувати заздалегідь обличчя людини, потім намітити спеціальні точки для маркіровки тих областей, на які повинні накладатися зображення. Вражаючий ефект технології досягається за допомогою високоточного проектора.

У сервісній галузі

Сервісні роботи також є величезним полем діяльності для машинного зору. Візьмемо спершу область охоронних систем для ідентифікації особи, розпізнавання і відстежування об'єктів, що рухаються. Яскравий приклад - робот-охоронець Bob від G4S, який ефективно сканує офіси за допомогою 3D датчиків, створюючи відображення усього довкілля. Ще один нещодавно випущений робот-охоронець Knightscope K3 надає комплексні рішення безпеки як усередині приміщень, так і на відкритому повітрі, завдяки що обертається радару на 360 градусів, камерам високої чіткості, тепловизору, системам розпізнавання номерних знаків, людей і облич.

Відомий робот телеприсутності VGo може переміщатися завдяки комп'ютерному зору по будівлях, дозволяючи людям бачити все навкруги і спілкуватися з людьми видалено. Так само діє і робот телеприсутності з машинним зором Beam від Suitable Technologies. Такі комунікаційні роботи, як Iuro, SociBot, Talking - Ally і новинка 2016 року Aido завдяки вбудованим мікрокамерам, штучному інтелекту і датчикам можуть розпізнавати предмети, розрізняти обличчя людей, розмовляти і навіть проявляти емоції.

У громадському харчуванні

У багатьох ресторанах, готелях, торгових центрах і офісах вже давно використовуються просунуті роботи для обслуговування клієнтів. Машинний зір у поєднанні з ПЗ дозволяє цим технологіям розмовляти з людьми і відповідати їх прохання. Найбільш яскравий приклад - гуманоїд SoftBank Pepper, який активно поширюється по Японії і навіть вже по Європі, працюючи в магазинах і торгових центрах в ролі консультанта. Серед останніх новинок в цій галузі також варто виділити робота Space Genius, призначеного для роботи в супермаркетах, скануючого усі продукти і штрих-коды і відео, що відображає, на дисплеях в HD дозволі.

У сільському господарстві

Істотний попит на комп'ютерний зір спостерігається з боку сільськогосподарських організацій, де потрібна автоматизація діяльності по візуальному контролю і сортуванню продуктів. Тут можуть застосовуватися роботи з машинним баченням, такі як CASER, Ladybird, а також Ibex. Останній оснащений цілим масивом камер і датчиків, щоб вправно, маневрено і з більшою автономією працювати на полях.

У беспилотниках

Далі розглянемо велику сферу безпілотних літальних апаратів, які оснащені технологіями машинного зору для автономного і безпечного польоту. Aeromapper Talon являється беспилотником з кращою оптикою у світі - 16 МП камерою з об'єктивом Voigtlander. Разом з цими технологіями дрон має систему контролю дальності діапазону і передачі даних на великі відстані(20 км). Компанія SNAP Vision також пропонує беспилотники з високотехнологічними компонентами. Так, дрон StitchCAM оснащений запатентованим датчиком зображення V2, який захоплює дані з високим розділенням. Коптер DJI Phantom 4 є першим споживчим БПЛА з автономною системою позиціонування, що використовує оптичні, ультразвукові датчики і 4 мікрокамери.

Машинний зір грає велику роль для військових беспилотников, оскільки розпізнавання об'єктів за допомогою комп'ютера потрібне для проведення місій спостереження і розвідки. Такими технологіями оснащені військові беспилотники компаній Northrop Grumman, BAE Systems, Boeing і IAI. Візьмемо приміром БПЛА Northrop Grumman Bat, який оснащений високоточними датчиками і камерами. Він може літати автономно, проводити розвідку, спостереження, рекогносцирування, визначати саморобні вибухові пристрої і працювати спільно з пілотованою авіацією.

У медицині

Відзначається зростання інтересу до систем машинного зору і у сфері медицини. Ці технології можуть робити автоматичний аналіз медичних зображень - рентген, томографія, УЗИ. Обробка отриманих за допомогою комп'ютерного зору зображень і відеоданих може застосовуватися для точнішої постановки діагнозів. Медичні роботи, оснащені системами комп'ютерного бачення, вже довели свою ефективність на практиці. Хірургічна система da Vinci Xi має розширені основні можливості, у тому числі інструменти візуалізації 3D - HD і інтуїтивного руху. Ця технологія бачення забезпечує хірургові збільшене зображення для точного позиціонування під час операції.

За подібним принципом працюють роботи-хірурги CT Sabre від Parallax Innovations і IGAR від CSII. Медичний робот RP - VITA від iRobot використовується лікарями, щоб періодично спостерігати за пацієнтами, що перенесли інсульт у видалених лікарнях. Цей робот забезпечений тридцятьма датчиками, які дозволяють йому пересуватися по лікарняних коридорах, автоматично уникати зіткнень з медичним персоналом або іншими перешкодами.

З останніх новинок - робот-хірург STAR, який є першим автономним інструментом для проведення складних хірургічних операцій. Його зорова система спирається на інфрачервоні маркери області оперованого органу. Спеціальна NIRF камера відстежує ці маркіровки в той час, як 3D-камеры записують зображення усього операційного поля. Поки що апарат застосовується на тваринах, але можливо в майбутньому чекати повноцінні операції з його участю і на людині.

Плани на майбутнє

Машинне бачення має великі перспективи, щоб перевершити людину в найближчі десять років. Вже зараз роботи можуть бачити крізь стіни і на кілометри вперед. Навіть таке складне завдання, як розшифровка відеоінформації скоро буде під силу комп'ютерам. Розумними роботами стануть не лише автомобілі, але і роботи-потяги і роботи-літаки. А ще роботи-хірурги, рука яких ніколи не здригнеться і не зірве скальпель, а їх гострозоре око вчасно помітить артерію.

Сподіватимемося, що люди зможуть направити розвиток машинного зору у вірне русло. В майбутньому ідеальна система машинного зору грунтуватиметься повністю на цифрових технологіях з використанням інтелектуальних камер і бюджетного устаткування для обробки і розпізнавання зображень. Ключовим елементом тут, звичайно, буде програмне забезпечення, яке здатне гнучко і швидко налаштовуватися на потрібну область з динамічним розширенням функціональних можливостей.

Хирохиса Хирукава, дослідник з Національного інституту перспективних наукових досліджень і технологій, заявляє, що виробництво роботів в XXI столітті може стати найбільшою галуззю промисловості, подібно до виробництва автомобілів в XX столітті. При цьому вже до 2025-го, в крайньому випадку, до 2050 року варто чекати масового поширення роботів, що служать для виконання домашніх робіт. Керівник проектного відділу компанії Microscan Боб Таплетт також заявляє із цього приводу: "Можна стверджувати, що в майбутньому системи машинного зору перетворяться на системи збору даних. Пристрої для прочитування штрих-кодов підуть в минуле, і значною мірою це буде обумовлено тим, що системи машинного зору здатні вирішувати значно більше завдань".

Висновок

Розібравшись в машинному зорі, ми переконалися, що багато висот вже досягнуті, але багато ще попереду. Розвиток машинного зору може допомогти роботам досягти небувалих результатів і розвинути величезну потужність, випереджаючи людину. Хоча до цього ще далеко. Недосконалість машинного зору обумовлена частково технічними причинами, проте йде бурхливий розвиток інформаційних технологій і знаходиться все більше рішень цих технічних проблем. Системи машинного зору стають усе більш актуальні, оскільки покликані вирішувати найбільш значимі проблеми людства, такі як безпека, медицина, промислові завдання. А що ви думаєте про розвиток машинного зору у наш час? Пропонуємо обговорити це питання разом з нами. Чекаємо ваших коментарів.

↩️ Останні новини та значні події у світі робототехніки