مشاوره کاملا رایگان
آلفا مشاور

بینایی کامپیوتر

بینایی کامپیوتر چیست

مقدمه ای آرام بر بینایی کامپیوتر (بینایی ماشین)

بینایی کامپیوتر (Computer Vision) که غالبا به اختصار CV شناخته می شود، به عنوان زمینه ای برای مطالعه تعریف می شود که می خواهد تکنیک هایی را برای کمک به رایانه در “دیدن” و درک محتوای تصاویر دیجیتال مانند عکس ها و فیلم ها ایجاد کند.

مشکل بینایی رایانه ساده به نظر می رسد زیرا توسط افراد، حتی کودکان بسیار کوچک، به طور پیش پا افتاده ای حل می شود. با این وجود، این مشکل اساسا هم به دلیل درک محدود دید بیولوژیکی و هم به دلیل پیچیدگی درک بینایی در یک دنیای فیزیکی پویا و تقریبا بی نهایت متفاوت، یک مشکل حل نشده باقی مانده است.

در این پست، شما مقدمه ای آرام در زمینه بینایی کامپیوتر خواهید یافت.

پس از خواندن این پست، بر روی موارد زیر درک بهتری پیدا خواهید کرد:

  1. هدف حوزه بینایی کامپیوتر و متمایز بودن آن از پردازش تصویر.
  2. آنچه مشکل بینایی کامپیوتر را به چالش می کشد.
  3. مشکلات یا کارهایی معمولی که در بینایی کامپیوتر دنبال می شود.

بیایید شروع کنیم.

 

بینایی کامپیوتر

مقدمه ای آرام بر بینایی کامپیوتر (ماشین)

 

بررسی اجمالی

این آموزش به چهار قسمت تقسیم شده است و با دیدگاه بررسی اجمالی، موارد به صورت زیر هستند:

  1. میل به بینایی در کامپیوتر ها
  2. بینایی کامپیوتر چیست
  3. چالش بینایی کامپیوتر
  4. وظایف در بینایی کامپیوتر

میل به بینایی در کامپیوتر ها

ما در تصاویر غرق هستیم.

تلفن های هوشمند دارای دوربین هستند و گرفتن عکس یا فیلم و به اشتراک گذاری آن هرگز آسانتر از زمان حال نبوده است و در نتیجه رشد باورنکردنی شبکه های اجتماعی مدرن مانند اینستاگرام وجود دارد.

YouTube ممکن است دومین موتور جستجو باشد و صدها ساعت فیلم در هر دقیقه بارگذاری می شود و هر روز میلیاردها فیلم مشاهده می شود.

اینترنت از متن و تصاویر تشکیل شده است. نمایه سازی و جستجوی متن نسبتا ساده است، اما برای فهرست بندی و جستجوی تصاویر، الگوریتم ها باید بدانند که تصاویر شامل چه مواردی است. برای مدت زمان طولانی، محتوای تصاویر و ویدئوها مبهم مانده است، و بهترین توصیف با استفاده از توضیحات متا است که توسط شخصی که آنها را بارگذاری کرده است، توصیف شده است.

برای استفاده بیشتر از داده های تصویر، ما به رایانه ها نیاز داریم تا یک تصویر را “ببینند” و محتوای آن را درک کنند.

این یک مشکل پیش پا افتاده برای یک انسان، حتی کودکان خردسال است.

  1. یک شخص می تواند محتوای عکسی را که یک بار دیده است توصیف کند.
  2. یک شخص می تواند ویدئویی را که فقط یک بار دیده است خلاصه کند.
  3. فرد می تواند چهره ای را که قبلا فقط یک بار دیده است تشخیص دهد.

ما برای باز کردن قفل تصاویر و فیلم های خود، حداقل به توانایی های مشابه رایانه ها نیاز داریم.

بینایی کامپیوتر چیست؟

بینایی کامپیوتر یک زمینه مطالعاتی است که بر روی مسئله کمک به رایانه برای دیدن متمرکز است.

در سطح انتزاعی، هدف از مشکلات بینایی رایانه استفاده از داده های تصویری مشاهده شده برای استنباط چیزی درباره جهان است.

این یک زمینه تحقیقاتی چند رشته ای است که به طور کلی می تواند زیرمجموعه ای از هوش مصنوعی و یادگیری ماشین باشد، که ممکن است شامل استفاده از روش های تخصصی و استفاده از الگوریتم های یادگیری عمومی باشد.

 

بینایی کامپیوتر

بررسی اجمالی رابطه هوش مصنوعی و بینایی رایانه

 

به عنوان یک زمینه تحقیقاتی چند رشته ای از پژوهش های مختلف، با تکنیک هایی که از طیف وسیعی از رشته های مختلف مهندسی و علوم کامپیوتر گرفته شده و دوباره استفاده می شود، می تواند شلوغ و بی نظم به نظر برسد.

یک مشکل خاص در بینایی ممکن است به راحتی با استفاده از یک روش آماری دست ساز رفع شود، در حالی که مشکل دیگر ممکن است به یک مجموعه بزرگ و پیچیده از الگوریتم های یادگیری ماشین تعمیم یافته نیاز داشته باشد.

بینایی کامپیوتر به عنوان یک زمینه مرزی فکری است. مانند هر مرزی، هیجان انگیز و بی نظم است و غالبا هیچ مرجع معتبری برای ارجاع وجود ندارد. بسیاری از ایده های مفید هیچ پایه نظری ندارند و برخی از نظریه ها در عمل بی فایده هستند. حوزه های توسعه یافته به طور گسترده ای پراکنده هستند و اغلب یکی از آنها کاملا غیرقابل دسترسی به نظر می رسد.

هدف بینایی کامپیوتر درک محتوای تصاویر دیجیتالی است. به طور معمول، این شامل توسعه روش هایی است که سعی در بازتولید توانایی بینایی انسان دارند.

درک محتوای تصاویر دیجیتال ممکن است مستلزم استخراج یک توصیف از تصویر باشد، که ممکن است یک شی، یک توصیف متن، یک مدل سه بعدی و غیره باشد.

دید رایانه استخراج خودکار اطلاعات از تصاویر است. اطلاعات می تواند از موارد مختلف نظیر مدل های سه بعدی، موقعیت دوربین، ردیابی و تشخیص شی گرفته تا گروه بندی و جستجو در محتوای تصویر باشد.

پردازش تصویر و بینایی رایانه

دید رایانه ای از پردازش تصویر متمایز است.

پردازش تصویر فرآیند ایجاد یک تصویر جدید از یک تصویر موجود است، به طور معمول محتوا را، به نوعی ساده یا تقویت می کند. این نوعی پردازش سیگنال دیجیتال است و مربوط به درک محتوای تصویر نیست.

یک سیستم بینایی رایانه ای خاص ممکن است نیاز  داشته باشد که پردازش تصویر در ورودی خام، به عنوان مثال پیش پردازش تصاویر، اعمال شود.

نمونه هایی از پردازش تصویر عبارتند از:

  1. عادی سازی خصوصیات نورسنجی تصویر، مانند روشنایی یا رنگ.
  2. برش مرزهای تصویر، مانند مرکز دادن یک شی در عکس.
  3. حذف نویز دیجیتال از تصویر، مانند مصنوعات دیجیتال از سطح کم نور.

چالش بینایی کامپیوتر

کمک به رایانه برای دیدن بسیار دشوار است.

هدف بینایی رایانه استخراج اطلاعات مفید از تصاویر است. این یک کار شگفت آور چالش برانگیز است. در طی چهار دهه گذشته هزاران ذهن هوشمند و خلاق را به خود مشغول کرده است، و با وجود این ما هنوز قادر به ساختن “ماشین بینایی” با اهداف عمومی نیستیم.

بینایی رایانه آسان به نظر می رسد، شاید به این دلیل که برای انسان بسیار ساده است.

در ابتدا، اعتقاد بر این بود که این یک مسئله ساده پیش پا افتاده است که می تواند توسط دانشجوئی که دوربین را به کامپیوتر متصل می کند حل شود. پس از دهه ها تحقیق، “بینایی رایانه ای”، حداقل از نظر تأمین توانایی های بینایی انسان، حل نشده باقی مانده است.

ساختن رایانه کاری بود که به نظر کارشناسان برجسته در زمینه هوش مصنوعی در سطح دشواری پروژه دانشجویان تابستانی در دهه شصت بود. چهل سال بعد این وظیفه هنوز حل نشده و بسیار دشوار به نظر می رسد.

رسیدن به درکی خوب پیرامون عملکرد بینایی انسان

یک دلیل این است که ما درک خوبی از چگونگی عملکرد بینایی انسان نداریم.

مطالعه بینایی بیولوژیکی نیاز به درک اندام های ادراک مانند چشم و همچنین تفسیر ادراک درون مغز دارد. چه در ترسیم روند کار و چه در زمینه کشف ترفند ها و میانبرهای مورد استفاده در سیستم، پیشرفت زیادی حاصل شده است، اگرچه مانند هر مطالعه ای که مغز را درگیر کند، مسیری طولانی در پیش است.

روانشناسان ادراکی دهه ها تلاش کرده اند تا بفهمند که چگونه سیستم بینایی کار می کند و حتی اگر آنها بتوانند توهمات بصری را ابداع کنند تا برخی از اصول آن را از بین ببرند، یک راه حل کامل برای این معما دست نیافتنی است.

دلیل دیگر این مسئله چالش برانگیز به دلیل پیچیدگی ذاتی دنیای بصری است.

یک شی معین را می توان از هر جهت، در هر شرایط نوری، با هر نوع انسداد از اشیا دیگر و غیره مشاهده کرد. یک سیستم بینایی واقعی باید بتواند تعداد بیشماری از صحنه ها را “ببیند” و هنوز هم چیز معناداری را استخراج کند.

رایانه ها برای مشکلات بسیار محدود به خوبی کار می کنند، نه مشکلات بی حد و حصر مانند درک بصری.

 

بینایی کامپیوتر

 

وظایف در بینایی کامپیوتر

با این وجود، پیشرفت هایی در این زمینه وجود داشته است، به خصوص در سال های اخیر با سیستم های کالا محور برای شناسایی بصری شخصیت و تشخیص چهره در دوربین ها و تلفن های هوشمند.

بینایی رایانه در مرحله فوق العاده ای از توسعه است. خود این موضوع از دهه ۱۹۶۰ وجود داشته است، اما اخیرا امکان ساخت سیستم های رایانه ای مفید با استفاده از ایده های بینایی رایانه فراهم شده است.

کتابی با محوریت بینایی رایانه در سال ۲۰۱۰ تحت عنوان ” Computer Vision: Algorithms and Applications” لیست از برخی مشکلات سطح بالا را ارائه می دهد که در آنها موفقیت بینایی کامپیوتر را دیده ایم.

  1. تشخیص نوری کاراکتر (OCR)
  2. بازرسی ماشین
  3. خرده فروشی (به عنوان مثال صندوق های خودکار)
  4. ساختمان مدل سه بعدی (فتوگرامتری)
  5. تصویربرداری پزشکی
  6. ایمنی خودرو
  7. حرکت تطبیقی ​​(به عنوان مثال ادغام CGI با بازیگران زنده در فیلم ها)
  8. ضبط حرکت (موکاپ)
  9. نظارت
  10. تشخیص اثر انگشت و بیومتریک

این یک حوزه گسترده از مطالعه با بسیاری از وظایف و تکنیک های تخصصی و همچنین تخصص برای هدف قرار دادن حوزه های برنامه است.

کاربرد هایی از بینایی کامپیوتر

بینایی رایانه دارای کاربردهای بسیار متنوعی است، هم قدیمی (به عنوان مثال، ربات سیار، بازرسی صنعتی و اطلاعات نظامی) و هم جدید (به عنوان مثال، تعامل رایانه ای انسان، بازیابی تصویر در کتابخانه های دیجیتال، تجزیه و تحلیل تصویر پزشکی و ارائه واقع گرایانه مصنوعی صحنه ها در گرافیک رایانه)

بزرگنمایی برخی از ساده ترین وظایف بینایی رایانه که احتمالا با آنها روبرو خواهید شد یا علاقه مند به حل آنها هستید، با توجه به تعداد گسترده عکس ها و فیلم های دیجیتالی موجود در دسترس عموم، ممکن است مفید باشد.

بسیاری از برنامه های معروف رایانه ای بینایی شامل تلاش برای تشخیص چیزهای موجود در عکس ها است. مثلا:

  1. طبقه بندی اشیا: چه دسته وسیعی از اشیا در این عکس وجود دارد؟
  2. شناسایی شی: کدام نوع از یک شی مشخص در این عکس وجود دارد؟
  3. تأیید شی: آیا شی موجود در عکس است؟
  4. تشخیص اشیا: اشیا موجود در عکس کجا هستند؟
  5. تشخیص علامت شی: نکات کلیدی برای شی در عکس چیست؟
  6. تقسیم بندی شی: کدام پیکسل ها به شی موجود در تصویر تعلق دارند؟
  7. تشخیص اشیا: چه اشیایی در این عکس وجود دارند و کجا هستند؟

مثال های متداول دیگر مربوط به بازیابی اطلاعات است. به عنوان مثال: یافتن تصاویری مانند تصویر یا تصاویری که شامل یک شی هستند.

خلاصه

در این پست، شما مقدمه ای آرام و کلی در زمینه بینایی رایانه را کشف کردید.

به طور خاص، شما موارد زیر را یاد گرفتید:

  1. هدف حوزه بینایی رایانه و متمایز بودن آن از پردازش تصویر.
  2. آنچه مشکل بینایی کامپیوتر را به چالش می کشد.
  3. مشکلات یا کارهایی معمولی که در بینایی رایانه دنبال می شود.

 

 

احد الوندی

فارغ التحصیل مهندسی برق – گرایش الکترونیک

فعال در زمینه Data Science، هوش مصنوعی و اتوماسیون صنعتی

مدرس زبان برنامه نویسی Python و نرم افزار MATLAB

https://www.linkedin.com/in/ahadalvandi

ahadalvandi

نوشته‌های مرتبط

دیدگاه‌ها

*
*