محققان یک الگوریتم نوری را کشف کرده اند که تصاویر را در یک پیکسل تجزیه و تحلیل می کند

محققان دانشگاه اسطوره ها با همکاری تیمی از دانشگاه هسته و مایکروسافت الگوریتم بصری نامگذاری شد استگو آنها توسعه داده اند که می توانند تصاویر را با نزدیکترین پیکسل تجزیه و تحلیل کنند.

برای مردم، شناسایی اشیا و اشیا در یک صحنه به سادگی نگاه کردن به آنهاست. اما برای هوش مصنوعی و الگوریتم های بصری، درک بالا از محیط نیاز به تلاش بیشتری دارد. بنابراین، محققان MIT تقریبا 800 ساعت آنها برای افزایش دقت الگوریتم بصری استفاده شدند. تیم با گروهی از دانشمندان دانشگاه “هسته“من”مایکروسافت“همکاری، الگوریتم”استگو»این می تواند تصاویر را با دقت پیکسل تجزیه و تحلیل کند.

الگوریتم های توسعه یافته قبلی می توانستند اشیا را از یکدیگر به عنوان یک کل متمایز کنند. به عنوان مثال، سگی را به جعبه ای که روی یک چمن نشسته بود کشیده شد. هوش مصنوعی توانست با علامت گذاری سگ ها، جعبه ها و علف ها، سگ ها را از علف تشخیص دهد. اما STEGO که به معنی «ترانسفورماتور خود کنترل با بهینه سازی گرافیک مبتنی بر انرژی“درست است، کار متفاوتی دارد. این الگوریتم بصری از تکنیکی به نام «تقسیم بندی«به همین دلیل است. با این روش برچسب ها دسته بندی می شوند و به هر پیکسل در تصویر یک برچسب اختصاص می یابد. این باعث می شود هوش مصنوعی دید دقیق تری نسبت به دنیای اطراف خود داشته باشد.

نکته قابل توجه دیگر در مورد این الگوریتم، تشخیص آن در برچسب گذاری است. هنگامی که سگ، جعبه و علف در کنار یکدیگر قرار می گیرند، الگوریتم می تواند پیکسل های هر جسم را به طور جداگانه علامت گذاری کند. به عبارت دیگر، اشیاء در این روش دارای برچسب‌های مختلفی هستند و مثلاً وقتی این پیکسل‌ها را درخواست می‌کنیم، فقط پیکسل‌های سگ را دریافت می‌کنیم – نه پیکسل‌های سگ و جعبه.

الگوریتم بصری

مشکل این تکنیک دامنه آن است. چنین روش‌هایی برای آموزش الگوریتم‌ها نیازمند برچسب‌گذاری هزاران – یا صدها هزار – تصویر هستند تا هوش مصنوعی بتواند بر اساس آنها کار تشخیص خود را انجام دهد. اما با این روش که بر اساس پیکسل های هر تصویر است، قطعا نمی توان از تصاویر برای آموزش الگوریتم استفاده کرد.

  انویدیا ابر Omniverse را برای سهولت در دنیای مجازی معرفی کرده است

تیم تحقیقاتی الگوریتم بصری در یک بیانیه مطبوعاتی نوشت: “STEGO به دنبال اشیاء مشابهی است که در یک مجموعه داده ظاهر می شوند.” سپس این اشیاء مشابه را به هم پیوند داد تا یاد بگیرد که چگونه آنها را با تمام تصاویری که می دید مقایسه کند. سپس این آموزش را برای هر پیکسل در تصویر اعمال کنید. تصویر تشخیص ویدیوی این الگوریتم را در زیر مشاهده می کنید.

STEGO در طیف گسترده ای از زمینه ها – از فضای داخلی خانه گرفته تا عکاسی هوایی در ارتفاعات بالا آموزش دیده است. STEGO همچنین برای کمک به وسایل نقلیه بدون راننده بسیار مفید است، زیرا افراد، علائم و موقعیت ها را با وضوح بالا و جزئیات اضافی نظارت می کند.

این الگوریتم بصری محدودیت هایی نیز دارد. مثلاً ماکارونی و بلغور را به عنوان غذا تشخیص می دهد، اما نمی تواند آنها را تشخیص دهد. در تصاویر عجیب، به عنوان مثال، با گذاشتن یک موز روی گوشی، او گیج شده و نمی تواند آنها را به درستی تشخیص دهد. تیم تحقیقاتی امیدوار است که تحقیقات بیشتری برای رفع این موانع انجام دهد و به سیستم اجازه دهد اشیاء را در دسته های مختلف شناسایی کند.

دیدگاهتان را بنویسید