هوش مصنوعی تشخیص تصاویر دارای کاربردهای فراوانی در دنیای واقعی است که میتواند به بهبود زندگی کمک کند، چیزهایی مانند تولید اتوماتیک کلمات کلیدی و شرح تصاویر، که میتواند به افرادی که دارای معلولیت هستند کمک کند.
فیسبوک می نویسد: “برای بهبود سیستم های بینایی ماشین و آموزش آن ها به منظور تشخیص صحیح و طبقه بندی دامنه ی وسیعی از اطلاعات، به بانک های اطلاعاتی با میلیاردها تصویر از میلیون ها موضوعی که در زندگی روزمره وجود دارد، نیاز داریم. پژوهشگران و مهندسان ما با استفاده از یک مجموعه ی بسیار بزرگ از تصاویر که شامل 3.5 میلیارد تصویر و 17000 هشتگ می باشد، یک شبکه ی تشخیص تصویر را آموزش داده اند که این کار را انجام می دهد.”
به لطف توافق 1 میلیارد دلاری که در سال 2012 با اینستاگرام به دست آمد، هم اکنون فیسبوک دارای یک کوه در حال رشد از تصاویر عمومی است که توسط کاربران اینستاگرام برچسب گذاری شده است.
با آموزش این سیستم هوش مصنوعی تشخیص تصاویر که توسط یک میلیارد از عکس های اینستاگرام و 1500 هشتگ با استفاده از 366 عدد GPU در چند هفته انجام شده است، فیسبوک توانست به رکورد دقت 85.4 درصد بر روی شبکهی ImageNet که یک شبکهی معیار است، دست پیدا کند. روش های پیشرفتهی قبلی توانسته بودند در بهترین حالت به دقت 83.1 درصد برسند.
فیسبوک همچنان به دنبال این است که چگونه میتواند با استفاده از تمامی 3.5 میلیارد تصویر و 17000 هشتگ کارآیی سیستم را افزایش دهد. ممکن است به زودی از این هوش مصنوعی تشخیص تصاویر استفاده کنیم تا عملکردهایی مانند برچسب زدن تصاویر را با دقت بالا و به صورت اتوماتیک انجام دهیم.
فیسبوک می نویسد: “یک نتیجه ی مهم که از این مطالعه به دست میآید این است که هنوز امکان دستیابی به دستاوردهای گسترده تر در حوزه ی تشخیص تصویر وجود دارد و تایید شده است که آموزش مدل های بینایی ماشین بر روی هشتگ ها میتواند به خوبی کار کند. ما می توانیم با استفاده از هشتگ ها و با انجام اصلاحات بسیار کمی در روش آموزش، مدل های مختلف خود را آموزش دهیم و نشان داده شده است که افزایش تصاویر میتواند مفید باشد زیرا شبکه هایی که بر روی میلیاردها تصویر آموزش داده شده اند نشان داده اند که در مقابل نویزهایی که در برچسب ها وجود دارد مقاومت بیشتری از خود نشان می دهند.”