راهکار گوگل برای شناسایی پلاک صد میلیون خانه

isfahan-sp

عضو جدید



[h=1]راهکار گوگل برای شناسایی پلاک صد میلیون خانه[/h]گوگل با استفاده از شبکه‌ی عصبی ای که ساخته است، می‌تواند در عرض کمتر از یک ساعت همه‌ی شماره پلاک‌ها، شماره خیابان و… که در مجموعه تصاویر کشور فرانسه وجود دارد را بررسی کرده و با دقت بالایی تشخیص دهد. دقت این سیستم به خوبی اپراتورهای انسانی است و اکنون مهندسان گوگل از روش توسعه‌ی این شبکه پرده برداشته اند.
سرویس Street View در کنار سرویس نقشه‌ی گوگل نقش مهمی در آدرس یابی و مرور خیابان‌ها و دیدن حزئیات محل با استفاده از تصاویر دارد. دوربین‌های سرویس Street View صدها میلیون تصویر وسیع را ضبط کرده اند که شامل ده‌ها میلیون پلاک خانه و شماره‌ی خیابان می‌شود، شماره‌ی هر خانه و خیابان برای مکان یابی و ذخیره سازی آن در پایگاه داده استفاده می‌شود. شناسایی این اعداد و نشانه‌گذاری آنها بسیار زمان‌گیر است و هیچکس توانایی جستجوی دستی و شماره‌گذاری این حجم از تصاویر را ندارد.


این روش به ویژه در مکان‌هایی که خیابان‌ها شماره‌گذاری نشده اند یا کشورهایی مانند ژاپن و کره‌جنوبی که پلاک و شماره‌گذاری به جای ترتیب صعودی به ترتیب زمان ساختشان است، بسیار مفید است. چرا که پیدا کردن یک پلاک خاص حتی برای افراد محلی نیز بسیار مشکل است.


مانند همیشه گوگل برای حل این مساله ترفندی چیده و کارها را به صورت اتوماتیک به انجام رسانده است، روش مهندسین گوگل برای انجام این کار بر پایه‌ی یک شبکه‌ی عصبی است که از ۱۱ سطح تشکیل شده و در هر مرحله اعداد درون تصاویر را علامت‌گذاری می‌کند. برای ساده‌تر شدن کارها اعداد علامت‌گذاری شده از عکس جدا شده و حداقل یک سوم تصویر را در برمی‌گیرند و فیلترهایی مانند «حداکثر پنج رقم» بر آن اعمال می‌شود.


اعداد به دست آمده در فونت، طرح، جهت، ترکیب و… کاملا متفاوت نوشته شده اند و شناسایی و تبدیل این تصاویر به اعداد ریاضی کاری بسیار چالش برانگیز است، فاکتورهای دیگری مانند ترکیب عدد و حروف در بعضی پلاک‌ها، نور و سایه‌های اجسام، رزولوشن و محو بودن تصویر نیز به سختی کار می‌افزاید.
برای تنظیم و اکتشاف سیستم ۲۰۰ هزار تصویر که برای عموم قابل دسترس بودند(SVHN) برای بررسی و پیدا کردن اعداد به عنوان داده‌ی نمونه استفاده شدند، هدف پیدا کردن تمام رقم‌های عدد در یک گام به جای پیدا کردن هر رقم به صورت جداگانه و با حداقل دقت یک اپراتور انسانی بود، اپراتور انسانی به طور عموم توانایی تشخیص صحیح ۹۸ درصد اعداد را دارند. شش روز طول کشید تا سیستم با یادگیری به رکورد ۹۷.۸۴ برسد.


حتما برای شما هم پیش آمده که پس از مدتی گشت و گذار در اینترنت، برای اثبات روبوت نبودنتان مجبور به نوشتن حروف و اعداد درهم درون تصاویر امنیتی معروف به کپتچا شده اید، یکی از سرویس‌های گوگل reCAPTCHA است که علاوه بر دور کردن روبوت‌ها و اسپمرها کارهای دیگری مانند تشخیص کلمات در کتاب‌های اسکن شده و پلاک خانه‌ها در عکس‌های سرویس Streetview را انجام می‌دهد. اکنون گوگل با سیستمی که ایجاد کرده، نیاز مبرمی به reCAPTCHA برای شناسایی اعداد ندارد.


گوگل اعلام کرده است با سیستمی که ایجاد کرده تا کنون توانسته ۱۰۰ میلیون عدد را از سرویس Street View بخواند. این روش و مدل کامپیوتری توانسته است بار کار زیادی را از دوش اپراتورهای انسانی بردارد اما هنوز هم تصاویر زیادی وجود دارد که نیازمند تشخیص انسانی است. با پیشرفت شبکه‌ی عصبی ایجاد شده محققان گوگل امیدوارند از آن برای خواندن شماره تلفن‌ها و به طور کلی علامت‌های خیابانی استفاده کنند.
 
بالا