isfahan-sp
عضو جدید

[h=1]راهکار گوگل برای شناسایی پلاک صد میلیون خانه[/h]گوگل با استفاده از شبکهی عصبی ای که ساخته است، میتواند در عرض کمتر از یک ساعت همهی شماره پلاکها، شماره خیابان و… که در مجموعه تصاویر کشور فرانسه وجود دارد را بررسی کرده و با دقت بالایی تشخیص دهد. دقت این سیستم به خوبی اپراتورهای انسانی است و اکنون مهندسان گوگل از روش توسعهی این شبکه پرده برداشته اند.
سرویس Street View در کنار سرویس نقشهی گوگل نقش مهمی در آدرس یابی و مرور خیابانها و دیدن حزئیات محل با استفاده از تصاویر دارد. دوربینهای سرویس Street View صدها میلیون تصویر وسیع را ضبط کرده اند که شامل دهها میلیون پلاک خانه و شمارهی خیابان میشود، شمارهی هر خانه و خیابان برای مکان یابی و ذخیره سازی آن در پایگاه داده استفاده میشود. شناسایی این اعداد و نشانهگذاری آنها بسیار زمانگیر است و هیچکس توانایی جستجوی دستی و شمارهگذاری این حجم از تصاویر را ندارد.
این روش به ویژه در مکانهایی که خیابانها شمارهگذاری نشده اند یا کشورهایی مانند ژاپن و کرهجنوبی که پلاک و شمارهگذاری به جای ترتیب صعودی به ترتیب زمان ساختشان است، بسیار مفید است. چرا که پیدا کردن یک پلاک خاص حتی برای افراد محلی نیز بسیار مشکل است.
مانند همیشه گوگل برای حل این مساله ترفندی چیده و کارها را به صورت اتوماتیک به انجام رسانده است، روش مهندسین گوگل برای انجام این کار بر پایهی یک شبکهی عصبی است که از ۱۱ سطح تشکیل شده و در هر مرحله اعداد درون تصاویر را علامتگذاری میکند. برای سادهتر شدن کارها اعداد علامتگذاری شده از عکس جدا شده و حداقل یک سوم تصویر را در برمیگیرند و فیلترهایی مانند «حداکثر پنج رقم» بر آن اعمال میشود.
اعداد به دست آمده در فونت، طرح، جهت، ترکیب و… کاملا متفاوت نوشته شده اند و شناسایی و تبدیل این تصاویر به اعداد ریاضی کاری بسیار چالش برانگیز است، فاکتورهای دیگری مانند ترکیب عدد و حروف در بعضی پلاکها، نور و سایههای اجسام، رزولوشن و محو بودن تصویر نیز به سختی کار میافزاید.
برای تنظیم و اکتشاف سیستم ۲۰۰ هزار تصویر که برای عموم قابل دسترس بودند(SVHN) برای بررسی و پیدا کردن اعداد به عنوان دادهی نمونه استفاده شدند، هدف پیدا کردن تمام رقمهای عدد در یک گام به جای پیدا کردن هر رقم به صورت جداگانه و با حداقل دقت یک اپراتور انسانی بود، اپراتور انسانی به طور عموم توانایی تشخیص صحیح ۹۸ درصد اعداد را دارند. شش روز طول کشید تا سیستم با یادگیری به رکورد ۹۷.۸۴ برسد.
حتما برای شما هم پیش آمده که پس از مدتی گشت و گذار در اینترنت، برای اثبات روبوت نبودنتان مجبور به نوشتن حروف و اعداد درهم درون تصاویر امنیتی معروف به کپتچا شده اید، یکی از سرویسهای گوگل reCAPTCHA است که علاوه بر دور کردن روبوتها و اسپمرها کارهای دیگری مانند تشخیص کلمات در کتابهای اسکن شده و پلاک خانهها در عکسهای سرویس Streetview را انجام میدهد. اکنون گوگل با سیستمی که ایجاد کرده، نیاز مبرمی به reCAPTCHA برای شناسایی اعداد ندارد.
گوگل اعلام کرده است با سیستمی که ایجاد کرده تا کنون توانسته ۱۰۰ میلیون عدد را از سرویس Street View بخواند. این روش و مدل کامپیوتری توانسته است بار کار زیادی را از دوش اپراتورهای انسانی بردارد اما هنوز هم تصاویر زیادی وجود دارد که نیازمند تشخیص انسانی است. با پیشرفت شبکهی عصبی ایجاد شده محققان گوگل امیدوارند از آن برای خواندن شماره تلفنها و به طور کلی علامتهای خیابانی استفاده کنند.