Reyhane
عضو جدید
داده كاوي بوسيله حسابگري نرم

قرن حاضر، قرن فنآوري اطلاعات و داده كاوي[1] است. انقلاب ديجيتالي، ثبت و ذخيرهي اطلاعات را بصورت عددي بسيار آسان نموده است. با توسعهي سختافزاري و نرمافزاري و به خدمتگيري آن در امور زندگي، حجم عظيمي(از نظر تعداد و بعد) از اطلاعات غيرمتجانس(مخلوطي از اطلاعات موضوعي، نمادين، عددي، متني، تصويري) ثبت و ذخيره ميشود و ديگر با اين حجم از اطلاعات غيرمتجانس، استفاده از روشهاي آماري كلاسيك جهت تحليل كفايت نميكند. رويكرد شناسايي الگو [2] و يادگيري ماشين [3] اصولي هستند كه براي تحليل اطلاعات نامتجانس و حجيم بكار ميرود و كاوش اطلاعات نام دارد. كاوش اطلاعات، فرآيندي براي شناسايي الگوهاي قابل قبول، جديد، مفيد و قابل فهم از اطلاعات است. بهمنظور كارآيي، استحكام و انعطافپذيري مورد نياز در كاوش اطلاعات حجيم و نامتجانس، استفاده از ابزار محاسبات نرم [4] مورد نياز است. هدف محاسبات نرم، بهرهبرداري از مقداري قابل قبول از عدمقطعيت، ابهام، استدلال تقريبي و حقيقت نسبي جهت دستيابي به قابليت مهاركردن [5] ، استحكام [6]، هزينهي كم حل مساله و تشابه نزديك با الگوي تصميمگيري بشري ميباشد. ادعاي اصلي محاسبات نرم، پذيرش حدي قابل قبول از نادقيقي با به خدمت گرفتن روشهاي محاسباتي است كه به حل قابل قبول و ارزانتر مساله منجر ميشود. محاسبات نرم، پايهاي براي هو ش مصنوعي است و ساختار اصلي آن را منطق فازي [7]، محاسبات نروني [8]، الگوريتم ژنتيك [9] و مجموعههاي ناهموار [10] تشكيل ميدهد كه اجزاي اين ساختار مكمل همديگرند و نه رقيب يكديگر. منطق فازي الگوريتمهايي براي مدلسازي ابهام و عدمقطعيت فراچنگ ميآورد، محاسبات نروني وسيلهاي براي يادگيري و برازش منحني در اختيار قرار ميدهد، الگوريتم ژنتيك الگوريتمهايي براي جستجو و بهينهسازي ارائه ميدهد و مجموعههاي ناهموار چارچوبي براي منظور نمودن عدمقطعيت فراهم ميآورد.
2-فرآيند كشف رابطه حاكم بر اطلاعات
جستجوي الگوي حاكم بر اطلاعات با فشرده سازي اطلاعات توسط كشف رابطه شباهت يا رابطه زيرمجموعگي حاكم بر اطلاعات آغاز مي شود. رابطه شباهت رابطه اي متقارن و رابطه زيرمجموعگي، پادمتقارن مي باشد. يافتن رابطه شباهت يا زيرمجموعگي حاكم بر اطلاعات، متناظر خوشه بندي اطلاعات مي باشد. در ادامه رابطه ترتيبي و نظم حاكم بر اين خوشه ها جستجو مي شود.
از ميان روابط موجود بين زوج هاي مرتب، رابطه اي كه داراي خصوصيات بازتابي، تقارني و تراگذري (انتقالي) ميباشد ، در حالت كلي رابطه شباهت اطلاق مي شود. اين رابطه در حوزه نظريه مجموعه هاي كلاسيك، رابطه ي هم ارزي خوانده مي شود. همانطور كه مي دانيم، هر رابطهي همارزي بيانگر يك افراز ميباشد و هر افراز يك رابطهي همارزي تعريف ميكند. مثلا رابطهي همكلاسي بودن در مجموعهي مرجع شاگردان مدرسه، يك رابطهي همارزي است و اين رابطه، مدرسه را به چندين خوشه تقسيم ميكند. بنابراين از نقطه نظر رياضي، با يافتن يك رابطهي همارزي، خوشه يابي انجام شده و فشرده سازي اطلاعات انجام گرديده است. دو نمونهي همارز در يك خوشه قرار ميگيرند و دو نمونهي غيرهمارز در دو خوشهي جدا قرار ميگيرند.
تعابير متفاوتي از رابطه شباهت در حوزهي نظريهي مجموعههاي فازي ارائه شده است كه از آن ميان ميتوان به رابطهي شباهت [11] (پيشنهاد زاده)، رابطهي همانندي [12] (پيشنهاد rusppini ) و رابطهي تميزناپذيري [13] (پيشنهاد mantaras و valverde ) اشاره نمود. با تعريف رابطهي شباهت ميتوان به طور مشابه تعريفي براي فاصله (عدم شباهت، متريك دروغين) ارائه نمود كه شباهت با قانون دمورگان به فاصله مربوط مي شود. بنابراين از نقطه نظر رياضي، يافتن يك رابطهي همارزي (در حوزهي نظريهي مجموعههاي كلاسيك) يا يك رابطهي شباهت / رابطهي همانندي / رابطهي تمييزناپذيري (در حوزهي نظريهي مجموعههاي فازي) در بين اطلاعات، معادل شناسايي الگوهاي مشابه موجود در اطلاعات مي باشد.
از سوي ديگر، رابطه زيرمجموعگي به رابطه اي اطلاق مي شود كه از نظر رياضي داراي خواص انعكاسي، پاد تقارني و تراگذري(انتقالي) مي باشد. توسعه مفهوم رابطه زيرمجموعگي به نظريه مجموعه هاي فازي با توسعه ي مفاهيم زيرمجموعگي و عدم زيرمجموعگي قابل انجام است كه پيشنهادهاي مختلفي براي آن وجود دارد. كشف رابطه زيرمجموعگي حاكم بر اطلاعات نيز متناظر خوشه بندي و فشرده سازي اطلاعات مي باشد. با كشف اين رابطه عناصر پايه اي اطلاعات مشخص مي گردد و عمل جداسازي منبع [14] انجام مي پذيرد.
پس خوشه بندي اطلاعات، نوبت به كشف رابطه ترتيبي و نظم حاكم بر اين خوشه ها مي رسد. رابطه ي اگر...آنگاه را مي توان يكي از اين نوع روابط دانست كه از آن در حوزه ي نظريه مجموعه هاي فازي دو تعبير متفاوت شده است. برخي آنرا از نوع تداعي تلقي مي كنند و در نتيجه آنرا رابطه اي متقارن تصور مي كنند و برخي ديگر آنرا رابطه اي ايجابي مي دانند و در نتيجه آنرا مطابق منطق ارسطويي، رابطه اي پادتقارني مي انگارند.
3-جستجوي قانون توسط استقراء
يادگيري، توانايي استنباط و تطبيق جزو عوامل بقاي بشر است. بشر با تامل در مشاهدات به كشف قوانين طبيعي نايل ميآيد و مدلهاي ساده شدهاي از روابط پيچيدهي طبيعي ميسازد و از آن در پيشبيني رفتار طبيعت مدد ميجويد. هر چه سادهسازي [15] بيشتر باشد دقت اطلاعات كاهش مييابد. در بازنمايي رياضي، سيستم مطابق يك قانون طبيعي ساده شدهي مشخص مدلسازي ميگردد (قانون نيوتن، قانون ماكسول). اين مهم باعث ميشود كه مدل تنها در يك حالت خاص، مقياس معلوم و حوزهي كاربرد مشخص اعتبار داشته باشد و عدول از آنها، مدل را غيرقابل استفاده ميكند. حال آنكه ميتوان به كمك تئوري يادگيري فرضيات كمتري در ساخت مدل بكار برد و حتي قوانين ساده شده را در يك حوزهي وسيعتري از مشاهدات مميزي نمود. مدلهاي رياضي از نظر تئوري غني و از نظر تطبيق با مشاهدات فقيرند حال آنكه ميتوان به كمك تئوري يادگيري مدلهايي ارائه داد كه از نظر تطبيق با مشاهدات غني و از نظر تئوري ففيرترند. در سالهاي اخير رشد انفجارآميزي در روشهاي يادگيري از اطلاعات مشاهده ميشود. در اين راستا يك سوال كلي مطرح ميشود كه چگونه ميتوان يك اصل يا قانون كلي را از روي مشاهدات نتيجهگيري كرد؟ اين فرآيند، استقرا [16] خوانده ميشود. رويكردهاي متفاوتي وجود دارد كه چارچوبي جهت استقرا از روي مشاهدات محدود فراهم ميآورد. از اين ميان ميتوان به [17] RI و [18] SRM و [19] BI و [20] MDL و [21] ESR اشاره كرد [1] كه هر يك چارچوبي جهت استقراء از روي مشاهدات محدود فراهم ميآورد. در ذيل هر يك از اين چارچوبها روشهاي يادگيري متفاوتي ارايه شده است كه بر اساس هر يك از اين اصلهاي استقرايي، يك مسالهي بهينهسازي (با تابع هدف و محدوديتهاي مشخص) تعيين ميگردد و حل مساله به حل اين بهينهسازي كه در حالت كلي غيرخطي ميباشد، منجر ميگردد. با شناسايي روابط ناشناخته بين عناصر و اجزا، ميتوان از آن در پيشبيني رفتار نيز استفاده نمود. استفاده از قوانين كلي در پيشبيني را اصطلاحا قياس [22] گويند. راه ميانبر ديگري براي پيشبيني رفتار بدون ميانجيگري استقرا وجود دارد كه به آن استدلال تشبيهي [23] گويند. در اين روش، مستقيما از روي مشاهدات رفتار پيشبيني ميشود.
در فرآيند يادگيري يا استقرا بايد ويژگيهاي مهم و قابل اعتناي اطلاعات را استخراج كرد و اطلاعات اضافي و زايد را حذف نمود. با توجه به نوع اطلاعات، ويژگيهاي متفاوتي مورد توجه قرار ميگيرد كه از آن ميان ميتوان به فركانس [24]، لنگرهاي تغييرناپذير [25] (مثل ميانگين، واريانس وغيره)، آنتروپي [26] ، بعد فركتال [27]، تحليل cepstrum ، تبديل هيلبرت و غيره اشاره كرد [2]. ويژگي فركانسي براي دادههاي پايا [28] با تبديل فوريه و براي دادههاي غيرپايا با تبديل گابور [29] يا تبديل فوريهي كوتاه زماني [30] و يا تبديلهاي چند مقياسي يا تبديل موجك [31] استفاده كرد. همچنين ميتوان ضرايب مدل AR ، طيف توان و غيره را به عنوان ويژگي اطلاعات مورد استفاده قرار داد [3]. فركانس آني [32] و يا ساخت سيگنال تحليلي [33] براي ساخت تابع انرژي نيز نوع ديگري از ويژگي اطلاعاتي مي باشند كه به كمك تبديل هيلبرت قابل محاسبه است.
4-معيار جستجوي رابطه
يكي از راههاي ادراك مفاهيم و رابطهي بين آنها براي حل مسائل، راه عقلاني ميباشد. ادراك عقلاني مصطلح، مجموعهاي از عقل(با تعبير تجريد مفاهيم، كشف رابطه و موتور جستجو و استن باط ) و بيان آن با زبان(قالبهاي تصور(اسم، خوشه(رابطهي همارزي)) و تصديق(فعل، مدل گرافي يا اگر .. آنگاه (رابطهي ترتيبي)) ميباشد. ادراك عقلاني انسان با يافتن رابطهي همارزي، زيرمجموعگي و ترتيبي حاكم بر مشاهدات سنسوري، و در قالب زبان انجام ميپذيرد. نكتهي پايهاي در يافتن اين روابط، معيار جستجوي رابطه ميباشد كه از فرهنگي به فرهنگ ديگر متفاوت است و شايد محققين از آن تعبير به فرازبان ميكنند. اينكه خوشهيابي(يافتن رابطهي همارزي يا زيرمجموعگي) با چه معياري انجام پذيرد و مدل گرافي يا اگر .. آنگاهي (رابطهي ترتيبي) با عنايت به چه معياري كاوش گردد. هر حوزهي تخصصي براي خود معيار مشخصي دارد كه منجر به تفسير خاص خود از طبيعت و مشاهدات سنسوري ميگردد. به نظر ميرسد بايد در حوزهي تجربه به كاويدن معيارهاي علمي قوانين فيزيكي دست يازيد و سعي نمود با عنايت به اين معيارها و با توجه به عصر اطلاعات و انقلاب ديجيتال مسائل را بصورت اطلاعات محور [34] حل كرد و تجارب و مشاهدات را بازخواني نمود.
5-قاعده هاي يادگيري
قواعد يادگيري در حوزههاي متفاوتي فرمولبندي شده است. گونههاي متفاوت اين روش ها را در تئوري يادگيري آماري، تئوري اطلاعات، شبكههاي عصبي مصنوعي، سيستم هاي فازي و الگوريتم هاي ملهم از طبيعت ميتوان مشاهده كرد. روح حاكم بر اين تئوريها مشابه است، لكن بعضا رويكرد متفاوتي دارند. به عنوان نمونه ميتوان رويكرد شبكهي عصبي را كه تلاشي براي شبيهسازي رفتار انسان در يادگيري از روي مشاهدات ميباشد، رويكردي شييگرا قلمداد نمود و رويكرد آماري را رويكردي ساختارگرا دانست.
از قواعد يادگيري متنوعي كه در حوزه هاي مختلف ارائه شده است، مي توان به قواعد ذيل اشاره كرد.
· يادگيري مبتني بر تصحيح خطا (قاعده دلتا، قاعده ويدرو-هاف [35] )
· يادگيري مبتني بر حافظه
· يادگيري هب [36]
· يادگيري رقابتي
· يادگيري بولتزمن [37]
· يادگيري تكاملي
· يادگيري ژنتيك
· يادگيري ملهم از آب دادن فولاد
· يادگيري ملهم از كولوني مورچه
· يادگيري ملهم از سيستم ايمني بدن انسان
در يك تقسيمبندي ديگر ميتوان يادگيري را به يادگيري بدون سرپرست [38] و يا يادگيري با سرپرست [39] (با ناظر و يا با نقاد) تقسيمبندي كرد.
يادگيري بدون سرپرست براي حل مسايل كاهش بعد اطلاعات [40] ، خوشهيابي [41]، فشردهسازي اطلاعات [42]، استخراج ويژگي [43]، بازشناخت الگو [44]، جداسازي كوركورانه منابع [45] و غيره مورد استفاده قرار ميگيرد. برخي اوقات اين روشها به عنوان فاز پيشپردازش اطلاعات براي روشهاي باسرپرست مورد استفاده قرار ميگيرد. از الگوريتمهاي مورد استفاده در حوزهي تئوري آمار ميتوان به [46] LVQ و [47] FA و [48] PCA و [49] ICA و [50] SVP و غيره اشاره كرد. از الگوريتمهاي مورد استفاده در حوزهي تئوري شبكهي عصبي ميتوان به [51] SOM و [52] ART و [53] KCM و غيره اشاره كرد. هدف روشهاي يادگيري بيسرپرست را ميتوان خوشه بندي اطلاعات تلقي نمود حال آنكه عموما در روشهاي باسرپرست كشف رابطه هدف اصلي ميباشد.
يادگيري باسرپرست با توجه به اينكه پاسخ مطلوب شبكه وجود دارد و يا اينكه تنها ملاكي براي ارزيابي پاسخ وجود دارد به يادگيري با ناظر و يادگيري با نقاد [54] تقسيم بندي مي شود. در يادگيري با ناظر، يادگيري تصحيحي است و در يادگيري با نقاد، يادگيري تقويتي مي باشد. يادگيري با سرپرست، براي حل مسايل برازش [55]، طبقهبندي [56] و غيره مورد استفاده قرار ميگيرد.
6-چگونگي تركيب اطلاعات[57]
در فرآيند داده كاوي و يا هر فرآيند تصميم گيري، چگونگي تركيب اطلاعات يكي از مسائل كليدي مي باشد. تركيب اطلاعات توسط سه عملگر "و"، "يا" و "تجميع (همجوشي)" انجام مي گيرد. كه با عنايت به نظريه مجموعه هاي فازي بينهايت عملگر "و"، "يا" و "تجميع" قابل تعريف است كه هر يك در يك بازه مشخص قرار مي گيرد. حد بالاي عملگرهاي از جنس "و"، عملگر مينيمم و حد پايين آن ضرب قوي [58] مي باشد. حد بالاي عملگر "يا" جمع قوي [59] و حد پايين آن عملگر ماكزيمم مي باشد. هر عملگري بين عملگر مينيمم و عملگر ماكزيمم، عملگر تجميع [60] (همجوشي، ميانگين گيري) مي باشد. در فرآيند تصميم گيري و تحليل اطلاعات به كرات از اين عملگرها جهت تركيب اطلاعات مشاهدات استفاده مي گردد.
مرجع
[1] Learning from data, Cherkassky,V., Mulier, F., John Wiley and sons,1998.
[2] Evangelia Micheli-Tzanakou, (1999), “Supervised and Unsupervised Pattern Recognition, feature extraction and computational intelligence”, Industrial electronics series.
[3] Ypma, Alexander, (2001), “Learning methods for machine vibration analysis and health monitoring”, Ph.D thesis, Technische Universiteit Delft, Hungary.
[4] Data Mining, Practical Machine Learning Tools and Techniques, I.H. Witten, E. Frank, 2nd ed., elsevier, 2005.
[5] Weka : Waikato Environment for Knowledge Analysis (machine learning software), University of Waikato, New Zealand.
[1] Data Mining
[2] pattern recognition
[3] machine learning
[4] soft computing
[5] tractability
[6] robustness
[7] fuzzy logic
[8] neuro computing
[9] genetic algorithm
[10] rough sets
[11] similarity measure
[12] likeness relation
[13] indistinguishability relation
[14] Source seperation
[15] generalization
[16] induction
[17] Regularization Induction
[18] Structural Risk Minimization
[19] Baysian Inference
[20] Minimum Description Length
[21] Early Stopping Rules
[22] deduction
[23] Analogy or transduction
[24] frequency
[25] invariant moments
[26] Entropy
[27] fractal dimension
[28] stationary
[29] Gabor Transform
[30] Short Time Fourier Transform
[31] wavelet transform
[32] instantaneous frequency
[33] analytical
[34] Data Driven
[35] Widrow-Hoff rule
[36] Hebian learning
[37] Boltzman learning
[38] unsupervised
[39] supervised
[40] dimensionality reduction
[41] clustering
[42] data compression
[43] feature extraction
[44] pattern recognition
[45] blind source separation
[46] Learning Vector Quantization
[47] Factor Analysis
[48] Principal Component Analysis
[49] I ndependent Component Analysis
[50] Support Vector Paradigm
[51] Self Organizing Map
[52] Adaptive Resonance Theory
[53] K-Centers Method
[54] Learning with critics
[55] regression
[56] classification
[57] Data fusion
[58] Drastic product
[59] Drastic sum
[60] aggregation

قرن حاضر، قرن فنآوري اطلاعات و داده كاوي[1] است. انقلاب ديجيتالي، ثبت و ذخيرهي اطلاعات را بصورت عددي بسيار آسان نموده است. با توسعهي سختافزاري و نرمافزاري و به خدمتگيري آن در امور زندگي، حجم عظيمي(از نظر تعداد و بعد) از اطلاعات غيرمتجانس(مخلوطي از اطلاعات موضوعي، نمادين، عددي، متني، تصويري) ثبت و ذخيره ميشود و ديگر با اين حجم از اطلاعات غيرمتجانس، استفاده از روشهاي آماري كلاسيك جهت تحليل كفايت نميكند. رويكرد شناسايي الگو [2] و يادگيري ماشين [3] اصولي هستند كه براي تحليل اطلاعات نامتجانس و حجيم بكار ميرود و كاوش اطلاعات نام دارد. كاوش اطلاعات، فرآيندي براي شناسايي الگوهاي قابل قبول، جديد، مفيد و قابل فهم از اطلاعات است. بهمنظور كارآيي، استحكام و انعطافپذيري مورد نياز در كاوش اطلاعات حجيم و نامتجانس، استفاده از ابزار محاسبات نرم [4] مورد نياز است. هدف محاسبات نرم، بهرهبرداري از مقداري قابل قبول از عدمقطعيت، ابهام، استدلال تقريبي و حقيقت نسبي جهت دستيابي به قابليت مهاركردن [5] ، استحكام [6]، هزينهي كم حل مساله و تشابه نزديك با الگوي تصميمگيري بشري ميباشد. ادعاي اصلي محاسبات نرم، پذيرش حدي قابل قبول از نادقيقي با به خدمت گرفتن روشهاي محاسباتي است كه به حل قابل قبول و ارزانتر مساله منجر ميشود. محاسبات نرم، پايهاي براي هو ش مصنوعي است و ساختار اصلي آن را منطق فازي [7]، محاسبات نروني [8]، الگوريتم ژنتيك [9] و مجموعههاي ناهموار [10] تشكيل ميدهد كه اجزاي اين ساختار مكمل همديگرند و نه رقيب يكديگر. منطق فازي الگوريتمهايي براي مدلسازي ابهام و عدمقطعيت فراچنگ ميآورد، محاسبات نروني وسيلهاي براي يادگيري و برازش منحني در اختيار قرار ميدهد، الگوريتم ژنتيك الگوريتمهايي براي جستجو و بهينهسازي ارائه ميدهد و مجموعههاي ناهموار چارچوبي براي منظور نمودن عدمقطعيت فراهم ميآورد.
2-فرآيند كشف رابطه حاكم بر اطلاعات
جستجوي الگوي حاكم بر اطلاعات با فشرده سازي اطلاعات توسط كشف رابطه شباهت يا رابطه زيرمجموعگي حاكم بر اطلاعات آغاز مي شود. رابطه شباهت رابطه اي متقارن و رابطه زيرمجموعگي، پادمتقارن مي باشد. يافتن رابطه شباهت يا زيرمجموعگي حاكم بر اطلاعات، متناظر خوشه بندي اطلاعات مي باشد. در ادامه رابطه ترتيبي و نظم حاكم بر اين خوشه ها جستجو مي شود.
از ميان روابط موجود بين زوج هاي مرتب، رابطه اي كه داراي خصوصيات بازتابي، تقارني و تراگذري (انتقالي) ميباشد ، در حالت كلي رابطه شباهت اطلاق مي شود. اين رابطه در حوزه نظريه مجموعه هاي كلاسيك، رابطه ي هم ارزي خوانده مي شود. همانطور كه مي دانيم، هر رابطهي همارزي بيانگر يك افراز ميباشد و هر افراز يك رابطهي همارزي تعريف ميكند. مثلا رابطهي همكلاسي بودن در مجموعهي مرجع شاگردان مدرسه، يك رابطهي همارزي است و اين رابطه، مدرسه را به چندين خوشه تقسيم ميكند. بنابراين از نقطه نظر رياضي، با يافتن يك رابطهي همارزي، خوشه يابي انجام شده و فشرده سازي اطلاعات انجام گرديده است. دو نمونهي همارز در يك خوشه قرار ميگيرند و دو نمونهي غيرهمارز در دو خوشهي جدا قرار ميگيرند.
تعابير متفاوتي از رابطه شباهت در حوزهي نظريهي مجموعههاي فازي ارائه شده است كه از آن ميان ميتوان به رابطهي شباهت [11] (پيشنهاد زاده)، رابطهي همانندي [12] (پيشنهاد rusppini ) و رابطهي تميزناپذيري [13] (پيشنهاد mantaras و valverde ) اشاره نمود. با تعريف رابطهي شباهت ميتوان به طور مشابه تعريفي براي فاصله (عدم شباهت، متريك دروغين) ارائه نمود كه شباهت با قانون دمورگان به فاصله مربوط مي شود. بنابراين از نقطه نظر رياضي، يافتن يك رابطهي همارزي (در حوزهي نظريهي مجموعههاي كلاسيك) يا يك رابطهي شباهت / رابطهي همانندي / رابطهي تمييزناپذيري (در حوزهي نظريهي مجموعههاي فازي) در بين اطلاعات، معادل شناسايي الگوهاي مشابه موجود در اطلاعات مي باشد.
از سوي ديگر، رابطه زيرمجموعگي به رابطه اي اطلاق مي شود كه از نظر رياضي داراي خواص انعكاسي، پاد تقارني و تراگذري(انتقالي) مي باشد. توسعه مفهوم رابطه زيرمجموعگي به نظريه مجموعه هاي فازي با توسعه ي مفاهيم زيرمجموعگي و عدم زيرمجموعگي قابل انجام است كه پيشنهادهاي مختلفي براي آن وجود دارد. كشف رابطه زيرمجموعگي حاكم بر اطلاعات نيز متناظر خوشه بندي و فشرده سازي اطلاعات مي باشد. با كشف اين رابطه عناصر پايه اي اطلاعات مشخص مي گردد و عمل جداسازي منبع [14] انجام مي پذيرد.
پس خوشه بندي اطلاعات، نوبت به كشف رابطه ترتيبي و نظم حاكم بر اين خوشه ها مي رسد. رابطه ي اگر...آنگاه را مي توان يكي از اين نوع روابط دانست كه از آن در حوزه ي نظريه مجموعه هاي فازي دو تعبير متفاوت شده است. برخي آنرا از نوع تداعي تلقي مي كنند و در نتيجه آنرا رابطه اي متقارن تصور مي كنند و برخي ديگر آنرا رابطه اي ايجابي مي دانند و در نتيجه آنرا مطابق منطق ارسطويي، رابطه اي پادتقارني مي انگارند.
3-جستجوي قانون توسط استقراء
يادگيري، توانايي استنباط و تطبيق جزو عوامل بقاي بشر است. بشر با تامل در مشاهدات به كشف قوانين طبيعي نايل ميآيد و مدلهاي ساده شدهاي از روابط پيچيدهي طبيعي ميسازد و از آن در پيشبيني رفتار طبيعت مدد ميجويد. هر چه سادهسازي [15] بيشتر باشد دقت اطلاعات كاهش مييابد. در بازنمايي رياضي، سيستم مطابق يك قانون طبيعي ساده شدهي مشخص مدلسازي ميگردد (قانون نيوتن، قانون ماكسول). اين مهم باعث ميشود كه مدل تنها در يك حالت خاص، مقياس معلوم و حوزهي كاربرد مشخص اعتبار داشته باشد و عدول از آنها، مدل را غيرقابل استفاده ميكند. حال آنكه ميتوان به كمك تئوري يادگيري فرضيات كمتري در ساخت مدل بكار برد و حتي قوانين ساده شده را در يك حوزهي وسيعتري از مشاهدات مميزي نمود. مدلهاي رياضي از نظر تئوري غني و از نظر تطبيق با مشاهدات فقيرند حال آنكه ميتوان به كمك تئوري يادگيري مدلهايي ارائه داد كه از نظر تطبيق با مشاهدات غني و از نظر تئوري ففيرترند. در سالهاي اخير رشد انفجارآميزي در روشهاي يادگيري از اطلاعات مشاهده ميشود. در اين راستا يك سوال كلي مطرح ميشود كه چگونه ميتوان يك اصل يا قانون كلي را از روي مشاهدات نتيجهگيري كرد؟ اين فرآيند، استقرا [16] خوانده ميشود. رويكردهاي متفاوتي وجود دارد كه چارچوبي جهت استقرا از روي مشاهدات محدود فراهم ميآورد. از اين ميان ميتوان به [17] RI و [18] SRM و [19] BI و [20] MDL و [21] ESR اشاره كرد [1] كه هر يك چارچوبي جهت استقراء از روي مشاهدات محدود فراهم ميآورد. در ذيل هر يك از اين چارچوبها روشهاي يادگيري متفاوتي ارايه شده است كه بر اساس هر يك از اين اصلهاي استقرايي، يك مسالهي بهينهسازي (با تابع هدف و محدوديتهاي مشخص) تعيين ميگردد و حل مساله به حل اين بهينهسازي كه در حالت كلي غيرخطي ميباشد، منجر ميگردد. با شناسايي روابط ناشناخته بين عناصر و اجزا، ميتوان از آن در پيشبيني رفتار نيز استفاده نمود. استفاده از قوانين كلي در پيشبيني را اصطلاحا قياس [22] گويند. راه ميانبر ديگري براي پيشبيني رفتار بدون ميانجيگري استقرا وجود دارد كه به آن استدلال تشبيهي [23] گويند. در اين روش، مستقيما از روي مشاهدات رفتار پيشبيني ميشود.
در فرآيند يادگيري يا استقرا بايد ويژگيهاي مهم و قابل اعتناي اطلاعات را استخراج كرد و اطلاعات اضافي و زايد را حذف نمود. با توجه به نوع اطلاعات، ويژگيهاي متفاوتي مورد توجه قرار ميگيرد كه از آن ميان ميتوان به فركانس [24]، لنگرهاي تغييرناپذير [25] (مثل ميانگين، واريانس وغيره)، آنتروپي [26] ، بعد فركتال [27]، تحليل cepstrum ، تبديل هيلبرت و غيره اشاره كرد [2]. ويژگي فركانسي براي دادههاي پايا [28] با تبديل فوريه و براي دادههاي غيرپايا با تبديل گابور [29] يا تبديل فوريهي كوتاه زماني [30] و يا تبديلهاي چند مقياسي يا تبديل موجك [31] استفاده كرد. همچنين ميتوان ضرايب مدل AR ، طيف توان و غيره را به عنوان ويژگي اطلاعات مورد استفاده قرار داد [3]. فركانس آني [32] و يا ساخت سيگنال تحليلي [33] براي ساخت تابع انرژي نيز نوع ديگري از ويژگي اطلاعاتي مي باشند كه به كمك تبديل هيلبرت قابل محاسبه است.
4-معيار جستجوي رابطه
يكي از راههاي ادراك مفاهيم و رابطهي بين آنها براي حل مسائل، راه عقلاني ميباشد. ادراك عقلاني مصطلح، مجموعهاي از عقل(با تعبير تجريد مفاهيم، كشف رابطه و موتور جستجو و استن باط ) و بيان آن با زبان(قالبهاي تصور(اسم، خوشه(رابطهي همارزي)) و تصديق(فعل، مدل گرافي يا اگر .. آنگاه (رابطهي ترتيبي)) ميباشد. ادراك عقلاني انسان با يافتن رابطهي همارزي، زيرمجموعگي و ترتيبي حاكم بر مشاهدات سنسوري، و در قالب زبان انجام ميپذيرد. نكتهي پايهاي در يافتن اين روابط، معيار جستجوي رابطه ميباشد كه از فرهنگي به فرهنگ ديگر متفاوت است و شايد محققين از آن تعبير به فرازبان ميكنند. اينكه خوشهيابي(يافتن رابطهي همارزي يا زيرمجموعگي) با چه معياري انجام پذيرد و مدل گرافي يا اگر .. آنگاهي (رابطهي ترتيبي) با عنايت به چه معياري كاوش گردد. هر حوزهي تخصصي براي خود معيار مشخصي دارد كه منجر به تفسير خاص خود از طبيعت و مشاهدات سنسوري ميگردد. به نظر ميرسد بايد در حوزهي تجربه به كاويدن معيارهاي علمي قوانين فيزيكي دست يازيد و سعي نمود با عنايت به اين معيارها و با توجه به عصر اطلاعات و انقلاب ديجيتال مسائل را بصورت اطلاعات محور [34] حل كرد و تجارب و مشاهدات را بازخواني نمود.
5-قاعده هاي يادگيري
قواعد يادگيري در حوزههاي متفاوتي فرمولبندي شده است. گونههاي متفاوت اين روش ها را در تئوري يادگيري آماري، تئوري اطلاعات، شبكههاي عصبي مصنوعي، سيستم هاي فازي و الگوريتم هاي ملهم از طبيعت ميتوان مشاهده كرد. روح حاكم بر اين تئوريها مشابه است، لكن بعضا رويكرد متفاوتي دارند. به عنوان نمونه ميتوان رويكرد شبكهي عصبي را كه تلاشي براي شبيهسازي رفتار انسان در يادگيري از روي مشاهدات ميباشد، رويكردي شييگرا قلمداد نمود و رويكرد آماري را رويكردي ساختارگرا دانست.
از قواعد يادگيري متنوعي كه در حوزه هاي مختلف ارائه شده است، مي توان به قواعد ذيل اشاره كرد.
· يادگيري مبتني بر تصحيح خطا (قاعده دلتا، قاعده ويدرو-هاف [35] )
· يادگيري مبتني بر حافظه
· يادگيري هب [36]
· يادگيري رقابتي
· يادگيري بولتزمن [37]
· يادگيري تكاملي
· يادگيري ژنتيك
· يادگيري ملهم از آب دادن فولاد
· يادگيري ملهم از كولوني مورچه
· يادگيري ملهم از سيستم ايمني بدن انسان
در يك تقسيمبندي ديگر ميتوان يادگيري را به يادگيري بدون سرپرست [38] و يا يادگيري با سرپرست [39] (با ناظر و يا با نقاد) تقسيمبندي كرد.
يادگيري بدون سرپرست براي حل مسايل كاهش بعد اطلاعات [40] ، خوشهيابي [41]، فشردهسازي اطلاعات [42]، استخراج ويژگي [43]، بازشناخت الگو [44]، جداسازي كوركورانه منابع [45] و غيره مورد استفاده قرار ميگيرد. برخي اوقات اين روشها به عنوان فاز پيشپردازش اطلاعات براي روشهاي باسرپرست مورد استفاده قرار ميگيرد. از الگوريتمهاي مورد استفاده در حوزهي تئوري آمار ميتوان به [46] LVQ و [47] FA و [48] PCA و [49] ICA و [50] SVP و غيره اشاره كرد. از الگوريتمهاي مورد استفاده در حوزهي تئوري شبكهي عصبي ميتوان به [51] SOM و [52] ART و [53] KCM و غيره اشاره كرد. هدف روشهاي يادگيري بيسرپرست را ميتوان خوشه بندي اطلاعات تلقي نمود حال آنكه عموما در روشهاي باسرپرست كشف رابطه هدف اصلي ميباشد.
يادگيري باسرپرست با توجه به اينكه پاسخ مطلوب شبكه وجود دارد و يا اينكه تنها ملاكي براي ارزيابي پاسخ وجود دارد به يادگيري با ناظر و يادگيري با نقاد [54] تقسيم بندي مي شود. در يادگيري با ناظر، يادگيري تصحيحي است و در يادگيري با نقاد، يادگيري تقويتي مي باشد. يادگيري با سرپرست، براي حل مسايل برازش [55]، طبقهبندي [56] و غيره مورد استفاده قرار ميگيرد.
6-چگونگي تركيب اطلاعات[57]
در فرآيند داده كاوي و يا هر فرآيند تصميم گيري، چگونگي تركيب اطلاعات يكي از مسائل كليدي مي باشد. تركيب اطلاعات توسط سه عملگر "و"، "يا" و "تجميع (همجوشي)" انجام مي گيرد. كه با عنايت به نظريه مجموعه هاي فازي بينهايت عملگر "و"، "يا" و "تجميع" قابل تعريف است كه هر يك در يك بازه مشخص قرار مي گيرد. حد بالاي عملگرهاي از جنس "و"، عملگر مينيمم و حد پايين آن ضرب قوي [58] مي باشد. حد بالاي عملگر "يا" جمع قوي [59] و حد پايين آن عملگر ماكزيمم مي باشد. هر عملگري بين عملگر مينيمم و عملگر ماكزيمم، عملگر تجميع [60] (همجوشي، ميانگين گيري) مي باشد. در فرآيند تصميم گيري و تحليل اطلاعات به كرات از اين عملگرها جهت تركيب اطلاعات مشاهدات استفاده مي گردد.
مرجع
[1] Learning from data, Cherkassky,V., Mulier, F., John Wiley and sons,1998.
[2] Evangelia Micheli-Tzanakou, (1999), “Supervised and Unsupervised Pattern Recognition, feature extraction and computational intelligence”, Industrial electronics series.
[3] Ypma, Alexander, (2001), “Learning methods for machine vibration analysis and health monitoring”, Ph.D thesis, Technische Universiteit Delft, Hungary.
[4] Data Mining, Practical Machine Learning Tools and Techniques, I.H. Witten, E. Frank, 2nd ed., elsevier, 2005.
[5] Weka : Waikato Environment for Knowledge Analysis (machine learning software), University of Waikato, New Zealand.
[1] Data Mining
[2] pattern recognition
[3] machine learning
[4] soft computing
[5] tractability
[6] robustness
[7] fuzzy logic
[8] neuro computing
[9] genetic algorithm
[10] rough sets
[11] similarity measure
[12] likeness relation
[13] indistinguishability relation
[14] Source seperation
[15] generalization
[16] induction
[17] Regularization Induction
[18] Structural Risk Minimization
[19] Baysian Inference
[20] Minimum Description Length
[21] Early Stopping Rules
[22] deduction
[23] Analogy or transduction
[24] frequency
[25] invariant moments
[26] Entropy
[27] fractal dimension
[28] stationary
[29] Gabor Transform
[30] Short Time Fourier Transform
[31] wavelet transform
[32] instantaneous frequency
[33] analytical
[34] Data Driven
[35] Widrow-Hoff rule
[36] Hebian learning
[37] Boltzman learning
[38] unsupervised
[39] supervised
[40] dimensionality reduction
[41] clustering
[42] data compression
[43] feature extraction
[44] pattern recognition
[45] blind source separation
[46] Learning Vector Quantization
[47] Factor Analysis
[48] Principal Component Analysis
[49] I ndependent Component Analysis
[50] Support Vector Paradigm
[51] Self Organizing Map
[52] Adaptive Resonance Theory
[53] K-Centers Method
[54] Learning with critics
[55] regression
[56] classification
[57] Data fusion
[58] Drastic product
[59] Drastic sum
[60] aggregation