رابطه ساختار آیات قرآن با ترتیب نزول به کمک خوشه بندی با روش SOM

از شبکه نخبگان و قرآن‌کاوی
پرش به ناوبری پرش به جستجو

چکیده

قرآن به عنوان کتاب آسمانی مسلمانان و به عنوان کتابی برای همه¬ زمان¬ها، همواره مورد علاقه¬ پژوهشگران رشته¬های مختلف بوده ¬است. مردم هر عصر به فراخور درک و دانش خود همواره مفاهیم تازه¬ای را از دل این کتاب الهی استخراج کرده¬اند. اما به هر ترتیب درک شرایط و زمان نزول، اطلاعات ارزشمندی را درباره¬ آیات قرآن کریم به دست می¬دهد که می¬تواند در تفسیر و درک معنای صحیح آیات تاثیر¬گذار باشد. از طرفی با پیشرفت تکنولوژی¬ در زمینه متن¬کاوی، یافتن ارتباط بین اجزای یک متن برای اهداف مختلفی از جمله یافتن ترتیب زمانی بخش¬های مختلف متون استفاده می¬شود. قرآن نیز به عنوان متنی که به تدریج و در طی 23 سال نازل شده و دارای ساختاری نظام¬مند است، می¬تواند به منظور تعیین ترتیب زمانی به کمک روش¬های ماشینی مورد بررسی قرار بگیرد. پژوهش حاضر درصدد یافتن ترتیبی است که بر مبنای اطلاعات موجود در منابع اسلامی درباره¬ زمان نزول برخی از آیات و سوره¬ها شکل گرفته¬ باشد تا از این طریق بتوان در مورد زمان تقریبی نزول آیات و سوره¬های مورد شک محققان، به صورت علمی و با بهره¬گیری از شواهد و قرائن، اظهار نظر کرد. در پژوهش حاضر بر مبنای گزارش¬های موجود در پژوهش¬های پیشین، ویژگی¬هایی برای خوشه¬بندی آیات پیشنهاد شده ¬است. در نهایت هر آیه، توسط یک بردار 26 بعدی معرفی می¬شود. سپس بردارهای ویژگی همه آیات به عنوان ورودی به الگوریتم نقشه¬ خودسازمانده داده می¬شود. ابعاد نقشه¬ خودسازمانده به گونه¬ای تنظیم شده ¬است که خروجی، دنباله¬ای از خوشه¬ها باشد که بر حسب میزان شباهت در کنار یکدیگر قرار گرفته¬اند. پس از آن خروجی حاصل، با یکی از ترتیب نزول¬های مشهور موجود مقایسه می¬شود تا میزان قابلیت آن در تشخیص بازه¬ زمانی آیات مشخص شود. به علت وجود چالش¬ها و محدودیت¬های مختلف در موضوع انتخابی و عدم وجود منبع استانداردی که آیات را از نظر زمانی تقسیم¬بندی کرده¬ باشد و برای ارزیابی نتیجه کار قابل استفاده باشد، آزمون¬های متعددی برای ارزیابی روش پیشنهادی طراحی و اجرا شد. نتایج این آزمون¬ها نشان داد که روش پیشنهادی در خوشه¬بندی سوره¬ها با معیار F معادل 5/72 درصد عمل می¬کند. همچنین در خوشه¬بندی آیات مکی و مدنی، معیار F خوشه مکی 66 درصد و خوشه مدنی 45 درصد است. در خوشه¬بندی¬های انجام گرفته برای چهار خوشه، در بهترین حالت معیار F معادل 64 درصد است. پژوهش حاضر گام نخست در زمینه تشخیص زمان نزول آیات به شمار می¬رود. به علت شباهت ذاتی زیاد بخشی از آیات مکی به آیات مدنی لازم است تا ویژگی¬های جدیدی از آیات استخراج شوند که قابلیت ایجاد تمایز میان این دو دسته از آیات را داشته باشند. به عنوان پیشنهاد ویژگی¬های آوایی آیات مکی و مدنی می¬تواند مبنای کارهای پژوهشی آینده قرار گیرد.

واژگان کلیدی

مکی و مدنی، ترتیب نزول، الگوریتم نقشه¬ خودسازمانده، خوشه¬بندی.


1- مقدمه

و قرآن را بخش بخش قرار دادیم، تا آن را با درنگ و تأمل بر مردم بخوانی و آن را به تدریج فرو فرستادیم. (الاسراء/106) امروزه به دلیل حجم بالای اطلاعات در دسترس از طریق رایانه¬ها و اینترنت، اهمیت داده¬کاوی و استخراج اطلاعات بیش از پیش نمایان شده است. یادگیری ماشین نظم خاصی است که کامپیوترها را قادر می¬سازد تصمیم¬گیری کنند و الگوهایی را از داده¬ها استخراج نمایند. در داده¬های حجیم شناسایی و مرتبط کردن الگوهای جالب توجه برای محققین دشوار است. به جای آن محققین مجموعه¬ای از ویژگی¬ها را تعریف می¬کنند و اجازه می¬دهند الگوریتم¬های یادگیری ماشین ارتباطات و وابستگی¬های موجود در بین این ویژگی¬ها را در داده¬ها بیابند (A.-B. Sharaf and E. Atwell, 2011). خوشه¬بندی یکی از روش¬های شناخته¬شده در یادگیری ماشین است. قرآن نیز به عنوان کتابی که ادبیات و روشی خاص دارد، هر آیه¬ی آن قابل تفسیر به معناهای مختلفی است و در طول مدت 23 سال نازل شده¬است، حاوی اطلاعاتی است که با روش¬های یادگیری ماشین قابل استخراج و تفسیر می¬باشد. از آن¬جا که این کتاب آسمانی کمتر مورد بررسی قرار گرفته، طبیعتا زمینه¬ها و پیکره¬های لازم برای کار بر روی آن دارای نواقصی است. هدف ما در این پژوهش آن است تا با استفاده از ساختار آیات قرآن کریم و خوشه¬بندی آن¬ها به کمک یکی از روش¬های یادگیری ماشین به نام نقشه¬ی خودسازمانده[۱] ، رابطه ساختار آیات قرآن با ترتیب نزول آن¬ها را بررسی نماییم.

2- بیان مسئله

هدف متن¬کاوی استخراج اطلاعات مفید یا دانشی است که مستندات متنی حاوی آن است (A. Tan, 1999). با پیشرفت تکنولوژی¬ در زمینه¬ی متن¬کاوی، یافتن ارتباط بین اجزای یک متن برای اهداف مختلفی از جمله تشخیص نویسنده¬ی متن، کشف تقلب، یافتن ترتیب زمانی بخش¬های مختلف متون و غیره استفاده می¬شود. در این میان قرآن نیز به عنوان متنی که به تدریج نازل شده و دارای ساختاری نظام¬مند است، می¬تواند به کمک روش¬های ماشینی به منظور تعیین ترتیب زمانی مورد بررسی قرار بگیرد. از طرفی درک شرایط و زمان نزول اطلاعات ارزشمندی را درباره آیات قرآن کریم به دست می¬دهد که می¬تواند در تفسیر و درک معنای صحیح آیات و تعیین آیات ناسخ و منسوخ بسیار تاثیر¬گذار باشد. بنابراین هرچه بتوان به شرایط زمانی و مکانی نزول آیه یا سوره نزدیک¬تر شد و اطلاعات بیشتری از آن شرایط به دست آورد، طبیعتا درک معنای آیه آسان¬تر خواهد بود. بنابراین به نظر می¬رسد، به کارگیری روشی برای تشخیص حدود بازه¬ی زمانی نزول آیات، در تفسیر آیات کمک¬کننده خواهد بود. پژوهش حاضر در صدد یافتن ترتیبی است که بر مبنای اطلاعات موجود درباره¬ی زمان نزول برخی آیات و سوره¬ها در منابع اسلامی شکل گرفته¬باشد تا از این طریق بتوان در مورد زمان تقریبی نزول آیات و سوره¬های مورد شک محققان اسلامی، به صورت علمی و با بهره¬گیری از شواهد و قرائن، اظهار نظر کرد. معروف¬ترین دسته¬بندی زمانی سوره¬های قرآن کریم، دسته¬بندی مکی و مدنی است. بدین معنی که مراد از «مکی» نزول آیات قرآنی پیش از هجرت رسول اکرم (ص) به مدینه است (اگرچه نزول آیه¬ای در جایی جز مکه باشد) و منظور از «مدنی»، وحی الهی است بعد از این هجرت (چه بسا که محل نزول این وحی مکه باشد، ولی چون پس از هجرت بوده، مدنی شمرده می¬شود) (رامیار، جلد 1، ص 602). البته درست است که موضوع کشف ترتیب نزول سوره¬ها و واحد¬هاي نزول، موضوعی تاریخی است و با توجه به آن¬که این تاریخ اکنون به طور زنده از دسترس ما خارج است، چاره¬اي نداریم که بر اساس داد¬ه¬هاي تاریخی که براي ما یا نقل شده¬اند و یا به جاي مانده¬اند، دست به تحلیل تاریخی بزنیم، اما نمی¬توان گفت که مضامین آیات و یا ساختار آیات نمی¬ تواند در تحلیل تاریخ-گذاري واحد¬هاي نزول نقشی داشته¬باشد و باید فقط بر روایت و نقل استناد کنیم (شاکر، صص 90-123). پژوهشگر در این رابطه بایستی به بررسی ویژگی¬های آیات مکی و مدنی مورد پذیرش همه بپردازد، سپس در مورد آیات مورد اختلاف اجتهاد نماید و به قیاس آیات مذکور، آیات مورد اختلاف را نیز مکی یا مدنی بداند (خرمشاهی، جلد 2، صص ۲۱۴۵-۲۱۴۶). بنابراین به نظر می¬رسد که با توجه به ویژگی¬های سوره¬های مکی و مدنی که به صورت دستی استخراج شده و توسط پژوهشگران قرآنی در کتاب¬ها بیان شده¬است و نیز ویژگی¬هایی که به صورت ماشینی استخراج شده و در مقالات علمی کامپیوتری به آن¬ها اشاره شده¬است، متن قرآن کریم از لحاظ ترتیب زمانی قابل بررسی باشد. هدف این پژوهش بررسی وجود یا عدم وجود رابطه میان ساختار ظاهری آیات قرآن و ترتیب نزول آیات است.

3- پیشینه پژوهش

پژوهش مشابهی که برای خوشه¬بندی آیات و سور قرآن کریم و به دست آوردن ترتیب زمانی از الگوریتم نقشه¬ی خودسازمانده استفاده کرده باشد، وجود ندارد. بیشتر مطالعات گذشته درباره¬ی ترتیب زمانی قرآن کریم، آیات را به دو دسته¬ی مکی و مدنی تقسیم کرده¬اند و تفاوت بین این دو بازه را با توجه به رخداد کلمات یا عبارات خاص در متن توضیح داده¬اند. از آن¬جا که تعداد زیادی از محققین، به این ترتیب زمانی قرآن، علاقه نشان داده¬اند، بنابراین کارهایی در زمینه¬ی تشخیص این دو دسته از طریق سبک کلمات سازنده¬ی آیات یا سبک خود آیات انجام گرفته¬است.

3-1- دسته¬بند آماری[۲]

در یک پژوهش (M. Nassourou, 2011) از دسته¬بندی مکی و مدنی رایج و الگوریتم¬های یادگیری ماشین نظیر SVM[۳] و کلاس¬بند¬های بیزی ساده[۴] ، استفاده شده¬است. روش کار به این صورت است که 13 سوره که در کارهای محققان اسلامی و مستشرقان، زمان دقیق نزول آن-ها مشخص است، به عنوان داده¬های آموزشی به الگوریتم کلاس¬بند داده می¬شوند. در نهایت سوره¬های مکی به 7 کلاس و سوره-های مدنی به 3 کلاس تقسیم می¬شوند. نتایج این کلاس¬بندی به اقرار نگارنده، به تقسیم¬بندی محققان قرآنی و مستشرقان غربی شباهتی نداشته¬است.

3-2- روش چند¬متغیری[۵]

در پژوهشی دیگر (N. Thabet, 2005) سعی شده¬است تحلیل محاسباتی خوشه¬ها با ایجاد ماتریس بزرگی از تعداد کلمات انجام شود، که سطرهای آن 114 سوره و ستون¬های آن 3672 کلمه از کلمات قرآن است. این لیست کوتاه کلمات پس از حذف دو دسته کلمه به دست آمده است: 1- حذف کلماتی که فقط یک بار در قرآن ظاهر شده¬اند (تکامدها) 2- کلمات توقف نظیر صفات اشاره و ضمایر مشکلی که این پژوهش در تحلیل¬ها با آن روبه¬رو بوده¬است، این است که سوره¬های کوچکتر سطرهای بسیار پراکنده¬ای[۶] از مقادیر ایجاد می¬کند که به علت عدم وجود اغلب آن 3672 کلمه در هر سوره، عمدتا صفر هستند. به عنوان راه حلی برای این مشکل، فقط 24 عدد از بزرگ¬ترین سوره¬ها که شامل بیش از 1000 کلمه از کلمات مطلوب است، مورد بررسی قرار گرفتند. اما حتی این محدودیت نیز مشکل پراکندگی را حل نکرده¬است؛ چرا که هنوز تعداد زیادی از کلمات کم تکرار وجود دارند که در ساختمان موضوعی خوشه نقشی ندارند. برای حل این موضوع باید محدودیت بیش¬تری اعمال می¬شد تا فقط 500 عدد از پرتکرارترین کلمات بمانند. با داشتن این داده¬ها، الگوریتم¬های خوشه¬بندی سلسله¬مراتبی به منظور اندازه¬گیری فاصله بین دو سوره بر مبنای کلمات مشترک، اعمال شد. بنابراین سوره¬هایی که کلمات مشترک بیشتری داشتند، به تشکیل یک خوشه متمایل شدند. شکل (2) چهار خوشه¬ای را که 24 سوره انتخابی در آن¬ها جای گرفتند با علامت¬های A،B ، C و D نشان می¬دهد. خوشه¬ A عمدتا شامل سوره¬های مدنی (به استثنای سوره¬های شماره¬ی 15 و 39، سور مبارکه¬ی نحل و زمر)، و خوشه B عمدتا شامل سوره¬های مکی است. دیگر سوره¬های مدنی در گروه¬های D و C قرار گرفته¬اند. خوشه C شامل سوره¬های مدنی دارای فراوانی بیشتری در شرح داستان¬ها و اشاره به حضرت محمد(ص) به عنوان شاهدی برای پیام وی به جهانیان است، بر عکس سوره¬های موجود در خوشه D بیشتر به پاداش رفتار پرهیزگارانه مومنین اشاره دارد (N. Thabet, 2005).

شکل 2- خوشه¬بندی سوره¬ها (A.-B. Sharaf and E. Atwell, 2011) این پژوهش برنامه کاربردی مفیدی از الگوریتم¬های خوشه¬بندی یادگیری ماشین را ارائه می¬دهد، اما با توجه به مشکل پراکندگی داده¬ها، پژوهشگر مجبور شده است که بخش زیادی از قرآن را از تحلیل¬های خود خارج کند.

3-3- روش چند¬متغیری بهبود¬یافته در پژوهش مویسل (H. Moisl, 2009) هدف حل مشکل سوره¬های کوتاه بود که در پژوهش قبلی وجود داشت و باعث شده بود تا نتایج آن محدود به بخشی از قرآن باشد. نگارنده، به قواعد پیچیده توزیع نمونه¬ی آمار متوسل شده و مشکل را با مقدار حداقل طول سوره حل کرده است. وی متوجه شده است که باید بین طول سوره و تعداد کلماتی که در تحلیل خوشه لحاظ می¬شود، تناسبی وجود داشته¬باشد، چون در غیر این صورت در نظر گرفتن کل قرآن برای این تحلیل¬ها ممکن نیست. او پیشنهاد داده است که تنها سوره¬هایی که 300 کلمه یا بیشتر دارند، در نظر گرفته شوند. علاوه بر این، وی فقط 9 کلمه را به عنوان مبنای تحلیل¬ها در نظر گرفته است: الله، لا، رب، قال، کان، یوم، ناس، یومئذ و شر. نتیجه¬ی خوشه¬بندی وی در شکل (3) ‏نشان داده شده¬است.

شکل 3- خوشه¬بندی 47 سوره (A.-B. Sharaf and E. Atwell, 2011) در هر حال این تحلیل¬ها کاملا بر مبنای محاسبات آماری است که تمام قرآن را شامل نمی¬شود. به علاوه انتخاب این 9 کلمه هیچ مفهوم موضوعی خاصی ندارد.

3-4- خوشه¬بندی با استفاده از بردار ویژگی

شرف و اتول (A.-B. Sharaf and E. Atwell, 2011) روشی پیشنهاد کرده¬اند که با استفاده از 14 ویژگی موجود در سوره-های مکی و مدنی به خوشه¬بندی آن¬ها می¬پردازد. این مشخصه¬ها از مشاهدات محققان به دست آمده¬اند. البته ممکن است مشخصه¬های مهم دیگری نیز وجود داشته¬باشد که لحاظ نشده¬اند. علت در نظر نگرفتن این مشخصه¬ها این است که قابلیت کمتری برای استفاده در الگوریتم¬های یادگیری ماشین دارند. ویژگی¬های انتخاب شده عبارتند از: 1) آیات سجده: سوره¬هایی که شامل چنین آیاتی هستند به غیر از سوره مبارکه رعد و سوره مبارکه حج، مکی تلقی می¬شوند. کلمه مخالفت «کلا»: هر سوره¬ای که شامل این کلمه باشد، مکی است. هر سوره¬ای که شامل عبارت «یا ایها الناس» باشد اما شامل عبارت «ایها الذین آمنوا» نباشد، سوره¬ای مکی است. شروع آیه با «یا ایها الذین آمنوا» از مشخصه¬های سور مدنی است. هر سوره¬ای که با حروف مقطعه «الم» یا «الر» آغاز شود، مکی است به غیر از سوره بقره، آل عمران و رعد. هر سوره¬ای که دربردارنده داستان آدم و ابلیس است، مکی است به جز سوره بقره. هر سوره¬ای که دربردارنده داستان ملت¬های گذشته و پیامبرانی چون نوح، لوط، عاد، ثمود، و شعیب، علی نبینا و آله و علیهم السلام، است، مکی است. سور مکی شامل استفاده فراوان از ابزارهای زبانی سرزنش، تاکید و قسم است. طول آیات سور مکی معمولا کوتاه¬تر از سور مدنی است. سور مکی تاکید بیشتری روی مباحث مربوط به معاد دارد. سور مدنی احکام جهاد را شرح می¬دهد و درباره جنگ¬های بزرگی چون بدر، احد و احزاب می¬گوید. سور مدنی سور مدنی وارد جزییات احکام مرتبط با ازدواج، شیردهی، طلاق و سایر مسائل خانواده می¬شود. از ویژگی¬های سور مدنی تکرار گفتگوها و بحث با اهل کتاب است. از ویژگی¬های ارجاع به اعمال عبادی، به خصوص ارکان اسلام مانند نماز، زکات، روزه و حج است (A.-B. Sharaf and E. Atwell, 2011). پس از تعیین ویژگی¬ها و شمارش آن¬ها از طریق جستجوی کلیدواژه¬های مرتبط در متن قرآن، نتایج به صورت قابل استفاده در نرم¬افزار وکا[۷] آماده شده¬است. پس از آن توسط نرم¬افزار، یک بار با الگوریتم Simple K-means و بار دیگر با الگوریتم بیشینه¬سازی امید ¬ریاضی[۸] ، خوشه¬بندی انجام می¬شود. شکل(4) و شکل (5) نتایج این دو الگوریتم را به ترتیب نشان می¬دهند.

شکل 4- خوشه¬بندی 114 سوره¬ی قرآن در دو خوشه، با استفاده از الگوریتم Simple K-means و ویژگی «کلا» (A.-B. Sharaf and E. Atwell, 2011)

شکل 5- خوشه¬بندی بر اساس الگوریتم بیشینه¬سازی امید¬ ریاضی (A.-B. Sharaf and E. Atwell, 2011)

در نتایج حاصل از الگوریتم بیشینه¬سازی امید ریاضی مشاهده می¬شود که خوشه¬ی یک، شامل سوره¬های بقره و اعراف است که همپوشانی خوبی در محتوا، مخصوصا محتوای داستان حضرت موسی(ع) دارند. همچنین به غیر از خوشه هفت و یک، بقیه خوشه¬ها با تقریب خوبی جداکننده¬ی سوره¬های مکی و مدنی بوده¬اند.

3-5- استایلومتری[۹]

شبیه¬ترین کار پیشین در زمینه¬ی موضوع پژوهش حاضر، پژوهش ترتیب نزول قرآن به کمک استایلومتری (B. Sadeghi, 2011) است. منظور از استایلومتری، تحلیل آماری تغییرات سبک ادبی نویسنده¬های گوناگون یا گونه¬های مختلف متن است. در این پژوهش، صادقی از علامت¬های مربوط به سبک همچون متوسط طول آیه، 28 مورفیم[۱۰] پرتکرار در قرآن، 114 مورفیم مشترک دیگر و 3693 مورفیم غیر متداول برای بررسی صحت ترتیب زمانی خود استفاده کرده¬است. منظور از مورفیم، کوچک¬ترین واحد معنادار لغوی است. او همچنین از روش¬های چند¬متغیری همچون PCA و MDS، برای بررسی صحت ترتیب زمانی قرآن در هفت گروه بهره گرفته¬است. این کار بر مبنای فرض متفاوت بازرگان و نولدکه است که می-گوید سبک قرآن در یک جهت، بدون بازگشت تغییر می¬کند. او با استفاده از اصل «معیار همواری همزمان[۱۱]  » مراحل را اثبات می¬کند؛ به این معنی که با استفاده از علامت¬های سبکی مستقل و توالی¬های خاص از متن، بررسی می¬کند که آیا این علامت¬ها به نحوی هموار تغییر می¬کنند یا خیر. اگر این¬طور باشد، به این معنی است که این ترتیب زمانی درست است. او در تقسیم¬بندی آیات و سوره¬ها از الگوی پیشنهادی بازرگان (بازرگان، جلد 1، صص 126-116) و نولدکه پس از ادغام کردن آن در 22 دسته، استفاده کرده¬است. به منظور تکرار و تصحیح سبک و به دست آوردن نتایج بهتر، صادقی 188 آیه از قرآن را کنار گذاشته¬است.

3-6- ترتیب زمانی قرآن کریم طبق روش¬های پردازش زبان طبیعی

کار دیگری که بر مبنای پژوهش صادقی انجام گرفته¬است، ترتیب زمانی متون قرآن کریم مطابق روش¬های پردازش زبان طبیعی (Alrehaili, 2011) است. در این پژوهش، نگارنده ابتدا متن قرآن را به چند گروه، تقسیم¬بندی می¬کند، سپس از هر گروه، ویژگی¬های مربوط به بازه¬ی زمانی را استخراج می¬نماید. به بیان وی اگر بتوانیم ویژگی¬هایی بیابیم که دارای سبک مشابهی باشند، خصوصا اگر از یکدیگر مستقل باشند، به این معنی است که آن ویژگی¬ها می¬توانند در تشخیص ترتیب زمانی متن قرآن، به ما کمک کنند. با توجه به اینکه محققان پیشین مطرح کرده¬اند که طول آیات به صورت یکنواخت در طول زمان، افزایش یافته¬است، این ویژگی به عنوان اولین ویژگی مربوط به ترتیب زمانی، در این پژوهش در نظر گرفته شده¬است. سپس به دنبال ویژگی¬هایی گشته¬است که سبکی مشابه سبک ویژگی طول آیات دارند.¬ اگر سبک ویژگی انتخابی با سبک طول آیات مشابه نباشد، آن ویژگی کنار گذاشته می¬شود. برای تقسیم¬بندی سوره¬ها و آیات، از دسته بندی مبتنی بر کار بازرگان استفاده شده-است. تعداد تکرار کلمات، تعداد فتحه،ضمه و کسره، تعداد رخدادهای کلمه الله، وجود مفهوم الله در آیات (به این معنی که ضمایری که مرجع آن¬ها خداوند است شمرده شوند)، آیات مرتبط و تعداد مورفیم¬های پرتکرار از ویژگی¬هایی است که در این پژوهش استفاده شده¬است. در نهایت بر مبنای همه¬ی آزمایشات و یافته¬ها، یک رابط کاربری طراحی شده و در دسترس همگان قرار گرفته¬است[۱۲] .

4- روش پیشنهادی

شکل (6) مدل مبنایی پژوهش را نشان می¬دهد. گام اول در این پژوهش، تعریف ویژگی¬های مناسب است. پس از تعریف مجموعه ویژگی¬ها و ارزیابی و انتخاب ویژگی¬های مناسب، نوبت به ایجاد ماتریس ویژگی می¬رسد. در این مرحله، لازم است تا دقیقا نحوه¬ی بازنمایی هر ویژگی در ماتریس ویژگی¬ها، مشخص شود. به عنوان مثال تصمیم¬گیری درباره¬ی نرمال¬سازی مقادیر ویژگی، چگونگی نرمال¬سازی آن¬ها و بازه¬ی مقادیر بازنمای ویژگی در ماتریس، در این مرحله انجام می¬گیرد. مرحله¬ی بعد، تعیین ابعاد نقشه¬ی خروجی الگوریتم نقشه¬ی خودسازمانده است؛ به این معنی که تعداد خوشه¬ها و توپولوژی نقشه¬ی خروجی در این مرحله تعیین می¬شود. ابعاد نقشه با توجه به زمان¬بندی موجود جهت ارزیابی تعیین می¬شود که در جای خود توضیح داده¬خواهد-شد. مرحله¬ی پایانی، اعمال الگوریتم نقشه¬ی خودسازمانده و سپس مقایسه¬ی خروجی با ترتیب¬های استخراج شده از منابع قرآنی است.

شکل 6- مدل مبنایی پژوهش

4-1- ویژگی¬ها

یافتن ویژگی¬هایی که با ترتیب زمانی نزول آیات ارتباط داشته¬باشند، از دو طریق امکان¬پذیر است: 1) بهره¬گیری از ویژگی¬های سوره¬های مکی و مدنی که در کارهای پیشین ذکر شده¬اند. 2) استفاده از روش¬های ماشینی برای کشف ویژگی¬های جدیدی که متمایز کننده¬ی سوره¬های مکی و مدنی باشند. در این پژوهش برای استخراج ویژگی¬ها، از تلفیقی از این دو راه استفاده شده¬است. لازم به ذکر است که دلیل مبنا قرار دادن سوره¬های مکی و مدنی برای تعیین ترتیب زمانی، این است که تنها مساله¬ای که می¬تواند در زمینه¬ی ترتیب زمانی نزول آیات راهگشا باشد، تقسیم¬بندی زمانی مکی و مدنی آیات و ویژگی¬های متمایزکننده¬ی آن¬ها است. لذا ویژگی¬ها بر اساس آیات مکی و مدنی استخراج می¬شوند اما هدف در این پژوهش، تقسیم¬بندی مکی و مدنی نیست بلکه بررسی وجود یا عدم وجود رابطه میان ویژگی¬های ساختاری آیات قرآن و ترتیب زمانی نزول آن¬هاست و برای این مقصود، از ویژگی¬هایی استفاده شده است که قابلیت جداسازی دو گروه آیات مکی و مدنی را داشته¬باشند. با توجه به آنچه ذکر شد، ویژگی¬های انتخابی در این پژوهش عبارتند از: n-گرم¬های یکتا (2،3،4،5=n)، متوسط طول آیه، ادات تاکید، تهدید و سرزنش، قسم، سجده و کلمات خاص. برای جمع¬آوری آیات دارای قسم از کتاب «سوگندهای پربار قرآن» (مکارم شیرازی، جلد1) استفاده شده است. منظور از ویژگی کلمات خاص، مجموعه کلماتی است که مختص سوره¬های مکی یا مدنی هستند. در (A.-B. Sharaf and E. Atwell, 2011) مجموعه¬ای از این کلمات گردآوری شده است که پس از اعتبارسنجی آن¬ها با استفاده از نرم¬افزار متن¬باز ذکر[۱۳] ، کلمات خاص سوره¬های مکی و مدنی مطابق جدول (1) از آن استخراج شده است.

جدول 1- کیف کلمات سوره¬های مکی و مدنی

4-2- خوشه¬بندی به وسیله¬ی الگوریتم نقشه¬ی خودسازمانده

ثابت شده است که در پژوهش¬های خوشه بندی متن، نقشه¬ی خودسازمانده از بهترین الگوریتم های یادگیری است (Isa, Kallimani and Lee, 2009) (Huang, Ke, and Yang, 2008). به علاوه این الگوریتم دارای ویژگی¬های زیر است: 1) عدم حساسیت به داده¬های نویزی یا دارای خطا 2) مشاهده¬پذیری نتیجه نهایی 3) پردازش موازی مزیت اول و دوم برای استفاده در خوشه¬بندی آیات بسیار موثر است. در مشخصه¬های آیات و سوره¬های مکی و مدنی، برخی از مشخصه¬ها در یک یا چند سوره دارای استثنا هستند؛ مزیت اول کمک می¬کند تا بدون نگرانی از این استثنائات بتوان خوشه-بندی آیات را انجام داد. در این حالت، استثنائات را می¬توان نوعی خطا در داده¬ها در نظر گرفت. مزیت دوم نیز این امکان را فراهم می¬کند تا بتوان خوشه¬های نهایی را در قالب یک طیف نمایش داد. به این ترتیب که هرچه خوشه¬ها از لحاظ ویژگی¬ها به یکدیگر شبیه¬تر باشند، از نظر مکانی، به هم نزدیک¬ترند. بنابراین به شرطی که الگوریتم بتواند به درستی تمایز بین خوشه¬ها را تشخیص دهد، در اولین خوشه¬ی این طیف، آیاتی قرار می¬گیرند که با توجه به ویژگی¬های استخراج شده، شبیه به آیاتی هستند که در اوایل دوره¬ی مکی نازل شده¬اند و در آخرین خوشه¬ی طیف، آیاتی قرار می¬گیرند که به آیات نازل شده در اواخر دوران مدنی نزدیک¬ترند. سایر آیات با توجه به میزان شباهت به هر یک از این دو گروه، در خوشه¬های بین این دو خوشه قرار می-گیرند. برای خوشه¬بندی آیات و سوره¬ها به وسیله¬ی الگوریتم نقشه خود¬سازمانده، ابتدا لازم است تا برای هر یک از داده¬های ورودی (اعم از سوره یا آیه) یک بردار ویژگی ایجاد شود. بردارهای ویژگی همه¬ی داده¬های ورودی دارای ابعاد یکسان هستند. سپس این بردارهای ویژگی به عنوان ورودی به الگوریتم نقشه¬ی خودسازمانده داده می¬شود. مقدار دیگری که باید به الگوریتم داده¬شود، ابعاد نقشه¬ی خروجی است. با توجه به اینکه انتظار داریم آرایش نقشه¬ی خروجی به گونه¬ای باشد که خوشه¬ها را با ترتیبی شبیه به یک طیف، از مکی به مدنی، پشت سر هم قرار دهد، ابعاد نقشه را 1 در n در نظر می¬گیریم.

4-3- پیاده¬سازی برای آیات

اولین قدم در خوشه¬بندی با استفاده از الگوریتم نقشه¬ی خود¬سازمانده، ایجاد بردار ویژگی به ازای هر داده¬ی ورودی است. داده¬های ورودی مد نظر در این بخش، آیات قرآن کریم هستند که هر یک توسط یک بردار ویژگی ارائه می¬شوند. ویژگی¬هایی که موثر تشخیص داده شدند، گردآوری شده و به ازای هر آیه، برداری 26 بعدی تشکیل شده¬است. جدول (2) حاوی خلاصه¬ای از ویژگی-های انتخاب شده و مقدار آن¬ها است.

جدول 2- خلاصه¬ای از ویژگی¬های انتخابی برای ایجاد بردار ویژگی هر آیه

برای پیاده¬سازی خوشه¬بندی با استفاده از الگوریتم نقشه¬ی خودسازمانده، از کتابخانه¬ی MiniSom به زبان پایتون استفاده شده¬است. این کتابخانه امکانات خوبی را در به¬کارگیری الگوریتم نقشه¬ی خودسازمانده در اختیار می¬گذارد. همان¬طور که ذکر شد، برای استفاده از نقشه¬ی خودسازمانده لازم است ابعاد نقشه معین شود. از آن¬جا که در پی یافتن دنباله¬ای از خوشه¬ها هستیم که نمایانگر ترتیب زمانی باشند، ابعاد نقشه باید 1 در n باشد. بسته به آزمایش¬های مختلفی که شرح داده می¬شود، مقدار n از 2 تا 5 در نظر گرفته¬شد. فاکتور مهم دیگر در الگوریتم نقشه¬ی خودسازمانده تعیین نرخ یادگیری[۱۴] است. بنابراین هر آزمایش عملی، با نرخ¬های یادگیری مختلفی انجام گرفت. در آزمایش¬های مربوط به آیات بهترین نرخ¬های یادگیری در بازه¬ی 6/0 تا 8/0 قرار داشتند. از 80 درصد از داده¬ها برای آموزش سیستم استفاده شده است. ذکر این نکته ضروری است که با توجه به اینکه نقشه¬ی خودسازمانده یک شبکه¬ی رقابتی بی نظارت است، نیازی به در نظر گرفتن مجموعه¬ داده¬ی آموزشی دارای برچسب برای آموزش سیستم نیست و الگوریتم بر اساس رقابت و همکاری نورون¬ها الگوی داده¬های آموزشی بدون برچسب را استخراج می¬کند و بر اساس آن بقیه¬ی داده¬های ورودی را خوشه¬بندی می¬نماید. خروجی الگوریتم نقشه¬ی خودسازمانده، دنباله¬ای از خوشه¬ها است که هر یک حاوی مجموعه¬ای از آیات هستند و بر حسب میزان مشابهت در کنار یکدیگر قرار گرفته¬اند. با توجه به در نظر گرفتن ویژگی¬هایی که با زمان نزول آیات مرتبط هستند، انتظار می-رود این خوشه¬ها نمایانگر یک ترتیب زمانی نیز باشند.

5- تجزیه و تحلیل

برای ارزیابی نتایج از ترتیب نزول پیشنهادی بازرگان (بازرگان، جلد 1، صص 126-116) و ترتیب سوره¬ها طبق روایت ابن عباس و تکمیل آن مطابق روایت جابر¬¬بن¬زید، با تصحیح از روی نسخه¬های متعدد قابل اعتماد (معرفت، جلد 1، صص 74-71) استفاده کرده¬ایم. ابتدا نتایج خوشه¬بندی آیات مکی و مدنی قطعی با استفاده از روش پیشنهادی، با مجموعه¬ی مکی- مدنی قطعی مقایسه خواهد-شد تا میزان دقت روش مشخص شود. سپس نتایج خوشه¬بندی کل آیات با روش پیشنهادی را با ترتیب تصحیح¬شده¬ی ابن عباس مقایسه خواهیم¬کرد. تمامي آزمايش¬ها با زبان برنامه¬نویسی پایتون پیاده¬سازی شده و با استفاده از سیستمی دارای 6 گیگابایت رم، پردازنده¬ی اینتل،Core i5-2450M ، با فرکانس 5/2 گیگاهرتز و سيستم عامل 64 بيتي ویندوز 7 انجام گرفته است. طبق آزمایش¬های عملی، بهترین نتیجه با استفاده از الگوریتم نقشه¬ی خودسازمانده با در نظر گرفتن n=4 به دست می¬آید؛ به علاوه برای مشخص کردن یک ترتیب زمانی به حداقل چهار خوشه نیاز است و سه خوشه نمی¬تواند نیازمندی¬های ما را تامین نماید. این احتمال وجود دارد که در صورت در نظر گرفتن سه خوشه، الگوریتم، آیات مکی را در یک دسته، آیات مدنی را در دسته¬ی دیگر و آیاتی را که نتوانسته¬است الگوی درستی برای آن¬ها پیدا کند، در خوشه¬ی سوم جای دهد. در نتیجه در نظر گرفتن چهار خوشه، موفقیت یا عدم موفقیت خوشه¬بندی را بهتر نشان می¬دهد. برای ارزیابی نتایج، لازم است تا یک ترتیب زمانی از آیات قرآن کریم در دست داشته باشیم که شامل چهار دسته باشد. برای ایجاد چنین ترتیبی، از چهار سوره که زمان نزول آن¬ها به طور قطعی مشخص است استفاده کرده و با توجه به ترتیب زمانی تصحیح¬شده ابن عباس (معرفت، جلد 1، ص 67) سوره¬ها و تبعا آیات را به چهار بخش تقسیم می¬کنیم. جدول (3) این تقسیم بندی را نشان می¬دهد. سه گروه اول حاوی سوره¬های مکی و گروه آخر حاوی سوره¬های مدنی است. جدول 3- تقسیم¬بندی سوره¬ها از نظر زمان نزول

تعداد آیات گروه اول حدود 2115 آیه، گروه دوم 1998 آیه، گروه سوم 500 آیه و گروه چهارم 1623 آیه است. گروه سوم کوچکترین گروه و گروه اول بزرگترین گروه است. لازم به ذکر است که گروه اول با اینکه از نظر تعداد آیات از بقیه گروه¬ها بزرگ¬تر است، اما بخش زیادی از آن را آیات کوتاه مکی تشکیل می¬دهند.

5-1- مقایسه با مجموعه¬ی مکی- مدنی قطعی

به عنوان اولین آزمایش، آیات مجموعه¬ی مکی– مدنی قطعی را به عنوان داده¬های ورودی در نظر می¬گیریم. هدف این آزمایش اندازه¬گیری دقت الگوریتم نقشه¬ی خودسازمانده در خوشه¬بندی آیات مکی و مدنی قطعی است. از آن¬جا که الگوریتم نقشه¬ی خودسازمانده یک الگوریتم یادگیری بی¬نظارت است، بنابراین می¬توان سیستم را با داده¬هایی که برای آموزش به آن داده¬شده نیز تست کرد. چرا که داده¬های آموزشی بدون برچسب به سیستم داده می¬شوند و این الگوریتم است که الگوهای مشترک در داده-های ورودی را پیدا می¬کند. بنابراین n را 2 در نظر می¬گیریم و انتظار داریم که آیات مکی در یک خوشه و آیات مدنی در خوشه¬ی دیگر قرار گیرند. ‏شکل (7) نتایج این آزمایش را نشان می¬دهد. عناوین خاکستری رنگ، نمایانگر آیات مکی و عناوین سیاه رنگ، نمایانگر آیات مدنی هستند. ملاحظه می¬شود که خوشه¬ی سمت چپ تقریبا فقط حاوی آیات مکی است. خوشه¬ی سمت راست نیز غالب آیات مدنی را در بر¬گرفته¬است اما حاوی تعداد زیادی از آیات مکی نیز هست. در جدول (4) ‏نتایج این آزمایش در قالب معیارهای دقت، فراخوانی و معیار F ارائه شده¬است.

شکل 7- نتایج حاصل از آزمایش اول

جدول 4- نتایج مقایسه با مجموعه¬ی مکی- مدنی قطعی

همان¬طور که مشاهده می¬شود، خوشه¬ی مکی دقت بالایی دارد، یعنی تعداد کمی از آیات مدنی در این خوشه قرار گرفته¬اند. اما فراخوانی خوشه نشان می¬دهد که تقریبا نیمی از آیات مکی در خوشه¬ی مدنی قرار گرفته¬اند. این مساله را شاید بتوان این¬گونه توجیه کرد که هر چه از اوایل دوران مکی به سمت دوران مدنی می¬رویم، سبک آیات مکی به سبک آیات مدنی نزدیک¬تر شده و ویژگی¬های آیات مکی، در آن¬ها کمرنگ¬تر می¬شود. بنابراین این حجم از آیات مکی در خوشه¬ی مدنی می¬تواند به علت شباهت ویژگی¬های این آیات مکی به آیات مدنی باشد.

5-2- مقایسه با ترتیب تصحیح شده¬ی ابن عباس

آزمایش دوم مقایسه¬ی خروجی روش پیشنهادی با ترتیب تصحیح شده¬ی ابن عباس است تا مشخص شود که روش پیشنهادی چقدر به این ترتیب نزدیک بوده¬است. در واقع برای ارزیابی خروجی نهایی خوشه¬بندی آیات، نیاز بود تا مجموعه¬ای از آیات که تاریخ قطعی نزول آن¬ها مشخص است، در دست باشد تا بتوان با اندازه¬گیری دقت و فراخوانی خوشه¬بندی آیاتی که تاریخ قطعی نزول آن¬ها مشخص است، به میزان قابلیت الگوریتم در تشخیص بازه¬ی زمانی آیات پی برد و بر این اساس درباره¬ی سایر آیات و خوشه¬هایی که در آن¬ها قرار گرفته¬اند، قضاوت کرد. اما به علت اینکه چنین مجموعه¬ای در هیچ منبعی از منابع معتبر اسلامی یافت نشد، به ناچار ترتیب تصحیح¬شده¬ی ابن عباس را برای ارزیابی نتیجه¬ی کار برگزیدیم که در جدول (3) قابل مشاهده است. نتایج مقایسه¬ی خوشه¬بندی تمام آیات قرآن کریم با ترتیب ابن عباس در جدول (5) قابل مشاهده است. در هر خوشه، گروهی که بالاترین دقت و فراخوانی را کسب کرده¬است، به عنوان گروه مربوط به آن خوشه برگزیده شده¬است.

جدول 5- مقایسه¬ی نتایج خوشه¬بندی با ترتیب ابن عباس

مشاهده می¬شود که خوشه¬ی اول، تقریبا نیمی از آیات گروه اول را در بر¬گرفته¬است وخوشه¬ی دوم تقریبا یک چهارم از آیات گروه دوم را در خود جای داده¬است. خوشه¬ی چهارم که خوشه خلوتی است، تنها تعداد کمی از آیات گروه دوم را در بر گرفته¬است. به علاوه تعداد کمی از آیات گروه¬های دیگر نیز در این گروه قرار گرفته¬اند. خوشه¬ی سوم نیز با در بر¬گرفتن حدود چهل درصد از آیات گروه چهارم که همان گروه آیات مدنی است، این گروه را نمایندگی می¬کند. در این میان، آیات گروه سوم در میان گروه¬ها پخش شده¬اند و در عین حال در همه¬ی خوشه¬ها در اقلیت هستند. بنابراین الگوریتم با دقتی در حدود پنجاه درصد، گروه اول و گروه چهارم، یعنی گروه آیات مکی اول و گروه آیات مدنی را به درستی جداسازی کرده¬است. در مورد گروه سوم شاید بتوان گفت به علت تعداد آیات کمتر این گروه، نسبت به سایر گروه¬ها، آیات این گروه در همه¬ی خوشه¬ها پخش شده¬است. علت دیگر این امر می¬تواند شباهت ویژگی¬های آیات این گروه به سایر گروه¬ها باشد. به این معنی که ممکن است ویژگی¬های انتخابی، قابلیت جداسازی این آیات را از بقیه¬ی آیات مکی نداشته¬باشند.

5-3- مقایسه با ترتیب پیشنهادی بازرگان

به غیر از کارهای مستشرقین، تنها منبعی که آیات را به ترتیب زمانی دسته¬بندی کرده¬است ترتیب پیشنهادی بازرگان در کتاب سیر تحول در قرآن (بازرگان، جلد 1، صص 126-116) است. بقیه¬ی پژوهش¬ها بیشتر به سراغ تقسیم¬بندی بر مبنای سوره یا بر مبنای سبک آیات رفته¬اند. البته کار بازرگان نیز تحت تاثیر کارهای مستشرقین انجام گرفته¬است. در کتاب سیر تحول قرآن، بر حسب تعداد کلمات آیات و برخی ویژگی¬های آماری دیگر، آیات قرآن به 23 گروه که هر گروه نماینده¬ی یک سال در بازه¬ی نزول قرآن است، تقسیم شده¬اند. برای انجام این کار، بازرگان مجموعه¬ای از آیات را کنار گذاشته¬ و بقیه¬ی آیات را به چندین بلوک¬ تقسیم کرده¬است. برای مقایسه¬ی نتایج خوشه¬بندی، ترتیب بازرگان را بر اساس چهار گروه آیات تعریف شده در ‏جدول (3)، تجمیع کرده¬ایم. جدول (6) نتایج مقایسه¬ی خوشه¬بندی با ترتیب پیشنهادی بازرگان را نشان می¬دهد. هر خوشه نماینده¬ی گروهی در نظر گرفته شده¬است که بالاترین مقدار دقت و فراخوانی را به ازای آن گروه کسب کرده¬است.

جدول 6- نتایج خوشه¬بندی در مقایسه با ترتیب پیشنهادی بازرگان

مشخص است که خوشه¬ی اول، حدود نیمی از آیات گروه اول را با دقت 86 درصد در خود جای داده¬است. خوشه¬ی سوم نیز حدود چهل درصد از آیات گروه چهارم را که گروه آیات مدنی است، با دقتی برابر 66 درصد در بر¬گرفته¬است. دو خوشه¬ی دیگر، یعنی خوشه¬ی دوم و خوشه¬ی چهارم، بالاترین دقت و فراخوانی را به ازای گروه چهارم کسب کرده¬اند. اما نسبت به مقادیر معیارهای خوشه¬ی سوم، دقت و فراخوانی بسیار پایین¬تری دارند. بنابراین گروه دوم و سوم بدون نماینده باقی مانده¬اند. می¬توان گفت نتایج خوشه¬بندی در مقایسه با ترتیب بازرگان، به جز در گروه اول، قابل قبول نیست. دلیل آن را می¬توان بزرگ بودن گروه اول در ترتیب پیشنهادی تجمیع شده¬ی بازرگان دانست. این گروه که 116 بلوک از آیات را در بر دارد، بین چهار گروه در نظر گرفته شده، بزرگترین گروه است. بنابراین خوشه¬بندی با استفاده از روش پیشنهادی با ترتیب تصحیح¬شده¬ی ابن عباس تطابق بهتری دارد. اما نکته¬ی جالب، یکسان بودن تقریبی معیارهای خوشه¬ی سوم در هر دو مقایسه و کسب نمایندگی گروه چهارم توسط این خوشه است. در واقع نسبت به مقایسه با ترتیب ابن عباس، تنها خوشه¬ی دوم است که موفق به کسب نمایندگی گروه مناسب نشده¬است.

5-4- خوشه¬بندی سوره¬ها در مقایسه با مجموعه¬ی مکی- مدنی قطعی

گرچه موضوع پژوهش حاضر خوشه¬بندی آیات قرآن کریم و اثبات وجود یا عدم وجود رابطه میان ویژگی¬های ساختاری آیات قرآن و ترتیب نزول آن¬هاست، اما این پیاده¬سازی برای سوره¬ها نیز انجام و نتایج با مجموعه¬ی مکی- مدنی قطعی مقایسه شد تا صحت و دقت روش پیشنهادی و ویژگی¬های استخراج شده در جداسازی مجموعه آیات مکی و مدنی از یکدیگر مشخص شود. هر سوره به صورت برداری 27 بعدی نمایش داده شد. ویژگی¬های انتخابی برای سوره¬ها همان ویژگی¬های در نظر گرفته شده برای آیات است، با این تفاوت که دو ویژگی وجود قسم و آیات سجده که برای آیات به عنوان یک ویژگی در نظر گرفته شده بودند، برای هر سوره به صورت دو ویژگی جدا از هم در نظر گرفته شده¬¬اند. جدول (7) و جدول (8) نتایج این مقایسه را نشان می-دهند.

جدول 7- ماتریس در¬هم¬ریختگی مقایسه¬ی خوشه¬بندی سوره¬ها با مجموعه¬ی مکی- مدنی قطعی

مشاهده می¬شود که خوشه¬ی مکی با معیار F معادل 85 درصد و خوشه¬ی مدنی با معیار F معادل60 درصد تشخیص داده شده-اند. دو سوره¬ی مدنی که به اشتباه در خوشه¬ی مکی قرار گرفته¬اند، سوره¬های نصر و فتح هستند که شباهت زیادی با سبک سوره¬های مکی دارند. نتایج این مقایسه نشان می¬دهد که عملکرد الگوریتم از لحاظ ایجاد تمایز میان مجموعه¬ای از آیات مکی و مدنی با میانگین معیار F معادل 5/72 درصد موفق بوده است؛ به این معنی که ویژگی¬های انتخابی قابلیت ایجاد تمایز میان این دو دسته آیات را دارند.

6- نتيجه گیری

گرچه روش پیشنهادی پژوهش حاضر هدف اصلی پژوهش را، که کشف رابطه¬ای میان ساختار ظاهری آیات قرآن و ترتیب نزول گزارش¬شده در منابع اسلامی بود، برآورده نکرد اما در خوشه¬بندی آیات با شبکه¬ی بی نظارت نقشه¬ی خودسازمانده به چهار خوشه¬ی خروجی، یک خوشه تقریبا به طور کامل به آیات مدنی و سه خوشه¬ی دیگر به آیات مکی اختصاص یافت. در کارهای مستشرقین که بر مبنای سبک آیات صورت گرفته نیز غالبا سه دسته به آیات مکی و یک دسته به آیات مدنی تعلق گرفته-است. در نتیجه این گزارش که آیات مکی نسبت به یکدیگر تفاوت سبک دارند اما آیات مدنی تقریبا همه دارای سبک مشابه هستند، تایید می¬شود. به علاوه معمولا در نتایج آزمایش¬ها خوشه¬های مکی خالص¬تر از خوشه¬ی مدنی هستند. به این معنی که معمولا در خوشه¬ی مدنی حجم زیادی از آیات مکی نیز قرار می¬گیرد. از این مشاهده نیز می¬توان نتیجه گرفت که سبک برخی از آیات مکی بسیار به آیات مدنی نزدیک می¬شود، به طوری که روش پیشنهادی با استفاده از ویژگی¬های در نظر گرفته¬شده، قابلیت کشف الگوی جداگانه¬ای را برای این دسته از آیات ندارد. از طرفی نتایج خوشه¬بندی آیات به ترتیب ابن عباس نزدیک¬تر بود تا ترتیب پیشنهادی بازرگان. این مساله نشان می¬دهد که الگوی داده¬های ورودی که توسط روش پیشنهادی استخراج می-شود، به ترتیب ابن عباس نزدیک¬تر است. در مجموع، آزمایش¬های انجام شده، مطالبی را در مورد ویژگی¬های انتخابی و همچنین ذات مساله روشن می¬سازد که در ادامه بیان خواهد ¬شد. این نکته قابل توجه است که با توجه به آزمایش¬های انجام شده، مهم-ترین ویژگی¬ها در خوشه¬بندی آیات، متوسط طول آیه، عبارت «یا أیها الذین آمنوا» و کلمات «آیات» و «آیه» از کلمات خاص ذکر شده در جدول (1) هستند.

6-1- چالش¬ها و راهکارها

در مسیر این پژوهش با چالش¬های بسیاری روبه¬رو بودیم. برای برخی از این چالش¬ها در پژوهش حاضر راهکارهایی ارائه شده-است، اما تا حل کامل همه¬ی چالش¬ها در این زمینه، راه زیادی باقیست. اولین چالشی که با آن روبه¬رو بودیم، خوشه¬بندی در مقیاس آیات قرآن کریم بود. چالش¬هایی که خوشه¬بندی در مقیاس آیات ایجاد می¬کند را می¬توان این¬طور بیان کرد: 1) هیچ منبع استانداردی وجود ندارد که تقسیم¬بندی مکی- مدنی را حتی برای بخشی از آیات قرآن کریم انجام داده¬باشد تا مبنای ارزیابی نتیجه¬ی کار ما قرار گیرد. 2) در زمینه¬ی سوره¬های مکی و مدنی اختلاف بسیار است و مرجع واحدی در این زمینه وجود ندارد. 3) در نظر گرفتن ویژگی¬ها در سطح آیات، باعث می¬شود که بردار ویژگی حاصل، برداری پراکنده و حاوی مقادیر زیادی صفر باشد. زیرا طبیعتا جمع تعداد زیادی ویژگی در یک آیه، خصوصا در آیات کوتاه غیر ممکن است. در مورد چالش اول باید گفت که تنها منبعی که تقسیم¬بندی مکی- مدنی را در مقیاس آیات انجام داده¬است کارهای مستشرقین و پس از آن کار بازرگان در کتاب سیر تحول در قرآن (بازرگان، جلد 1، صص 126-116) است که تقریبا از سبک و سیاق مستشرقین پیروی کرده¬است. اما هدف پژوهش حاضر، بررسی نتایج خوشه¬بندی در مقایسه با ترتیب نزول¬های گزارش شده در منابع اسلامی است. راه حل پیشنهادی استفاده از همان ترتیب نزول¬های موجود در منابع اسلامی است. به این صورت که یکی از ترتیب¬های معروف گزارش شده در منابع اسلامی به عنوان مرجع در نظر گرفته شده و آیات خوشه¬بندی شده با آیات سوره¬های موجود در این مرجع مقایسه شوند. این راهکار چالش مورد نظر را حل نمی¬کند اما به عنوان راه جایگزین، تا حدودی مشکل عدم وجود مرجع برای مقایسه¬ی نتایج را حل می¬کند. در مورد چالش دوم، سوره¬های مکی و مدنی قطعی که مورد اتفاق اغلب پژوهشگران هستند، از کتاب علوم قرآنی، نوشته¬ی محمد¬هادی معرفت (معرفت، جلد1، صص 74-71) استخراج شد. در این زمینه همه¬ی آیات مورد اختلاف در سوره¬ها کنار گذاشته¬شد. راه حل پیشنهادی، این چالش را به طور کامل حل کرده¬است. برای حل چالش سوم، نیاز است تا ویژگی¬هایی استخراج و استفاده شوند، که برای همه یا اغلب آیات، مقدار داشته¬باشند. در میان ویژگی¬های پیشنهادی پژوهش حاضر، ویژگی متوسط طول آیه و تا حدی ویژگی تاکید، تهدید، سرزنش از این خصوصیت برخوردارند. با این حال این چالش به طور کامل حل نشده¬است و نیاز به استخراج ویژگی¬های جدید که همه¬ی آیات را پوشش دهند، وجود دارد. منابع ایجاد خطا نیز از دیگر چالش¬هایی هستند که به فراخور زمینه¬ی مورد مطالعه، در هر پژوهشی وجود دارند. این منابع در پژوهش حاضر عبارتند از: 1) تعریف مجموعه¬ی ویژگی: اگر ویژگی¬های انتخابی نادرست باشند، نتیجه¬ی حاصل دچار خطا خواهد شد. 2) وجود نویز در داده¬ها: برخی ویژگی¬ها مانند وجود آیات سجده یا حروف مقطعه، دارای نویز یا خطا هستند؛ به این معنی که این ویژگی¬ها برای تعداد اندکی از آیات صدق نمی¬کنند. مثلا سوره¬ای وجود دارد که دارای حروف مقطعه است اما مکی نیست. 3) نزدیک بودن ویژگی¬های برخی از آیات مکی و مدنی به یکدیگر: با حرکت از آیات نازل شده در اوایل دوران مکی، به سمت آیات مدنی، ویژگی¬های آیات مکی به آیات مدنی نزدیک می¬شود تا جایی که برخی از آیات مکی عملا تفاوت چندانی با آیات مدنی ندارند. 4) خطای پیکره¬های مورد استفاده برای استخراج ویژگی¬ها: برای استخراج برخی از ویژگی¬ها نظیر تاکید، تهدید و سرزنش، از پیکره¬هایی استفاده شده¬است که به صورت ماشینی ایجاد شده و توسط متخصصین ارزیابی شده¬اند. با این حال هرگونه خطا در این پیکره¬ها منجر به ایجاد خطا در نتایج نهایی خواهد¬شد. برای کاهش این خطاها، راهکارهایی در نظر گرفته¬شد. برای مثال در مورد منبع خطای اول، تمام ویژگی¬ها از نظر قابلیت جداسازی آیات مکی و مدنی مورد آزمون قرار گرفتند و ویژگی¬هایی که این قابلیت را از خود نشان ندادند، از مجموعه¬ی ویژگی-ها حذف شدند. در مورد ویژگی¬های استخراج شده از پژوهش¬های پیشین نیز، ارزیابی به صورت دستی و ماشینی انجام شد و تنها ویژگی¬هایی در نظر گرفته¬شدند که در ارزیابی¬ها نتایج قابل قبولی داشتند. در مورد خطای دوم، استفاده از الگوریتم نقشه¬ی خودسازمانده، این مشکل را تا حد زیادی برطرف می¬کند چرا که از مزایای الگوریتم نقشه¬¬ی خودسازمانده حساس نبودن به داده¬های نویزی است. خطای سوم ناشی از ذات مساله است. محققان قرآنی نیز بر این موضوع معترفند که گروهی از آیات مکی در ویژگی¬های ظاهری به شدت به آیات مدنی شبیه هستند. شاید حرکت به سمت ویژگی¬های معنایی در کاهش این خطا کمک¬کننده باشد. برای کاهش اثر منبع خطای چهارم، سعی بر این بود تا از پیکره¬های معتبر در دسترس نظیر پیکره¬های تنزیل[۱۵] استفاده شود. علاوه بر همه¬ی آن¬چه ذکر شد، برای ارزیابی دقیق نتیجه¬ی پژوهش حاصل نیاز به مجموعه¬ی آیاتی است که سال نزول قطعی آن¬ها مشخص باشد. به علاوه ترتیب انتخابی برای ارزیابی نتایج باید با مجموعه¬ی مکی- مدنی قطعی در نظر گرفته شده مطابقت داشته¬باشد تا ارزیابی به بهترین نحو و با کمترین خطا انجام گیرد.

6-2- پیشنهادهایی برای کارهای آینده

به عنوان پیشنهادی برای کارهای آینده، به نظر می¬رسد حرکت به سمت استخراج ویژگی¬های معنایی برای آیات، مفید باشد. از آن¬جا که یکی از تفاوت¬های آیات مکی و مدنی در مضامین و معانی آن¬هاست، در مورد آن دسته از آیات مکی که شباهت زیادی با آیات مدنی دارند، ورود به حوزه¬ی معنایی آیات ممکن است نتایج بهتری را تولید کند. پیشنهاد دیگری که ظرفیت خوبی برای کارهای آینده دارد، پژوهش آوایی و استخراج ویژگی¬های مرتبط با لحن از آیات قرآن کریم است. چرا که لحن آیات مکی، شدیدتر و حاوی تهدید و سرزنش بیش¬تری نسبت به آیات مدنی است. استخراج چنین ویژگی¬هایی نیازمند پژوهش دقیق در آواشناسی زبان عربی است. در حوزه¬ی ویژگی¬های آوایی، علاوه بر لحن آیات می¬توان در زمینه¬ی سجع و وزن آیات نیز مطالعاتی انجام داد. طبق گزارش¬های موجود، غالبا سوره¬های مکی مسجع و موزون هستند اما سوره¬های مدنی این ویژگی را ندارند. البته بررسی سجع اساسا در مقیاس سوره¬ معنا می¬یابد.


پانویس و منابع

  1. Self-Organizing Map (SOM)
  2. Statistical classifier
  3. Support Vector Machine
  4. Naïve Bayesian Classifiers
  5. Multivariate approach
  6. Sparse
  7. Weka
  8. Expectation Maximization
  9. Stylometry
  10. Morpheme
  11. Criterion of Concurrent Smoothness
  12. http://www.salrehaili.com/quran/
  13. http://zekr.org
  14. Learning rate
  15. http://tanzil.net


1. Sharaf, Abdul-Baquee and Atwell, Eric, Is Machine Learning useful for Qur’anic Studies? The problem of classifying Meccan and Medinan chapters of the Qur’an, University of Leeds, 2011.

2. رامیار، محمود، تاریخ قرآن، تهران: انتشارات امیرکبیر، 1362ش.

3. Tan, A., Text Mining: The state of the art and the challenges, Proceeding of PAKDD Workshop on Knowledge Discovery from Advanced Databases, pp. 65-70, 1999.

4. شاکر، محمد کاظم، «تفسیر بر اساس ترتیب نزول با سه قرائت»، مجله پژوهش های قرآنی، شماره 16(62-63).

5. خرمشاهی، بهاء الدین. دانشنامه قرآن و قرآن پژوهی، تهران: دوستان-ناهید، ۱۳۷۷ش.

6. Nassourou , M., A Knowledge-based Hybrid Statistical Classifier for Reconstructing the Chronology of the Quran, University of Würzburg, 2011.

7. Thabet , N., Understanding the thematic structure of the Qur’an: an exploratory multivariate approach, UK, 2005.

8. Moisl, H., Sura Length and Lexical Probability Estimation in Cluster Analysis of the Qur‟an, ACM Transactions on Asian Language Information Processing, vol. 8, no. 4, pp. 1-19, 2009.

9. Sadeghi, B., The Chronology of the Qurān: A Stylometric Research Program, Arabica, pp. 210-299, 2011.

10. بازرگان، مهدی، سیر تحول قرآن، تهران: شرکت سهامی انتشار، 1385ش.

11. Alrehaili, S. M. A., The Chronology of the Texts in the Holy Quran According to NLP Techniques, University of Leeds, UK, 2011.

12. مکارم شیرازی، ناصر، سوگندهای پربار قرآن، قم: مدرسه الامام علی بن ابی طالب (ع)، 1386ش.

13. Isa , D., Kallimani, V. P., Lee, L. H., Using the self organizing map for clustering of text documents, Expert Systems with Applications: An International Journal, vol. 36, no. 5, pp. 9584-9591, 2009.

14. Huang, S. H., Ke, H. R., Yang, W. P., Structure clustering for Chinese patent documents, Expert Systems with Applications, vol. 34, no. 4, pp. 2290-2297, 2008.

15. معرفت، محمد هادی، علوم قرآنی. قم: موسسه فرهنگی تمهید، 1381ش.