استخراج خودکار عبارات دارای دنباله هجایی یکسان از قرآن کریم
چکیده
یکی از جنبههای اعجاز قرآن کریم، تنزیل آن در قالب حروف، کلمات و جملات با رعایت دستور زبان عادی مردم عربستان است و. زبان، متشکل از ترکیب صامتها و مصوتها به اشکال گوناگون است که کوچکترین بخش آوایی زبان یعنی هجا را به وجود میآورند. چگونگی ترتیب و چینش هجاهای مختلف در کنار هم، نشاندهنده آهنگ و موسیقی جملات بوده و در متون دارای نظمآهنگ از اهمیت ویژهای برخوردار است و در قرآن کریم نیز در بخش اعجاز لفظی مورد بررسی قرار میگیرد. آنچه در این پژوهش مورد کوشش و توجه قرار گرفته، استخراج دنباله هجایی کل آیات قرآن بهصورت خودکار، از طریق پیشپردازش نسخه متنی قرآن کریم و نرمالسازی کاراکترهای متن، تفکیک سورهها و آیهها و تولید دنبالههای مورد نیاز میباشداست. همچنین با طراحی یک سامانه تحت وب، این امکان برای کاربران فراهم شده است که در پژوهشهای مربوط به جنبههای آوایی و هجایی قرآن کریم، با ارائه دنباله هجایی به برنامه، عبارات همهجا، شماره سوره و آیه آنها و به تبع آن آیات هموزن را به دست بیاوردبیاورند. امید است که این پژوهش مبنا و تسهیلگر پژوهشهای آتی واقع شود.
واژگان کلیدی
دنباله هجایی- قرآن کریم-، قرآنکاوی رایانشی-، آیات همهجا-، اعجاز لفظی-، متنکاوی.
1- مقدمه
اعجاز قرآن کریم مقولهای است که مطرح شدن آن به قرون اولیه اسلامی بازمیگردد و اعجاز ادبی و زبانی ازجمله رویکردهای پژوهش در این حوزه میباشد. پروفسور دورمان آمریکایى مىنویسد: «قرآن لفظ به لفظ بهوسیله جبرئیل، بر حضرت محمد(صلى الله علیه وآله وسلم) وحى شده و هر یک از الفاظ آن کامل و تمام است. قرآن معجزهاى جاوید و شاهد بر صدق ادعاى محمد رسول خدا(صلى الله علیه وآله وسلم) است. قسمتى از جنبه اعجاز آن، مربوط به زبان، سبک و اسلوب انشاى آن است و این سبک و اسلوب، بهقدری کامل و عظیم و باشکوه است که نه انسان و نه پریان، نمىتوانند سورهاى نظیر آن را بیاورند»(نیکبین، 48). این ویژگیها و نیز جریان تحدی، پژوهشگران مسلمان را برانگیخته تا بهمنظور شناختن و شناساندن ابعاد مافوق بشری این کتاب عظیم دست به تحقیق و کنکاش بزنند. هجا يا سیلاب که عموماً در زبانهای مختلف، يک واحد متشکل از چند آوا محسوب میشود، همانند بسیاری از اصطلاحات و واحدهای ساختاری زبان تعاريف متعددی بهخود گرفته است (نظری، ۱۸۳). قدور از زبانشناسان برجسته عرب در تعريفی ساده، هجا را شکلی از اشکال ترکیبی واجهای صامت و مصوت با شیوه آرايش آنها در کلام میداند (قدور، ۱۰۸). برخی نیز به تأثیر از منابع غربی، به تعاريف چندگانه از هجا دست زدهاند؛ مناف از منظر آواشناختی، هجا را در توالی آواهای گفتاری میداند که دارای حد اعلا يا قله شنیداری طبیعی است، صرفنظر از ديگر عوامل مانند تکیه و نواخت؛ بهعبارتیدیگر، آن را واحدی متشکل از يک يا چند عنصر برمیشمارد که در آن، قفسه سینه در يک عمل، اوج شنیداری ايجاد میکند (محمد، ۱۱۹). از نظر نورالدين، مقطع يا هجا نوع سادهای است از آواهای ترکیبی در زنجیره کلام که از واج بزرگتر است و در گفتار به لحاظ زمانی و در نوشتار به لحاظ مکانی پس از واج محقق میشود (نورالدین،۱۸۹). از ترکیب مصوتها و صامتها ۵ نوع هجای متفاوت در زبان عربی بهوجود میآید (حسنی،۱۰) . هجاهای زبان عربی رسمی را بر اساس کمیت (و نه ساخت آوایی آنها) به سه دسته کوتاه، بلند و کشیده تقسیم میکنند. در جدول شماره 1 انواع هجاهای عربی و نحوه تناظر بین انواع ساختاری و کمّی با علامت خاص هر یک در تقطیع عروضی همراه با مثال قرآنی نوشته شده است. هجاها نهتنها سازنده جملهاند، بلکه کیفیت همنشینی آنها تعیینکننده وزن و موسیقی جمله نیز هست و بررسی و عرضه چگونگی چینش هجاها در آیات قرآن موضوعی است که نگارنده با هدف تسهیلگریِ انجام ِتحقیقات حوزهی آوایی و هجایی قرآن کریم در پیش گرفته است. جدول 1- ساختار 5 نوع هجای زبان عربی و کد اختصاصیافته به هریک از آنها
| کد | ساخت هجا | کمیت هجا | علامت هجا | مثال |
|---|---|---|---|---|
| 1 | صامت + مصوت کوتاه | کوتاه | U | فَ، بِ، هُ |
| 2 | صامت + مصوت بلند | بلند | – | فِی، ما، ذو |
| 3 | صامت + مصوت کوتاه + صامت | بلند | – | مِن، لَن، قُل |
| 4 | صامت + مصوت بلند + صامت | کشیده | – U | روح، فیل، ناس |
| 5 | صامت + مصوت کوتاه + ۲ صامت | کشیده | – U | حِجر، قَدر، فُلک |
پیش از این، پژوهشی با این موضوع که تمرکز بحث بر استخراج دنباله هجائی آیات قرآن کریم باشد انجام نپذیرفته و تنها مقالاتی چند با موضوعات نزدیک به این عنوان مورد پژوهش قرار گرفته است؛ ازجمله بابک شریف در مقاله «عبارتهای موزون عروضی، جلوهای از اعجاز فرازمانی و فرازبانی قرآن»1، به بررسی و استخراج آیات دارای وزن عروضی پرداخته و جلال رحیمیان رابطه معنایی با ویژگیهای آوایی قرآن2 را مورد بررسی قرار داده است. در بسیاری از کارهای قبلی استخراج این دنبالهها بهصورت دستی و توسط نیروی انسانی انجام شده است به همین دلیل مشاهده میگردد، اغلب این کارها بر روی بخش محدودی از قرآن کریم مثلاً یک سوره یا یک جزء انجام گرفته است. بنابراین نیاز به روشهایی هست که با استفاده از پیشرفتهای سختافزاری و نرمافزاری جدید بتوان به محدودیتهای نیروی انسانی غلبه کرده و کارهای طولانی و خستهکننده را با دقت و سرعت و راحتی بیشتری انجام داد. در اینجا به دنبال راهی هستیم که در راستای هوشمندسازی سیستم رایانه، قواعدی را که یک نیروی انسانی برای استخراج دنبالههای آوایی و هجایی قرآن کریم بهکار میگیرد به شکلی برای سیستم تعریف نماییم تا بتواند کار نیروی انسانی را بهصورت خودکار انجام دهد.
2- استخراج پیکره هجایی آیات
برای تولید پیکره هجایی آیات ابتدا یک نسخه متنی از قرآن کریم تهیه شده و مورد پیشپردازش قرار میگیرد. در این قسمت با استفاده از زبان برنامهنویسی php پس از نرمالسازی کاراکترهای متن، سورهها و آیات را تفکیک کرده و در یک آرایه قرار میدهیم. ازآنجاکه دنباله هجایی آیات از روی نسخه آوایی قرآن کریم تولید میشود لازم است نسخه آوایی قرآن از روی نسخه مکتوب آن تولید شود.
2-1- تولید دنباله آوایی
برای تولید دنباله آوایی باید قواعد تبدیل نسخه مکتوب به آوایی برای سیستم تعریف شود. بهعبارتدیگر قواعدی را که یک قاری قرآن برای قرائتش به کار میبرد، سیستم باید روی متن مکتوب آن پیاده نماید. برای انجام این کار از ابتدای رشته متنی هر آیه شروع کرده و به ازای هر کاراکتر با بررسی کاراکترهای اطراف آن، در صورت نیاز قواعد لازم را اعمال و شکل خوانده شدن آن را به دنباله آوایی اضافه مینماییم. مثلاً اگر تشدید بعد از یک حرف بیاید در دنباله آوایی، آن حرف دو بار تکرار میشود، یا اگر بعد از الف و لام حروف شمسی بیاید لام خوانده نمیشود. به همین ترتیب قواعد مختلف مانند اشباع و حروف ناخوانا اعمال میگردد. برای هر قاعده موارد استثناء هم وجود دارد که باید در نظر گرفته شود. مثلاً وقتی ضمه بعد از ضمیر «ه» بیاید اشباع شده و «هو» خوانده میشود. اما در کلمه «فواکهُ» که «ه» ضمیر نیست همان ضمه خوانده میشود. مثال دیگر در این زمینه حروف مقطعه است که از قوانین کلی پیروی نمیکنند. جدول 2 نمونهای از دنبالههای آوایی تولیدشده را نشان میدهد.
جدول 2- نمونه دنباله آوایی آیات
2-2- تولید دنباله صامت و مصوت
همزمان با تولید دنباله آوایی با توجه به صوتی که هر کاراکتر تولید میکند دنباله دیگری هم برای هر آیه تولید میکنیم که صامتها و مصوتهای تشکیلدهنده آیه را نشان میدهد. مثلاً حرف «ی» ممکن است یک مصوت بلند و یا یک صامت تولید نماید و یا حتی ممکن است هیچ آوایی تولید نکند. مصوت شامل دو نوع مصوت کوتاه و مصوت بلند میشود. صامتها با حرفs و مصوت کوتاه با حرفk و مصوت بلند با حرفb مشخص شدهاند. جدول 3 نمونهای از رشتههای تولیدشده را نشان میدهد.
جدول 3- نمونه دنبالههای صامت و مصوت
2-3- تولید دنباله هجایی آیات از روی دنباله صامت و مصوت
در این مرحله برای هر آیه از ابتدای رشته صامت و مصوت آن شروع کرده و هجاهای تولیدشده توسط دنباله مذکور با توجه به قوانین هجابندی استخراج میگردد. همانطور که قبلاً اشاره شد در زبان عربی پنج نوع هجا وجود دارد که در جدول 1 با ارقام ۱ تا ۵ مشخص شده است. نمونه دنباله هجاهای ایجادشده در جدول ۴ قابل مشاهده است. جدول4- نمونه دنباله هجایی ایجادشده
2-4- استخراج آیات و عبارات همهجا:
کاری که تا اینجا انجام شد استخراج دنباله هجایی از روی آیات قرآن کریم است. حال به فرآیند دیگری نیاز داریم که بتوانیم برعکس این کار را نیز انجام دهیم؛ بهگونهای که با داشتن یک دنباله هجایی بتوانیم آیات و عباراتی را که با این دنباله هجایی منطبق میشوند، بیابیم. برای این منظور هنگام تولید دنباله هجایی، دنبالههای کمکی دیگری نیز بهموازات آن تولید مینماییم تا در فرآیند بازگشتی از آن استفاده شود. چالش دیگری که وجود دارد این است که هنگام انطباق دنباله هجایی با آیات و عبارات قرآن کریم بسیاری از انطباقها از وسط کلمات انجام میگیرد؛ یعنی برای انطباق با یک دنباله هجایی خاص باید از وسط یک کلمه شروع به خواندن کنیم و یا وسط یک کلمه، خواندن عبارت پایان یابد. اینگونه موارد به دلیل مطلوب نبودن، پالایش شده و تنها مواردی که از آغاز یک کلمه شروع و در پایان یک کلمه خاتمه مییابد به خروجی فرستاده میشود. برای فراهم نمودن دسترسی عموم به این ماژول، سامانهای به این منظور طراحی شده و بر روی وب با آدرس http://ruya.ir/heja قرار گرفته است. در این سامانه میتوان با مشخص نمودن یک دنباله هجایی دلخواه و یا مشخص نمودن یک آیه دلخواه از قرآن کریم، عباراتی را که دنباله هجایی یکسانی با آن دارند استخراج نمود. برای نمونه با انتخاب آیه دوم از سوره اول قرآن کریم، خروجی به شکل جدول شماره 5 به دست میآید.
جدول 5- خروجی ماژول یافتن عبارات همهجا برای آیه 2 سوره 1
| کد | سوره | آیه | عبارت |
|---|---|---|---|
| 332314 | 1 | 2 | الرَّحْمَنِ الرَّحِيمِ |
| 332314 | 2 | 119 | عَنْ أَصْحَابِ الْجَحِیمِ |
| 332314 | 2 | 216 | أَنْتُمْ لا تَعْلَمُونَ. |
| 332314 | 2 | 232 | أَنْتُمْ لا تَعْلَمُونَ. |
| 332314 | 2 | 272 | أَنْتُمْ لَا تُظْلَمُونَ |
| 332314 | 3 | 66 | أَنْتُمْ لا تَعْلَمُونَ. |
| 332314 | 5 | 58 | قَوْمٌ لَا يَعْقِلُونَ. |
| 332314 | 6 | 116 | هُمْ إِلَّا يَخْرُصُونَ |
3- نتيجهگیری
در این پژوهش با بهکارگیری ظرفیتهای رایانه در پردازش سریع و دقیق متن قرآن کریم توانستیم با هوشمندسازی سیستم، پیکره هجایی آیات قرآن را با دقت مناسبی تولید نماییم. پیکره دنباله هجایی آیات پس از چند مرحله تصحیح و رفع خطاهای موجود به کمترین میزان خطا رسیده است. برای اطمینان از دقت بالای این پیکره تعدادی از صفحات و سورههای قرآن کریم بهطور تصادفی انتخاب شده و توسط متخصص انسانی مورد بررسی و تطبیق با پیکره مذکور قرار گرفته است. نتیجه کار، دقت بالای ۹۹ درصد را برای این پیکره نشان میدهد. بنابراین میتواند در بسیاری از پژوهشهای قرآنی مرتبط با آهنگ و آوای قرآن کریم مورد استفاده قرار گیرد. امید است که این پژوهش مبنا و تسهیلگر پژوهشهای آتی و مورد قبول حضرت حق واقع گردد.
پانویس و منابع
1. حسنی، حمید، عروض و قافیه عربی، تهران، انتشارات علمی و هنری، 1383
2. قدور، احمد محمد، مبادی اللسانیات، دمشق، دارالفکر، 1999
3. محمد، مناف مهدی، علم الاصوات اللغویه، بیروت، عالم الکتاب، 1998
4. نیکبین، نصرالله، اسلام از دیدگاه دانشمندان غرب، دورود، دفتر مذهبی سیمان فاریست،1292
5. نورالدین، عصام، علم الاصوات اللغویه(فونتیکا)، بیروت، دارالفکر اللبنانی، 1992
6. نظری، علیرضا، تحلیل مقایسهای ساختار و قواعد هجا یا سیلاب در عربی و فارسی، ادب عرب، سال نهم شماره 2، 1396