استخراج خودکار عبارات دارای دنباله هجایی یکسان از قرآن کریم

از شبکه نخبگان و قرآن‌کاوی
پرش به ناوبری پرش به جستجو

چکیده

یکی از جنبه‌های اعجاز قرآن کریم، تنزیل آن در قالب حروف، کلمات و جملات با رعایت دستور زبان عادی مردم عربستان است و. زبان، متشکل از ترکیب صامت‌ها و مصوت‌ها به اشکال گوناگون است که کوچک‌ترین بخش آوایی زبان یعنی هجا را به وجود می‌آورند. چگونگی ترتیب و چینش هجاهای مختلف در کنار هم، نشان‌دهنده آهنگ و موسیقی جملات بوده و در متون دارای نظم‌آهنگ از اهمیت ویژه‌ای برخوردار است و در قرآن کریم نیز در بخش اعجاز لفظی مورد بررسی قرار می‌گیرد. آنچه در این پژوهش مورد کوشش و توجه قرار گرفته، استخراج دنباله هجایی کل آیات قرآن به‌صورت خودکار، از طریق پیش‌پردازش نسخه متنی قرآن کریم و نرمال‌سازی کاراکترهای متن، تفکیک سوره‌ها و آیه‌ها و تولید دنباله‌های مورد نیاز می‌باشداست. همچنین با طراحی یک سامانه تحت وب، این امکان برای کاربران فراهم شده است که در پژوهش‌های مربوط به جنبه‌های آوایی و هجایی قرآن کریم، با ارائه دنباله هجایی به برنامه، عبارات هم‌هجا، شماره سوره و آیه آنها و به تبع آن آیات هم‌وزن را به دست بیاوردبیاورند. امید است که این پژوهش مبنا و تسهیل‌گر پژوهش‌های آتی واقع شود.

واژگان کلیدی

دنباله هجایی- قرآن کریم-، قرآن‌کاوی رایانشی-، آیات هم‌هجا-، اعجاز لفظی-، متن‌کاوی.


1- مقدمه

اعجاز قرآن کریم مقوله‌ای است که مطرح شدن آن به قرون اولیه اسلامی بازمی‌گردد و اعجاز ادبی و زبانی ازجمله رویکردهای پژوهش در این حوزه می‌باشد. پروفسور دورمان آمریکایى مى‌نویسد: «قرآن لفظ به لفظ به‌وسیله جبرئیل، بر حضرت محمد(صلى الله علیه وآله وسلم) وحى شده و هر یک از الفاظ آن کامل و تمام است. قرآن معجزه‌اى جاوید و شاهد بر صدق ادعاى محمد رسول خدا(صلى الله علیه وآله وسلم) است. قسمتى از جنبه اعجاز آن، مربوط به زبان، سبک و اسلوب انشاى آن است و این سبک و اسلوب، به‌قدری کامل و عظیم و باشکوه است که نه انسان و نه پریان، نمى‌توانند سوره‌اى نظیر آن را بیاورند»(نیک‌بین، 48). این ویژگی‌ها و نیز جریان تحدی، پژوهشگران مسلمان را برانگیخته تا به‌منظور شناختن و شناساندن ابعاد مافوق بشری این کتاب عظیم دست به تحقیق و کنکاش بزنند. هجا يا سیلاب که عموماً در زبان‌های مختلف، يک واحد متشکل از چند آوا محسوب می‌شود، همانند بسیاری از اصطلاحات و واحدهای ساختاری زبان تعاريف متعددی به‌خود گرفته است (نظری، ۱۸۳). قدور از زبان‌شناسان برجسته عرب در تعريفی ساده، هجا را شکلی از اشکال ترکیبی واج‌های صامت و مصوت با شیوه آرايش آنها در کلام می‌داند (قدور، ۱۰۸). برخی نیز به تأثیر از منابع غربی، به تعاريف چندگانه از هجا دست زده‌اند؛ مناف از منظر آواشناختی، هجا را در توالی آواهای گفتاری می‌داند که دارای حد اعلا يا قله شنیداری طبیعی است، صرف‌نظر از ديگر عوامل مانند تکیه و نواخت؛ به‌عبارتی‌دیگر، آن را واحدی متشکل از يک يا چند عنصر برمی‌شمارد که در آن، قفسه سینه در يک عمل، اوج شنیداری ايجاد می‌کند (محمد، ۱۱۹). از نظر نورالدين، مقطع يا هجا نوع ساده‌ای است از آواهای ترکیبی در زنجیره کلام که از واج بزرگ‌تر است و در گفتار به لحاظ زمانی و در نوشتار به لحاظ مکانی پس از واج محقق می‌شود (نورالدین،۱۸۹). از ترکیب مصوت‌ها و صامت‌ها ۵ نوع هجای متفاوت در زبان عربی به‌وجود می‌آید (حسنی،۱۰) . هجاهای زبان عربی رسمی را بر اساس کمیت (و نه ساخت آوایی آنها) به سه دسته کوتاه، بلند و کشیده تقسیم می‌کنند. در جدول شماره 1 انواع هجاهای عربی و نحوه تناظر بین انواع ساختاری و کمّی با علامت خاص هر یک در تقطیع عروضی همراه با مثال قرآنی نوشته شده است. هجاها نه‌تنها سازنده جمله‌اند، بلکه کیفیت هم‌نشینی آنها تعیین‌کننده وزن و موسیقی جمله نیز هست و بررسی و عرضه چگونگی چینش هجاها در آیات قرآن موضوعی است که نگارنده با هدف تسهیل‌گریِ انجام ِتحقیقات حوزه‌ی آوایی و هجایی قرآن کریم در پیش گرفته است. جدول 1- ساختار 5 نوع هجای زبان عربی و کد اختصاص‌یافته به هریک از آنها

کد ساخت هجا کمیت هجا علامت هجا مثال
1 صامت + مصوت کوتاه کوتاه U فَ، بِ، هُ
2 صامت + مصوت بلند بلند فِی، ما، ذو
3 صامت + مصوت کوتاه + صامت بلند مِن، لَن، قُل
4 صامت + مصوت بلند + صامت کشیده – U روح، فیل، ناس
5 صامت + مصوت کوتاه + ۲ صامت کشیده – U حِجر، قَدر، فُلک

پیش از این، پژوهشی با این موضوع که تمرکز بحث بر استخراج دنباله هجائی آیات قرآن کریم باشد انجام نپذیرفته و تنها مقالاتی چند با موضوعات نزدیک به این عنوان مورد پژوهش قرار گرفته است؛ ازجمله بابک شریف در مقاله «عبارت‌های موزون عروضی، جلوه‌ای از اعجاز فرازمانی و فرازبانی قرآن»1، به بررسی و استخراج آیات دارای وزن عروضی پرداخته و جلال رحیمیان رابطه معنایی با ویژگی‌های آوایی قرآن2 را مورد بررسی قرار داده است. در بسیاری از کارهای قبلی استخراج این دنباله‌ها به‌صورت دستی و توسط نیروی انسانی انجام شده است به همین دلیل مشاهده می‌گردد، اغلب این کارها بر روی بخش محدودی از قرآن کریم مثلاً یک سوره یا یک جزء انجام گرفته است. بنابراین نیاز به روش‌هایی هست که با استفاده از پیشرفت‌های سخت‌افزاری و نرم‌افزاری جدید بتوان به محدودیت‌های نیروی انسانی غلبه کرده و کارهای طولانی و خسته‌کننده را با دقت و سرعت و راحتی بیشتری انجام داد. در اینجا به دنبال راهی هستیم که در راستای هوشمند‌سازی سیستم رایانه، قواعدی را که یک نیروی انسانی برای استخراج دنباله‌های آوایی و هجایی قرآن کریم به‌کار می‌گیرد به شکلی برای سیستم تعریف نماییم تا بتواند کار نیروی انسانی را به‌صورت خودکار انجام دهد.

2- استخراج پیکره هجایی آیات

برای تولید پیکره هجایی آیات ابتدا یک نسخه متنی از قرآن کریم تهیه شده و مورد پیش‌پردازش قرار می‌گیرد. در این قسمت با استفاده از زبان برنامه‌نویسی php پس از نرمال‌سازی کاراکترهای متن، سوره‌ها و آیات را تفکیک کرده و در یک آرایه قرار می‌دهیم. ازآنجاکه دنباله هجایی آیات از روی نسخه آوایی قرآن کریم تولید می‌شود لازم است نسخه آوایی قرآن از روی نسخه مکتوب آن تولید شود.

2-1- تولید دنباله آوایی

برای تولید دنباله آوایی باید قواعد تبدیل نسخه مکتوب به آوایی برای سیستم تعریف شود. به‌عبارت‌دیگر قواعدی را که یک قاری قرآن برای قرائتش به کار می‌برد، سیستم باید روی متن مکتوب آن پیاده نماید. برای انجام این کار از ابتدای رشته متنی هر آیه شروع کرده و به ازای هر کاراکتر با بررسی کاراکترهای اطراف آن، در صورت نیاز قواعد لازم را اعمال و شکل خوانده شدن آن را به دنباله آوایی اضافه می‌نماییم. مثلاً اگر تشدید بعد از یک حرف بیاید در دنباله آوایی، آن حرف دو بار تکرار می‌شود، یا اگر بعد از الف و لام حروف شمسی بیاید لام خوانده نمی‌شود.‍ به همین ترتیب قواعد مختلف مانند اشباع و حروف ناخوانا اعمال می‌گردد. برای هر قاعده موارد استثناء هم وجود دارد که باید در نظر گرفته شود. مثلاً وقتی ضمه بعد از ضمیر «ه» بیاید اشباع شده و «هو» خوانده می‌شود. اما در کلمه «فواکهُ» که «ه» ضمیر نیست همان ضمه خوانده می‌شود. مثال دیگر در این زمینه حروف مقطعه است که از قوانین کلی پیروی نمی‌کنند. جدول 2 نمونه‌ای از دنباله‌های آوایی تولیدشده را نشان می‌دهد.

جدول 2- نمونه دنباله آوایی آیات

پرونده:Capture195.jpg

2-2- تولید دنباله صامت و مصوت

هم‌زمان با تولید دنباله آوایی با توجه به صوتی که هر کاراکتر تولید می‌کند دنباله دیگری هم برای هر آیه تولید می‌کنیم که صامت‌ها و مصوت‌های تشکیل‌دهنده آیه را نشان می‌دهد. مثلاً حرف «ی» ممکن است یک مصوت بلند و یا یک صامت تولید نماید و یا حتی ممکن است هیچ آوایی تولید نکند. مصوت شامل دو نوع مصوت کوتاه و مصوت بلند می‌شود. صامت‌ها با حرفs و مصوت کوتاه با حرفk و مصوت بلند با حرفb مشخص شده‌اند. جدول 3 نمونه‌ای از رشته‌های تولیدشده را نشان می‌دهد.

جدول 3- نمونه دنباله‌های صامت و مصوت

پرونده:Capture196.jpg


2-3- تولید دنباله هجایی آیات از روی دنباله صامت و مصوت

در این مرحله برای هر آیه از ابتدای رشته صامت و مصوت آن شروع کرده و هجاهای تولید‌شده توسط دنباله مذکور با توجه به قوانین هجابندی استخراج می‌گردد. همان‌طور که قبلاً اشاره شد در زبان عربی پنج نوع هجا وجود دارد که در جدول 1 با ارقام ۱ تا ۵ مشخص شده است. نمونه دنباله هجاهای ایجادشده در جدول ۴ قابل مشاهده است. جدول4- نمونه دنباله هجایی ایجادشده

پرونده:Capture197.jpg

2-4- استخراج آیات و عبارات هم‌هجا:

کاری که تا اینجا انجام شد استخراج دنباله هجایی از روی آیات قرآن کریم است. حال به فرآیند دیگری نیاز داریم که بتوانیم برعکس این کار را نیز انجام دهیم؛ به‌گونه‌ای که با داشتن یک دنباله هجایی بتوانیم آیات و عباراتی را که با این دنباله هجایی منطبق می‌شوند، بیابیم. برای این منظور هنگام تولید دنباله هجایی، دنباله‌های کمکی دیگری نیز به‌موازات آن تولید می‌نماییم تا در فرآیند بازگشتی از آن استفاده شود. چالش دیگری که وجود دارد این است که هنگام انطباق دنباله هجایی با آیات و عبارات قرآن کریم بسیاری از انطباق‌ها از وسط کلمات انجام می‌گیرد؛ یعنی برای انطباق با یک دنباله هجایی خاص باید از وسط یک کلمه شروع به خواندن کنیم و یا وسط یک کلمه، خواندن عبارت پایان یابد. این‌گونه موارد به دلیل مطلوب نبودن، پالایش شده و تنها مواردی که از آغاز یک کلمه شروع و در پایان یک کلمه خاتمه می‌یابد به خروجی فرستاده می‌شود. برای فراهم نمودن دسترسی عموم به این ماژول، سامانه‌ای به این منظور طراحی شده و بر روی وب با آدرس http://ruya.ir/heja قرار گرفته است. در این سامانه می‌توان با مشخص نمودن یک دنباله هجایی دلخواه و یا مشخص نمودن یک آیه دلخواه از قرآن کریم، عباراتی را که دنباله هجایی یکسانی با آن دارند استخراج نمود. برای نمونه با انتخاب آیه دوم از سوره اول قرآن کریم، خروجی به شکل جدول شماره 5 به دست می‌آید.

جدول 5- خروجی ماژول یافتن عبارات هم‌هجا برای آیه 2 سوره 1

کد سوره آیه عبارت
332314 1 2 الرَّحْمَنِ الرَّحِيمِ
332314 2 119 عَنْ أَصْحَابِ الْجَحِیمِ
332314 2 216 أَنْتُمْ لا تَعْلَمُونَ‌.
332314 2 232 أَنْتُمْ لا تَعْلَمُونَ‌.
332314 2 272 أَنْتُمْ لَا تُظْلَمُونَ
332314 3 66 أَنْتُمْ لا تَعْلَمُونَ‌.
332314 5 58 قَوْمٌ لَا يَعْقِلُونَ.
332314 6 116 هُمْ إِلَّا يَخْرُصُونَ

3- نتيجه‌گیری

در این پژوهش با به‌کارگیری ظرفیت‌های رایانه در پردازش سریع و دقیق متن قرآن کریم توانستیم با هوشمندسازی سیستم، پیکره هجایی آیات قرآن را با دقت مناسبی تولید نماییم. پیکره دنباله هجایی آیات پس از چند مرحله تصحیح و رفع خطاهای موجود به کمترین میزان خطا رسیده است. برای اطمینان از دقت بالای این پیکره تعدادی از صفحات و سوره‌های قرآن کریم به‌طور تصادفی انتخاب شده و توسط متخصص انسانی مورد بررسی و تطبیق با پیکره مذکور قرار گرفته است. نتیجه کار، دقت بالای ۹۹ درصد را برای این پیکره نشان می‌دهد. بنابراین می‌تواند در بسیاری از پژوهش‌های قرآنی مرتبط با آهنگ و آوای قرآن کریم مورد استفاده قرار گیرد. امید است که این پژوهش مبنا و تسهیل‌گر پژوهش‌های آتی و مورد قبول حضرت حق واقع گردد.


پانویس و منابع


1. حسنی، حمید، عروض و قافیه عربی، تهران، انتشارات علمی و هنری، 1383

2. قدور، احمد محمد، مبادی اللسانیات، دمشق، دارالفکر، 1999

3. محمد، مناف مهدی، علم الاصوات اللغویه، بیروت، عالم الکتاب، 1998

4. نیک‌بین، نصرالله، اسلام از دیدگاه دانشمندان غرب، دورود، دفتر مذهبی سیمان فاریست،1292

5. نورالدین، عصام، علم الاصوات اللغویه(فونتیکا)، بیروت، دارالفکر اللبنانی، 1992

6. نظری، علیرضا، تحلیل مقایسه‌ای ساختار و قواعد هجا یا سیلاب در عربی و فارسی، ادب عرب، سال نهم شماره 2، 1396