سيڪشن: رسالا

ڪتاب: مهراڻ 01/ 2025ع

باب:

صفحو:7 

امر فياض ٻرڙو

 

 

 

 

 

سنڌي ورڊنيٽ سرشتو: ھڪ آئيندي ساز رٿا

 

تمھيد: دنيا جي سگهارين ٻولين ۾ ورڊ نيٽ (Word Net) هڪ جامع لغوي وسيلي طور سڃاتو ويندو آهي، جيڪو ان ٻوليءَ جي لفظن، انھن جي معنائن ۽ ٻولن جا ھڪٻئي سان لاڳاپا ڏيکاريندو آھي. ورڊنيٽ سرشتو ان ٻوليءَ جي لفظن، انھن جي ھم معنائن، ضدن، ۽ تصوراتي لاڳاپن کي ھڪ ھنڌ ڪٺو ڪرڻ ۽ ترتيب ڏيڻ ۾ مدد ڪندو آھي. يعني هي سرشتو لغوي وسيلن جي تخليق ۾ مددگار ٿيندو آهي. جيئن جسماني طور ھن ڪائنات ۾ سڀ شيون ھڪٻئي سان ڪنھن نه ڪنھن ناتي ڳنڍيل آھن، ائين ئي ٻولين جا لفظ پڻ ساڳي نسبت سان ھڪ نيٽورڪ جيان ڳنڍيل ٿيندا آھن ۽ ھي سرشتو ان ئي ڳانڍاپي کي عملي روپ ۾ ڏيکاريندو آھي.

ورڊنيٽ جو مرحليوار تعارف ۽ طريقيڪار:

1.      ٻوليءَ جا وياڪرڻي سڌارا: ورڊ نيٽ ذريعي  ٻوليءَ جي نرالن ٻولن جي بيھڪن، اچارن ۽ گرامر آڌار وڏين چُڪن جو سڌارو ممڪن ٿي ويندو آھي. جيئن ڪو ٻول اُچار آڌار نار (مادي) جنس جو تصور رکي ٿو پر ان جي فعلن کي نر وارن لفظن سان لکيو وڃي ته ھي سرشتو خودڪار نموني سان ليکڪ کي ٻڌائيندو ته ھتي فعل ڪھڙا استعمال ٿيندا. مثال: ڪو ماڻهو ائين چوي يا لکي ته: ”پٽڙيءَ تي ريل اچي رھيو آھي.“ ھاڻي اھو جملو جيئن ئي ورڊنيٽ سرشتي مان گذرندو ته اھو نشاندھي ڪري سگهندو ته ھن جملي ۾ لفظ ”ريل“ مونث جنس وارو ٻول آھي ان ڪري مٿيان فعل ”رھيو آھي“ نه پر ”رھي آھي“ درست ٻول آھن. [1]

جملن جي درست جوڙجڪ: اسان وٽ جديد ميڊيا جھڙوڪ ايف ايم، اليڪٽرانڪ ميڊيا کان ويندي سوشل ميڊيا ۾ پڻ گرامر آڌار سنڌي ٻوليءَ جي ضميري ٻولن کي بي تڪي نموني سان ورجايو پيو وڃي جھڙوڪ: ”اسان سندن جي خوشين ۾ شرڪت ڪئي“ ھاڻي ھن جملي ۾ گرامر جي ترڪيب ”ضمير + ضمير + ضمير + حرف جر + اسم + فعل“ ٿئي ٿي، جيڪا گرامر آڌار بلڪل درست ناھي. ھاڻي مٿيون جملو درست ڪري لکبو ته: ”اسان سندن خوشيءَ ۾ شرڪت ڪئي“. ان درست ٿيل جملي جي ترڪيب ٿيندي:  ”ضمير + ضمير + اسم + حرف جر + فعل“. ھاڻي ھي جملو گرامر جي نيمن ۽ اصولن آڌار بلڪل درست ٿيندو. سنڌي ورڊنيٽ ۾ درست ٿيل ھزارين جملن کي ”ھڪ ماڊل“ يا مثالي نمونا ڪري مشين کي اھڙي قسم جي تربيت ڏني ويندي جو اھا گرامر جي اصولن کي پڪو ڪندي ھڪ  پختو ”ماڊل“ ٺاھي رکندي آھي. جنھن سان اھا پروگرامنگ پوءِ متن جي چُڪن کي پڪڙي ٻڌائيندي آھي ته اھو جملو ڪھڙي نموني سان درست لکبو. مائڪروسوفٽ جي ”ايم ايس ورڊ“ يا جڳ مشھور پروگرام ”گرامرلِي“ ۾ اوھان جيڪڏھن انگريزي متن لکندي درست گرامر سان جملو نه لکيو ته اوھان جي لکيل جملي ھيٺان ھڪ سائي رنگ جي لڪير اچي ايندي آھي، دراصل اھا اوھان کي ٻڌائيندي آھي ته اوھان جملو درست ناھي لکيو، رڳو ايترو ئي نه پر اوھان جي ڏنل جملي کي مختلف نمونن سان درست ڪري پڻ اھو پروگرام ٻڌائيندو آھي، ته گرامر آڌار ھيئن جملا درست ٿيندا. سنڌي ورڊنيٽ سرشتو بلڪل ساڳي ئي نموني سان اوھان جي ڏنل جملن ۾ گرامر جي درستگي پڻ ڪري سگهندو.[2]

2.     ٻوليءَ جي خودڪار سمجهه: مصنوعي ذهانت ۽ قدرتي ٻولين جي مشيني سرشتن (نيچرل لئنگئيج پروسيسنگ) جي شعبن ۾، انساني ٻولين جي وسيلن جھڙوڪ: ٻول، ٻولن جا قانون، آوازي صورتون، لکت جي سمورين شڪلين وغيره جي موجودگي ضروري ھوندي آهي. ورڊ نيٽ سنڌي ٻوليءَ جي ٻولن ۽ جملن جي سمجهڻ ۾ مدد ڪندو، جيڪو عمل اڳتي ھلي مشيني خودڪار ترجمن اندر ٻولن جي لکت وارين درستگين سميت سنئون سڌو انگريزيءَ کان سواءِ ٻين ٻولين جي بڻياد ۾ ساڳيو تاڃي پيٽو ڏسي سنڌي ٻوليءَ کي ٻين ٻولين ۾ ترجمو ڪرڻ لائق بڻائيندو. اھو ائين سمجهجي ته جيئن اڄ جي زماني ۾ اوھان سعودي ريال کي پاڪستاني رپئي سان سنئون سڌو ڀيٽي نه ٿا سگهو، پر ڊالر کي وچ ۾ آڻڻو پوندو آھي، بلڪل ائين ئي اڄوڪي مشيني ترجمن ۾ سنڌي ٻوليءَ کي اردو ٻوليءَ ۾ سنئون سڌو ترجمو ڪري ڏسو ته اوھان کي ان ڪيل ترجمي ۾ گهڻيون ئي چُڪون ملنديون، پر جيڪڏھن سنڌيءَ کي انگريزي ۽ وري بعد ۾ ان ترجمي ڪيل انگريزي متن کي اردوءَ ۾ ترجمو ڪري ڏسبو آھي، ته گهڻو ڪري سنڌيءَ کان اردوءَ ۾ سنئين سڌي ڪيل ترجمي کان بھتر ترجمو ملندو آھي. ان جو سبب اھو به آھي ته انگريزي ٻوليءَ جو ورڊنيٽ سرشتو مضبوط نموني سان 1986 ۾ ٺاھيو ويو ھو، جنھن مان اڄ پوري دنيا لاڀ وٺي رھي آھي ۽ ھيڏانھن وري اردو ٻوليءَ جو ھڪ ورڊنيٽ سرشتو لاھور جي اداري ”سينٽر آف لئنگئيج انجنيئرنگ“ ٺاھيو ته آھي، پر انتھائي محدود يعني رڳو ڇھ ھزار لفظن تي مشتمل، سو به مفت ۾ ناھي رکيو. جڏھن ته سنڌيءَ جو ورڊنيٽ سرشتو اجهو ھاڻي ٺھي رھيو آھي. سو ھاڻي ٺھندڙ سنڌي ورڊ نيٽ اوھان جي ڏنل متن کي مصنوعي ذھانت آڌار بلڪل انساني دماغ جيان تجزيو پڻ ڪري سگهندو ۽ پنھنجي ٻين ڪمپيوٽيشنل ۽ روباٽڪ سرشتن کي پڻ ھٿي ڏيندو. [3]

3.     دنيا جھان ۾ سنڌي ٻوليءَ جي موجودگي: ورڊ نيٽ جي ٺھڻ سان سنڌي ٻوليءَ جا لفظ ۽ انھن جا هم معنيٰ لفظ ڊجيٽل دنيا جي مختلف سرشتن ۾ پنھنجي قد ڪاٺ سان موجود  هوندا، جنھن ڪري سنڌي ٻوليءَ جي تعليم ۽ تحقيق ۾ بھتر نموني سان مدد ملندي. هيءُ وسيلو ٻوليءَ تي ڪم ڪندڙ محققن لاءِ ئي نه پر ھڙني شعبن جي اسڪالرن، استادن، ۽ شاگردن لاءِ دنيا جي ھر ھنڌ ۽ ھر وقت دستياب ٿيندو، جنھن سان ٻوليءَ جي تعليم ۽ واڌارن ۾ نواڻ اچي سگهندي.

سنڌي ورڊ نيٽ جوڙڻ جو پس منظر:

سن 1987ع ۾ جڏھن سنڌي ڪمپيوٽنگ جي بانيڪار عبدالماجد ڀرڳڙيءَ ڪمپيوٽر کي ان لائق بڻايو جو اھو سنڌي اکرن کي پنھنجي سرشتي ۾ آڻي اکرن، لفظن ۽ جملن کي ساڳي ئي شڪل جيان پرنٽر مان پرنٽ ڪري سگهيو ۽ اِھا سنڌي ڪمپوزنگ، پرنٽنگ ۽ ڊگهن ۽ ڏکين ڪوڊن تي ٻڌل سنڌي لکت وري انٽرنيٽ جي برائوزرن تي ڏسي سگهبي ھئي، جو ڪجهه ئي سالن کانپوءِ سڄي دنيا جي اکر پٽين (الفابيٽ) کي جدا جدا ڪوڊ ڏيئي سڃاڻپ ڏيندڙ ”يونيڪوڊ“ اداري سنڌي ٻوليءَ جي انھن اکرن جيڪي عربيءَ جي الفابيت ۾ نه ھئا جھڙوڪ: ڇ، ڏ، ڱ وغيره تن  کي به جدا ڪوڊ ڏئي ڇڏيو، وري ھوڏانھن انٽرنيشنل اسٽينڊرڊ آرگنائيزيشن (ISO) ۾ سنڌي ٻوليءَ کي ھنن ٻن اکرن سان (sd) ۽ ٽن اکرن تي مشتمل (snd) تعارفي ڪوڊ الاٽ ڪيو ويو. يعني ھاڻي پوري دنيا ۾ ٻولين جي ڪمپيوٽيشنل سرشتن ۾ جتي جتي ”ايس ڊِي يا ايسِ اينِ ڊِي“ اچي ته ڪمپيوٽنگ جي سافٽ ويئر يا پروگرام کان ويندي جديد دؤر ۾ راڄ ڪندڙ روباٽڪس ۽ مصنوعي ذھانت وارا ھڙئي سرشتا سمجهي ويندا ته اھي ڪوڊ سنڌي ٻوليءَ کي پڌرو ڪن ٿا. يونيڪوڊ ۾ جيئن ئي سنڌي ٻولي آئي ته پوري دنيا جي ڪمپيوٽرن وارن آپريٽنگ سرشتن ۾ سنڌي ٻوليءَ جي ھاڪ ٿيڻ لڳي. مٿان وري جو سمارٽ فونن جن جي اسڪرين ۾ ئي ڪيبورڊ ھلڻ لڳو ته اڃا ھڪ وڏو انقلاب اچي ويو. ھاڻي دنيا جي ھڙني ٻولين جن جون لکتون ھيون سي سمارٽ ٽيڪنالاجيءَ ۾ ظاھر ٿيڻ لڳيون. 2015ع ۾ وري موبائل ٽيڪنالاجيءَ ۾ ”سُويفٽ ڪِي“ نالي سان ھڪ جڳ مشھور ڪيبورڊ پڌرو ٿيو، جنھن جي ھڪ اھم خاصيت اھا ھوندي ھئي جو ڪيبورڊ ھلائيندڙ انگريزيءَ جو ھڪ لفظ لکندو ھو، ته ڪيبورڊ جي مٿين پٽيءَ ۾ ٻيا اڳڪٿيا لفظ پاڻمرادو اچي ويندا ھئا. مثال: جيڪڏھن ڪيبورڊ ۾ انگريزي لفظ ”ھائُو“ يعني ”ايڇ او ڊبليو“ ٽائيپ ڪري، جيئن ئي وِٿي ڏني ويندي ھُئِي ته مٿين پٽيءَ تي اھڙا ٽي ٻول پاڻمرادو اچڻ شروع ٿي ويندا ھئا، جيڪي اِن ”ھائُو“ کان پوءِ گهڻو ڪري انگريزي ٻوليءَ ۾ استعمال ٿيندا آھن جھڙوڪ: ”آر“ ٻيو ”ٽُو“ ۽ ٽيون ”مينِي“. ساڳيءَ ئي ريت وري ان ڪيبورڊ ۾ انگريزي ٻوليءَ جو بھترين ”ھِجي تپاسڻو“ (اسپيل چيڪر) پڻ اڳواٽ رکيل ھو جو ٽائيپ ڪندڙ جيڪڏھن ڪنھن لفظ جي ھِجي (اسپيل) غلط ٽائيپ ڪندو ھو ته اھو ڪيبورڊ کيس درست ھِجي ٻڌائيندو ھو.

ھي اُھي ئي ڏينھن ھئا جڏھن اسان سنڌي ٻولي اختياريءَ ۾ ٽن- ٽن مھينن جي ڪانٽريڪٽ تي ڪم ڪنداھئاسين ۽ ڪم اھو ئي ھوندو ھو، ته سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ جي مختلف سرشتن ۾ ڪيئن آڻي سگهجي ٿو. ان ئي سلسلي ۾ اسان ان جڳ مشھور جادوئي ڪيبورڊ ٺاھڻ واري اداري سان لھه وِچڙ ڪري، کين سندن اڳڪٿ سرشتي ۾ سنڌي ٻولي آڻڻ لاءِ پنھنجون خدمتون آڇي ڇڏيون. ڪجهه ئي مھينن ۾ ان اداري پنھنجي رضا ڏيکاري، جنھن کانپوءِ اسان سنڌي ٻوليءَ جي لکت جو تاڃي پيٽو، ٻٽن ٻولن جي ڊگهي قطار، گهڻي کان گهڻا استعمال ٿيندڙ لفظ ڪٺو ڪري سنڌي ٻوليءَ جو ھڪ ننڍڙو لفظي ڀنڊار/ڪارپس ٺاھي کين موڪليو ويو، جيڪو ڪافي تجربن بعد آخرڪار ان جادوئي ڪيبورڊ ”سُويفٽ ڪِي“ ۾ سنڌي ٻوليءَ کي داخل ڪرڻ ۾ اھم سنگ ميل ثابت ٿيو. [4] ان ڪارپس ۾ جيڪو سنڌي مواد اسان سھيڙيو ھئوسين ان جي ترتيب ڪجهه ھن طرح ھئي:

1.      لاڪنائن (اعرابن) سميت سنڌي الفابيٽ

2.     سنڌي ٻولي اختياريءَ پاران شايع ڪيل اٺ لغتون

3.     ڪلياڻ آڏواڻيءَ جو ترتيب ڏنل شاهه جو رسالو (اعرابن ۽ بغير اعرابن سان جدا جدا ڪري)

4.     سنڌي چوڻيون، پھاڪا جيڪي ڦلواڙي ڪتاب مان مليا.

5.     سنڌي ٻوليءَ جو ڪارپس (هڪ لک پنج هزار لفظن تي مشتمل، جنھن ۾ مشھور شخصيتن جا نالا ۽ ذاتيون پڻ موجود ھيون.)

6.     سنڌي مشھور شخصيتن جا ھڪ ھزار کان مٿي نالا

7.     سنڌي ٻٽن لفظن جو ذخيرو

 

سنڌي ٻوليءَ جي ھن ڪارپس کي اھڙي نموني سان جوڙي ان بين الاقوامي اداري ڏانھن موڪليو ويو ھو، جو جڏھن سنڌي ٻولي ان جادوئي ڪيبورڊ ۾ اچي وئي، تڏھن ان جي مکيه مينيجر جولين بالِيءَ پنھنجي اي ميل ۾ ٻڌايو ته سنڌي ٻوليءَ جي بيھڪ  دنيا جي ٻين وڏين ٻولين جي ڀيٽ ۾ ڪنھن به ريت ڪا ھيڻي نه آھي.

ھُن صاحب وڌيڪ اڳڀرو ٿي دنيا تي راڄ ڪندڙ مصنوعي ذھانت جي ايندڙ سرشتن ۾ داخل ٿيڻ لاءِ صلاح ڏني ته جيترو به جلد ممڪن ٿي سگهي، سنڌي ٻوليءَ جي ”ورڊنيٽ“ سرشتي تي ڪم ڪريو، جيڪو سنڌي ٻوليءَ جي آئيندي کي مڪمل طور محفوظ ڪري ڇڏيندو.

ساڳئي ئي سلسلي جي ھڪ ڪڙيءَ آڌار، ”الخوارزمي انسٽيٽيوٽ آف ڪمپيوٽر سائنس، يونيورسٽي آف انجنيئرنگ اينڊ ٽيڪنالاجي لاھور اندر  قائم  اداري ”سينٽر آف لئنگئيج انجنيئرنگ“ پاران 2017ع ۾ پاڪستاني ٻولين جي ڊجيٽل دنيا ۾ موجودگيءَ تي ھڪ اھم ڪانفرنس ٿي ھئي، جنھن ۾ ان اداري جي سربراھ ڊاڪٽر سرمد حسين سان ھڪ علمي ويھڪ ڪري اهو محسوس ڪيو ويو، ته سنڌي ٻوليءَ جي آئيندي ۽ ان کي مصنوعي ذھانت جي پروگرامن ۾ پنھنجي قد، بت ۽ پوري سگهه سان داخل ڪرڻ لاءِ تمام ڳوڙهي حڪمت عملي ڪرڻي پوندي، جنھن ۾ وڏي لاڳت ۽ بي لوڀ ساٿين جي ضرورت آھي، جيڪي نه صرف سنڌي ٻوليءَ جي نزاڪت جا واقف ھجن پر ٿورو گهڻو ڪمپيوٽنگ جي باري ۾ به ڄاڻ رکندڙ ھجن. ھتي اھا به ڳالهه ضروري آھي ته اسان جي يونيورسٽين مان سنڌي ڪمپيوٽنگ يا ٻوليءَ جي انجڻڪاريءَ تي ڪا به اهڙي جامع رٿا نه ملي، جيڪا عام لوڪ تائين پھچي ڪو لاڀ ڏئي سگهي ھجي. ھيڪڙ ٻيڪڙ ڪو پروجيڪٽ شروع به ٿيو ته اھو پراڻي مدي خارج پروگرام تي ٿيو، جيڪو ان وقت 18-2017ع جي جديد گهرجن آڌار تي پورو نه پئي لٿو. ڏئي وٺي سنڌي ٻولي اختياريءَ کان سواءِ سنڌ سلامت فورم پاران ڪجهه پروجيڪٽ متعارف ڪرايا ھئا، پر اھي به ٻوليءَ جي انجڻڪاريءَ کان وڌيڪ سنڌي مواد کي آن لائين دستيابيءَ تي ٻڌل ھئا. سنڌي ٻولي اختياريءَ پاران اسان نه صرف سويفٽ ڪيبورڊ ۾ سنڌي آڻڻ لاءِ ٽيڪنيڪل مواد جي سھيڙ ۽ ان جي پروگرامنگ ڪري رھيا ھئاسين، پر اٽي ۾ لوڻ برابر سيڙپ تي سنڌي ٻوليءَ ۾ پھريون ڀيرو سنڌي اکر شناس جنھن کي ”آپٽيڪل ڪريڪٽر رڪگنائيزر“ (او سِي آر) پڻ عام لوڪ جي استعمال ڪرڻ لاءِ آن لائين ڪرڻ ۾ مصروف ھئاسين، جو مائڪروسوفٽ ۽ سنڌي ڪمپيوٽنگ جي بانيڪار عبدالماجد ڀرڳڙي صاحب پاران سنڌي ٻوليءَ جي پوري ڪارپس جي گُهر ٿي. جنھن تي ٽن سالن کان پوءِ اسان ڪم ڪرڻ شروع ڪيو. دير سان ڪم ڪرڻ جو سبب سنڌ حڪومت جي ثقافت ۽ سياحت کاتي پاران نئين اداري ”عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ“ جو قيام ۽ دفتري مامرا وچ ۾ اچي ويا ھئا. ٻيو سبب ته سنڌي ڪارپس تي سنجيده ۽ ثابت قدم ڪارڪنن جي کوٽ پڻ ھئي. اھو ڪارپس جيڪو اڳتي ھلي ”سنڌي ورڊنيٽ“ جو ٻج ثابت پئي ٿيو، تنھن جي سھيڙ 2021ع کان باقاعده نموني سان شروع ٿي.

ھاڻي سڀ کان پھريون ته ھي سنڌي ٻولياتي ڳنڍڻي وارو سرشتو ”سنڌي ورڊنيٽ“ جيڪو انگريزي ٻوليءَ جي ٻن لفظن ”ورڊ“ معنيٰ لفظ ۽ ”نيٽ“ جيڪو نيٽورڪ لفظ جو اڌ کنيل لفظ آھي، ان کي سمجهڻ گهرجي ته ھي سرشتو ڇا آھي ۽ ان جي ٺھڻ سان سنڌي ٻوليءَ جي جديد گهرجن آڌار ڪھڙا فائدا ٿي سگهندا؟ سو اچو ته ھن انتھائي تڪنيڪي ۽ ڳوڙهي سرشتي ۽ ان جي طريقيڪار کي سمجهون، ته آخر ڊيٽا سان ڳُتيل ھن سرشتي جنھن کي ٺيٺ سنڌيءَ ۾ ”سنڌي ٻوليءَ جي ڪمپيوٽيشنل ترقيءَ لاءِ سنڌي ٻولياتي ڳنڍڻو يعني (سنڌي ورڊنيٽ) جو نالو ئي ڏِجي ٿو، سو ان جي ڪيتري اهميت ۽ ڪھڙي ضرورت آھي؟ انھن سوالن جي جوابن لاءِ اسان مرحليوار بحث ڪنداسين:

 

 

 

 

 

 

 

 

 

 

(شڪل: انگريزي ورڊنيٽ جو ھڪ ماڊل)

 

سنڌي ورڊ نيٽ جُڙڻ ڇو ضروري آهي:

سنڌي ورڊنيٽ سرشتي کي ٺاھڻ، دنيا جي ٻين ٻولين جيان رڳو اھم ئي نه پر تمام گهڻو ضروري ان ڪري آھي، جو سنڌي ٻوليءَ ۾ ڪي خاصيتون اھڙيون آھن، جيڪي ھتي ايشيائي ٻولين ۾ ورلي ملن پيون. جھڙوڪ سنڌي ٻوليءَ جا سڀ آواز متحرڪ ٿيندا آھن. ھر لفظ جو آخري آواز متحرڪ ڪري ان ٻول جو نه صرف انگ ٻڌايو ويندو آھي پر ان جي جنس پڻ پڌري ٿيندي آھي. ان ڪري سنڌي ٻوليءَ ۾ ورڊنيٽ دنيا جي ٻين ٻولين جي ڀيٽ ۾ ڪجهه وڌيڪ اھم آھي. جنھن جي ٺھڻ کان پوءِ سنڌي ٻوليءَ جي ڪمپيوٽيشنل پروسسنگ ۾ پنھنجي ھڏ ڪاٺ سميت بيھڪ بڻائڻ لاءِ ھيٺيان مقصد سامهون رکيا ويا آھن:

1.      ٻوليءَ جي پروسيسنگ ۾ بھتري: ورڊ نيٽ سنڌي ٻوليءَ کي ڪمپيوٽنگ جي سرشتن ۾ بھتر نموني سان سمجهڻ ۽ پروسيس ڪرڻ جي قابل بڻائيندو. هيءُ خاص طور تي روباٽڪس ۽ مصنوعي ذهانت ۾ استعمال ٿيندڙ سرشتن لاءِ فائديمند ثابت ٿيندو، جتي جتي خودڪار مشينن کي انساني ٻوليءَ جي سمجهه ۽ ان آڌار مشيني ڪرت اهم ليکي ويندي آھي. مثال ڪھڙي ٻوليءَ ۾ ڪھڙو ٻول زندگيءَ جي ڪھڙي مقصد يا مزاج لاءِ ڪتب ايندو آھي، سو جيئن آئيندي ۾ مصنوعي ذھانت آڌار روباٽ سنڌي ٻوليءَ کي ان ئي رِيت پنھنجي سرشتن ۾ آڻين جيئن انسان ان ٻوليءَ کي ڳالهائيندا ۽ ڪتب آڻيندا آھن.

2.     سنڌي ٻوليءَ ۾ گفتگو ڪندڙ روباٽس: ورڊ نيٽ جي مدد سان اهڙا روباٽ ۽ پاڻمرادو يعني خودڪار سرشتا ٺاهي سگهجن ٿا جيڪي سنڌي ٻوليءَ ۾ گفتگو ڪري سگهن. اهي روباٽ ۽ مصنوعي ذھانت جا سرشتا، تعليمي ادارن، سرڪاري دفترن، ۽ عوامي جڳھن تي مددگار ثابت ٿيندا.

3.     مصنوعي ذهانت ۽ سنڌي ٻولي: مصنوعي ذهانت ۾ سنڌي ٻوليءَ جي پروسيسنگ جي صلاحيت وڌڻ سان، سنڌي ٻوليءَ ۾ مشين سان ڳالهه ٻولهه جيڪا وري اوھان سان سنڌيءَ ۾ ئي پڻ جوابيندي، ائين مشيني خودڪار ترجما بھترين ٿيندا ۽ مصنوعي ذهانت جي مختلف پروگرامن ۾ سنڌي ٻولي بھتر نموني سان ڪتب ايندي ۽ تحقيق جا انيڪ نوان دروازا کلي سگهندا.

4.     سماجي ۽ ثقافتي تحفظ: سنڌي ورڊ نيٽ سرشتو، ڪمپيوٽيشنل ٻوليءَ جي ترقي، سنڌي ٻوليءَ جي سماجي ۽ ثقافتي ورثي جي حفاظت ۾ پڻ اهم ڪردار ادا ڪري سگهي ٿو. هن سرشتي جي مدد سان، سنڌي ٻوليءَ جا تاريخي، ادبي ۽ ثقافتي متن سنڌي اکر شناس (OCR) بھتر کان بھترين ٺاھي ڊجيٽل فارم ۾ محفوظ ڪري سگهجن ٿا.

5.     لاڪنائن (اعرابن) جي نه ھجڻ وارو مسئلو: اسان جي مشاھدي ۾ اھو آيو ته سنڌي ٻوليءَ جي لکتن ۾ نوانوي سيڪڙو بغير لاڪنائن سان مواد ملي ٿو، توڙي جو سنڌي ٻوليءَ ۾ ڳالهايل ٻول پنھنجي آخري آواز ۾ متحرڪ ٿين ٿا (جيڪا خاصيت سنڌي ٻوليءَ کي ايشيا ۾ گهڻو نرالو ڪري ٿي)، جنھن ۾ اسان آخري آواز کي زير يا زبر ڏئي ان ٻول کي ”مادِي جنس“ ۽ پيش جو سر ڏئي ”نر جنس“ طور ٻڌائيندا آھيون، ساڳي ئي ريت وري ”پيش“ تي ختم ٿيندڙ ”اسم“ ٻول وري ”زبر“ ڏئي انھن جو جمع انگ پڻ ٺاھيو ويندو آھي. جيئن ”ڪِتابُ“ يعني ”ھڪ ڪتابُ“، پر جيڪڏھن ٻول آھي ”ڪتابَ“ ھاڻي ھتي ٻه يا ٻن کان گهڻا ڪتابَ طور ٻڌايا ويا آھن. ھاڻي جيڪڏھن اسان وٽ بغير لاڪنائن جي ھڪ جملو آھي ”مون وٽ کوڙ سارا ڪتاب آھن.“ ته جيڪڏھن ورڊنيٽ سرشتو اتي ڪم ڪري ته مشين کي اھو سمجهائي سگهي ٿو، ته ڇوته ڪتاب کان پوءِ ”آھن“ فعل آھي جيڪو جمع طور اسمن جي ھجڻ لاءِ ڪتب ايندو آھي ته ھتي ڪتاب کي ”ڪِتابَ“ طور پڙهيو وڃي. ھن قسم جھڙيون مشيني ٽرينگون ”ورڊنيٽ“ سرشتي جي ڪري ٿي سگهن ٿيون.

6.     سنڌي ٻوليءَ جا اوائلي ٻول ھٿ ڪرڻ: پوري دنيا ۾ اوائلي ٻولين ۽ انھن جي پيڙهين تي ڪم ڪندڙ ماھرن جي ھڪ گهڻائي ان ڳالهه تي ھڪ آواز آھي ته ھزارين سال اڳ ھڪ ٻولي ”پروٽو انڊو“ نالي سان ھوندي ھئي، جنھن مان انگريزيءَ سميت دنيا جھان جون سوين ٻوليون نسري وڌيون. پوري دنيا ۾ لفظ ”اِنڊو“ پڻ اھو ئي سمجهيو ويو آھي ته اھو اصل ۾ ”سِنڌو“ ئي آھي جنھن کي ھزارين سال اڳ فارسين ”ھِندو“ ۽ يونانين ”اِنڊو“ ڪري ڪوٺيو ھو. ھڪ پاسي اھو سوچيو پيو وڃي ته ٻئي پاسي وري، سنڌي ٻوليءَ تي اسان وٽ انيڪ خيال ۽ نظريا آھن جن ۾ ڪي ھن ٻوليءَ کي يارھينءَ صديءَ جي پيداوار مڃين ٿا ته ڪي محقق وري، ان کي سنسڪرت ڄائي سمجهن ٿا. ڪي آڱرين تي ڳڻڻ جيترا محقق آھن جيڪي وري سنڌي ٻوليءَ کي انتھائي اوائلي ٻولي سمجهن ٿا، ايستائين جو سنسڪرت پڻ سنڌيءَ جي ڄائي سمجهن ٿا. ورڊنيٽ سرشتي جو بڻياد سنڌي ٻوليءَ جي نرالن ٻولين ۽ انھن جي لاڳاپن کي چٽو ڪري پيش ڪري سگهي ٿو، ته ڪيئن سنڌي ٻول جڙن ٿا ۽ ھڪ ٻول ٻين ٻولن کي ڪھڙي نموني سان مضبوط اصولن آڌار جوڙي ٿو. اھي اصول دنيا جي ٻين ڪھڙين ٻولن ۾ موجود آھن، جيڪڏھن آھن ته انھن جا ڪھڙا فارمولا آھن وغيره جھڙن سوالن جا جواب ھٿ ڪري ڏئي سگهي ٿو، جنھن سبب سنڌي ٻوليءَ جي ڌات ٻولن ۽ مٿين نظرين مان اصل نظريي کي ثابت ڪرڻ لاءِ دليل مھيا ڪري سگهي ٿو.

ورڊ نيٽ سرشتي جي تخليق سان سنڌي ٻولي نه صرف جديد ٽيڪنالاجي ۾ قابل بڻجي سگهندي، پر ان سان گڏوگڏ ٻوليءَ جي مستقبل جي ترقيءَ ۽ بقاءَ لاءِ پڻ اهم قدم کڻي سگهجن ٿا.

ھِن سرشتي جي ايڏي وسيع اھميت سمجهندي سنڌ حڪومت جي ثقافت ۽ سياحت کاتي پاران قائم ڪيل سنڌي ٻوليءَ کي جديد تقاضائن آڌار ۽ دنيا جي آسودين ٻولين سان گڏ ڪلھو ڪلھي سان گڏ بيھارڻ لاءِ قائم ڪيل اداري ”عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ حيدرآباد“ ۾ ھِي انتھائي اھم پروجيڪٽ شروع ڪيو ويو آھي. جنھن لاءِ ھڪ ڳوڙهي حڪمت عملي ٺاھي، ھيٺيان مرحليوار ڪم ، اداري جي ڊائريڪٽر امر فياض ٻرڙي جي نگرانيءَ ۾ سِٽيا ويا آھن. [5]

1.      سنڌي ٻوليءَ جو مواد جوڙڻ: ڇوته ڪنھن به کليل ذريعي (اوپن سورس) تي سنڌي ٻوليءَ جو لفظي بوتو (ڪارپس) موجود نه ھو، ان ڪري سڀ کان پھريون انٽرنيٽ تي دستياب سنڌي ٻوليءَ جي ھر ممڪن ذريعو ڊائون لوڊ ڪيو ويو جن ۾ اخبارن جو اھي ويبسائيٽون جيڪي ٽيڪسٽ بيسڊ ھيون جيئن روزاني پنھنجي اخبار، عوامي آواز وغيره، ڀرڳڙي ڊاٽ ڪام، سنڌ سلامت، سنڌي ادبي بورڊ تي رکيل ڪتاب، سنڌي ٻولي اختياريءَ جا ڪتاب، ڀٽائيپيڊيا سان گڏ سوشل ميڊيا جھڙوڪ: فيسبڪ ۽ ٽويٽر وغيره جو اسڪريپ ڊيٽا لاٿو ويو. اسان وٽ ائين ڪرڻ سان سنڌي ٻوليءَ جا ڪروڙين لفظ ملي ويا جن کي مختلف طريقن سان لاھي ھٿيڪو ڪرڻ ۾ لڳ ڀڳ ڇھه مھينا لڳي ويا.

2.     ڪارپس جوڙڻ: مٿيون ڏاڪو ھو ان ڊيٽا کي جائيتو ڪري ھاڻي ھڪ ڪرڻ جو، جنھن لاءِ بھترين ڪمپيوٽر مشينون استعمال ڪيون ويون، جن جي مدد سان مٿين ڀنڊار کي ھڪ منظم سرشتي آڌار اھڙي نموني سان ٽيبل تي سيڌيو ويو جو ”مفرد لفظ“ جدا ڪري انھن آڏو جيترا ڀيرا اھي استعمال ٿيل مليا ته اھو انگ رکيو ويو. ھاڻي اسان وٽ ڪروڙين لفظن مان سوڌ ڪري مفرد لفظ ھڪ لک ڇاونجاھ ھزار جي انگ ۾ مليا. ان انگ مان اسان کي اھا به خبر پئي ته سنڌي ليکن ۾ ڪھڙا لفظ گهڻي کان گهڻا ۽ گهٽ ۾ گهٽ ورجايا وڃن ٿا.

3.     ٻولن جي ترڪيبڪاري: لفظن جي ھن ذخيري ۾ ڊيٽابيس جي ٽيبل ٺاھي ھاڻي داخلا ڪرڻ جو اھڙو ھڪ سرشتو جوڙيو ويو، جنھن ۾ مٿين ذخيري مان ھڪ ھڪ لفظ خودڪار نموني سان کڄي اچي ٿو ۽ ھن سرشتي تي ڪم ڪندڙ ڪارڪن ان ٻول جي گرامر جي ترڪيب، ان جو تز نالو يا وسيع نالو (وسيع نالي گل جو تز نالو ٿيندو گلاب)، ان ٻول جي جنس، ان جھڙا ھم معنيٰ وارا لفظ، جيڪڏھن ڪو ٻول فعل آھي ته ان جو زمان، عددي حساب سان واحد يا جمع ۽ ان ٻول جو ذمرو چونڊيو وڃي ٿو ته ھي ٻول جمادات ۾ اچي ٿو يا حيوانات ۾، حيوانات ۾ ڪھڙي زمري ۾ جيئن انساني، جانوراڻي، جهنگلي يا پالتو، پکي يا جيت وغيره جي چونڊ ٿئي ٿي جنھن سان ھڪ وسيع ۽ جامع ڊيٽاسيٽ ٺھندو پيو وڃي.

 

 

 

 

 

(سنڌي ورڊنيٽ اندر لفظ گلاب جو ھڪ ماڊل)

 

 

ٻوليءَ جو گردان ساز: ھاڻي ھڪ اھڙو خودڪار سرشتو  نالي  گردان ساز جوڙيو ويو آھي، جنھن ۾ ھر فعل جي گردانن ٺاھڻ جو سرشتو اڳواٽ طئي ڪيل آھي. ھن سرشتي کي اسان ”گردان ٺاھڻي“ جو نالو ڏنو آھي، جيڪو فعل جي ھر ٻول جي ”امر“ ۽ ”مصدر“ واري شڪل سمجهي پوءِ اھو سرشتو سوين گردان پاڻمرادو ٺاھي سگهي ٿو، جنھن جو لئنگئيج ماڊل پڻ اڳواٽ ئي مليل ڊيٽا مان ٺاھيو ويو آھي. ھي سرشتو سنڌي ٻوليءَ جي مٿين ذڪر ڪيل”ڀنڊار“ مان سترھن ھزار کان مٿي مليل مصدرن جون پاڻمرادو ڦيرا ٺاھي اسان کي سنڌي ٻول ٺاھي ڏئي ٿو. جھڙوڪ: سنڌي مصدر ”مَارڻُ“ جي ھڪ شڪل ”مارائيندِيمانسِ“ ملي ٿو ته ان جا پھريان ٻه اکر ”ڌات“ جدا ٿيندا. ھاڻي ساڳي ئي نموني سان جيڪڏھن اسان ھڪ ٻيو مصدر ”چَوَڻُ“ چونڊيون ٿا ته ان ۾ ”ڌات“ اکرن سان گڏ ”ڻ“ اکر کي ڪٽي ھي سرشتو خودڪار نموني سان ٺاھيندو ”چَوِرائيندِيمانسِ“ ۽ اھڙي نموني سان مٿين مصدرن جي ھزارين انگن جا ڦيرا جھڙوڪ: لکرائيندِيمانسِ، کارائيندِيمانسِ، ڪڍرائيندِيمانسِ، ڇڏرائيندِيمانس وغيره پاڻمرادو ٺاھيندو وڃي ٿو. (ھتي ھڪ شيءِ اھم آھي ته ھر امر ۽ مصدر جا ساڳيا ڦيرا ممڪن ناھن ان ڪري اتي گردان ٺاھڻي سرشتي کي ڪجهه اصول اڳواٽ طئي ڪري به ڏنا ويا آھن، ته ھرھڪ امر يا مصدر جا ساڳئي نموني جا ڦيرا ناھن ٿيندا. مثال طور: ھڪ امر آھي ”اَچُ“ جنھن جو مصدر ٿئي ٿو ”اچَڻُ“ ته مٿين قانون ۾ اھو ”اچرائيندِيمانسِ“ بلڪل به درست نه ٿيندو.[6]

 

 

 

 

 

 

 

 

 

 

 

1.      مشيني تربيت: جڏھن سنڌي ٻوليءَ جي مٿين ڊيٽا پنجاھ سيڪڙو کان مٿي چڙهڻ لڳندي ۽ لڳ ڀڳ ويھ ھزار کن معياري ھاڪاري، انڪاري، سوالي، ٽنهي زمانن سميت گردان وارا جملا چونڊي ڇڏبا، تڏھن عام ڪمپيوٽرن کان ويھوڻا ڀيرا مٿي  چست ۽ انتھائي تيز رفتار پروفيشنل ڪمپيوٽرن جي مدد سان ”اُونِهي سِکيا“ (جنھن کي ڪمپيوٽر سائنس جي دنيا ۾ ”ڊِيپ لرننگ“ جو نالو ڏنو وڃي ٿو) اُن مشيني سکيا جو عمل ٿيندو. جنھن جِي اُپت سنڌي ٻوليءَ جي ھڪ وڏي ماڊل جي شڪل ۾ ملندي جيڪا اسان مصنوعي ذھانتن جي مختلف سرشتن سميت، کليل ذريعن (اوپن سورس) جي بين الاقوامي سرشتن تي ڏينداسين. جيڪي وري سنڌي ٻوليءَ کي مصنوعي ذھانتن جي سڀني سرشتن ۾ پاڻمرادو داخل ڪندا ويندا.

2.     سنڌي ورڊنيٽ سرشتي جو مجموعي لاڀ:

·       اسان کي نه صرف گوگل ترجميڪاري، پر چيٽ جي پي ٽي، گوگل جيمني، روباٽڪس انجنيئرنگ سميت مصنوعي ذھانتن ۾ سنڌي ٻوليءَ جو ھڪ معياري تاڃي پيٽو ڪم ڪندي نظر ايندو پر اسان جي يونيورسٽين ۾ ڪمپيوٽر سائنس، آئي ٽي ۽ سنڌي ڊپارٽمينٽن ۾ مختلف پروجيڪٽ ٺاھيندڙ شاگردن لاءِ ھڪ ٺھيو ٺڪيو ماڊل پڻ ملي ويندو جنھن کي ھو وري نون خيالن، نرالن پروجيڪٽن ۾ استعمال ڪري سگهندا، پر ان ماڊل کي اڃا بھتر بنائڻ لاءِ اڳرو ڪردار ادا ڪري سگهندا.

·       فيسبڪ سميت ٽويٽر ۽ اھڙا مائڪرو بلاگنگ جا پليٽ فارم وري سنڌي ڪارپس ۽ مليل ماڊل کي استعمال ڪندي پنھنجي لوڪلائيزيشن ۾ پڻ استعمال ڪري سگهندا. يونيورسل ڊپيڊينسي جھڙا ڪنسورشيم وري اسان جي ڊيٽا جيڪا لکن جي مقدار ۾ ملندي، اھا استعمال ڪندي سنڌي ٻوليءَ کي پنھنجي کليل ذريعن واري سٿ ۾ شامل ڪري ڇڏيندا.

·       دنيا جھان ۾ ڪم ڪندڙ مختلف ڪمپنيون سنڌي ورڊنيٽ ڊيٽا کي استعمال ڪري پنھنجي گراھڪن کي سنڌي ٻولي به ٻين ٻولين سميت آڇينديون ته اوھان جيڪڏھن چاھيو ته سنڌي ٻوليءَ ۾ پڻ سندن مشينون، يا شيون استعمال ڪري سگهو ٿا. مثال اڄڪلهه عام استعمال ٿيندڙ جديد ڪارُون جن کي ھلائيندي اوھان پنھنجي ڪار کي اي سي بند ڪرڻ لاءِ انگريزيءَ ۾ چوندا آھيو ته: ”ٽَرن آف ايئرڪنڊيشنر“، پر مستقبل ۾ اوھان پنھنجي مادري ٻوليءَ ۾ به ڪار کي ”ايئرڪنڊيشنر بند ڪر“ جو حڪم ڏئي سگهو ٿا ۽ اھا اوھان جي حڪم کي مڃي ايئرڪنڊيشنر بند به ڪندي ۽ اڃا اڳتي ٿي اوھان جي ئي ٻوليءَ ۾ جواب پڻ ڏيندي ته: ”ايئرڪنڊيشنر بند ڪئي وئي.. ٻيو حڪم؟“. (ھن آوازي سرشتي يعني اِسپِيچ ٽيڪنالاجيءَ تي ھڪ جدا پروجيڪٽ گوگل سميت مختلف ادارن سان گڏجي سنڌ حڪومت جي ثقافت ۽ سياحت کاتي جي اداري عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ  ۾ ھلي رھيو آھي، جنھن تي اڃا پرائمري سطح تي ڪم ھلي رھيو آھي).

·       ورڊنيٽ سرشتو اسان جي ايندڙ پيڙهين لاءِ پڻ گهڻي فائدي وارو ٿيندو جيڪي مشيني سرشتن ۾ سنڌي ٻوليءَ جي لکت، پڙهڻيءَ ۽ ڪتب اچڻ جي درست نموني ۽ شڪل کي سمجهي سگهندا.

مٿين سڀني مقصدن، طريقيڪار ۽ لاڀن کي سامهون رکي انسٽيٽيوٽ اندر ھڪ جامع رٿا جوڙي وئي ته ڪيئن سنڌي ٻوليءَ جي آئيندي کي محفوظ بڻائڻ لاءِ عملي طور ھن آئيندي ساز رٿا کي نڀايو وڃي. ان لاءِ گهڻي سوچ ويچار کان پوءِ ھيٺيون ٽي ٽيمون ٺاھيون ويون:

1.      پروگرامر ٽيم: انسٽيٽيوٽ جي ڊائريڪٽر امر فياض ٻرڙي جي سربراھيءَ ۾ ھن ٽيم ۾ شروعاتي طور تي نوجوان ڊولپر عبيدالله ٿھيم پنھنجو فرض ڀلي نموني سان نڀايو. جنھن ڪارپس جي جوڙجڪ، ڪارپس جي اوائلي پروگرامنگ کان ويندي گردان ٺاھڻي جي جوڙجڪ تيار ڪئي. ڊيٽابيس ۾ داخل ڪيل ڪارپس جي اڳين مرحلي يعني ھر ٻول تي گرامر، عدد، جنس، زمان، ضدن، زمرن وغيره جي پروگرامنگ جو ڪم محترم سجاد چنا کي ڏنو ويو. 

2.     ڪارپس ۽ ڊيٽا جي سھيڙ واري ٽيم: انٽرنيٽ تي سنڌي ٻوليءَ جي سموري ذخيري کي ھٿيڪو ڪري ھاڻي سنڌي ٻولن ۾ فعلن جي ڦيرن ۽ انھن جي فارمولن تي اداري جي ڊائريڪٽر امر فياض ٻرڙو سان گڏ محترم شبير ڪنڀار صاحب پڻ ابتدائي ڪم ڪيو. فعلن جي ڦيرن (گردانن) تي ٻڌل جيڪا لسٽ ٺھي ۽ ان کي گرامر جي ترڪيب ڏيڻ لاءِ مانواري ڊاڪٽر فھميده ميمڻ صاحبه جن کي تڪليف ڏني وئي، جنھن اڳواٽ ڏنل فعلن جي شڪلين کي نه رڳو سڌو ڪيو پر گردانن جي تصحيح ۽ تصديق پڻ ڪئي.

3.     ڊيٽا جي سھيڙ ۽ گرامري ٽيم: ھن سلسلي ۾ انسٽيٽيوٽ اندر ڊيٽا داخل ڪندڙ ٽن ڪارڪنن محترم رابيل سولنگي، محترمه منظر ميربحر ۽ محترم شھريار پتافيءَ جن کي پروجيڪٽ آڌار ڀرتي ڪيو ويو کين ٽريننگون ڏنيون ويون، جيڪي ھاڻي لغتون تپاسيندي، ڊيٽابيس ۾ شامل ٿيل ٻولن جي ترڪيبڪاري ڪرڻ لڳا آھن. اڳتي ھلي اھو محسوس ٿيو، ڇوته ھي ڪم تمام گهڻو آھي ان ڪري انسٽيٽيوٽ جي ڊائريڪٽر امر فياض ٻرڙي مختلف يونيورسٽين سان رابطيڪاري مھم ھلائي، جنھن ۾ اڳڀرائي ڪندي شھيد بينظير ڀٽو يونيورسٽي نوابشاھ (ھاڻوڪي شھيد بينظير آباد) جي سنڌي ڊپارٽمينٽ ۾ ڪم ڪندڙ برجستي پروفيسر ڊاڪٽر ڦلو سُندر ميگهواڙ صاحب جن پنھنجي ڊپارٽمينٽ جي چيئرمين پروفيسر ڊاڪٽر سيد امير علي شاھ سان گڏجي يونيورسٽيءَ ۾ ھڪ ليڪچر جو بندوبست ڪيو، جنھن ۾ انسٽيٽيوٽ جي ڊائريڪٽر امر فياض ٻرڙي ليڪچر ڏيندي، سنڌي ٻوليءَ جي ھن مستقبل ساز پروجيڪٽ بابت آگاھي ڏني. ليڪچر کان پوءِ يونيورسٽيءَ جي سنڌي ۽ آءِ ٽي شعبن مان نَوَن شاگردن ۽ شاگردياڻين، جن ۾ سنڌي ڊپارٽمينٽ مان ڪائنات ديدار علي، اقرا گبول، آفتاب حسين، توفيق لاکو، فرمان علي، مصطفيٰ ڪيريو ۽ صلاح الدين، جڏھن ته آءِ ٽي ڊپارٽمينٽ مان، لعل خان ۽ نظام الدين جتوئي کي چونڊي، انهن سان ان ئي ڏينھن ھڪ ننڍڙي ورڪشاپ منعقد ڪئي وئي، جنھن جي نتيجي ۾ فيڪلٽيءَ سميت اھي چونڊيل شاگرد انسٽيٽيوٽ آيا، رٿيل سٽاءَ تي انسٽيٽيوٽ ۾ ٻن ڏينھن جي ٽريننگ ورڪشاپ ٿي، جنھن ۾ شريڪ ٿي پروگرامنگ ۽ ٻوليءَ جي گرامر ٽيگنگ تي سکيا وٺي اُھي شاگرد سنڌي ورڊنيٽ واري پروجيڪٽ ۾ ڪم ڪرڻ لڳي ويا آھن.[7] ھڪ ڳالهه جيڪا ھتي شامل ڪرڻ ضروري آھي ته ھن ئي سلسلي کي اڳتي وڌائيندي جلد ئي سنڌ جي ٻين پبلڪ يونيورسٽين جا دورا پڻ ڪيا ويندا جتان پڻ ساڳي ئي نموني شاگرد ھن پروجيڪٽ ۾ شامل ڪيا ويندا، جن کي اداري پاران سرٽيفڪيٽن سان گڏ بھترين ڪارڪردگيءَ آڌار کين اعزازيو به ڏنو ويندو. سندن نالا اداري جي ويب سائيٽ تي ھميشه رکيا ويندا ۽ ان سان گڏ سنڌي ٻوليءَ جو ورڊنيٽ سرشتو جتي جتي رکيو ويندو، اتي بنيادي ڪارڪنن ۾ سندن نالا رکيا ويندا، ته جيئن سندن ڪيل ڪم جي مڃتا ٿي سگهي. ھڪ اھم ڳالهه ته ھن اھم پروجيڪٽ ۾ ڪير ڇا ڪري ٿو ۽ ڪھڙي وقت ڪنھن ڪھڙي لفظ جي ترڪيب يا سھيڙ ڪئي اھو پوري دنيا ۾ ڪير به ڪٿان ۽ ڪھڙي وقت به ھن ( https://ambile.pk/activity.php ) لنڪ تي ڏسي سگهي ٿو جتي ھر سيڪنڊ ڊيٽابيس جي جيڪا نواڻ ٿي رھي آھي ان جو سربستو حال احوال موجود آھي.

 

 

 

 

 

 

 

 

 

1.      تصديق ڪرڻ واري ٽيم: ھيءَ ٽيم انھن ماھرن تي مشتمل آھي جيڪي سنڌي ٻولن جي ٿيل ترڪيبڪاريءَ کي اک مان ڪڍندا ۽ ترڪيب ٿيل ٻولن تي نظرثاني ڪري ترميمون ۽ سڌارا پڻ ڪري سگهندا. ھن ٽيم ۾ ان وقت ماھرن جا نالا چونڊيا ويندا جڏھن ڊيٽا کي شامل ڪندڙ ٽيمن پاران سنڌي ورڊنيٽ پروگرام ۾ گهٽ ۾ گهٽ ھڪ لک کن سنڌي ٻول، گرامر آڌار ترڪيب ٿي چڪا ھوندا.

مختصر طور تي سنڌي ورڊنيٽ سرشتو سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ سان جوڙڻ ۾ هڪ انتھائي اھم قدم  آهي. هي سرشتو نه رڳو سنڌي ٻوليءَ جي ٻولن جي خزاني (ڪارپس) کي ڪٺو ڪرڻ ۾ مددگار ثابت ٿيندو، پر ان ڪارپس کي ٻين ٻولين سان گڏيل مطابقت ڏيڻ ۾ پڻ اهم ڪردار ادا ڪندو.

مستقبل جي رٿابندي:

سنڌي ورڊنيٽ کي وسيع ڪرڻ: سنڌي ورڊنيٽ کي وڌيڪ جامع ۽ تفصيل سان وسعت ڏيڻ، نون لفظن ۽ معنائن جي اضافي سان گڏوگڏ مختلف موضوعاتي شعبن جي لغات کي شامل ڪرڻ.

1.      ورڊنيٽ ۾ شامل سنڌي ٻولن جو انگريزي لفظ: سنڌي ورڊنيٽ کي ٻين ٻولين سان ترجمي جي سھولت مھيا ڪرڻ، جنھن سان سنڌي ٻوليءَ جي عالمي سطح تي پھچ ۽ قبوليت ۾ اضافو ٿيندو. مثال جيڪڏھن سنڌي ٻوليءَ جو لفظ ”گاھ“ آھي ته اتي انگريزي ٻوليءَ جي ٽيگ يعني  Grass پڻ شامل ٿيندو.

2.     تعليمي استعمال: خاص طور تي سنڌي ٻوليءَ جي تعليم ۽ تدريس سان لاڳاپيل ادارن ۽ يونيورسٽين جي سنڌي ڊپارٽمينٽن ۽ تحقيق جي ميدان ۾ ڪم ڪندڙ ماھرن کي سنڌي ورڊنيٽ جي استعمال وڌائڻ ۽ سندن ڀاڱيداري ڪرائڻ ھن پروجيڪٽ جو مٿيون ڏاڪو آھي.

3.     ڊجيٽل پروگرامن ۽ مشينن ۾ سنڌي ورڊنيٽ شامل ڪرڻ: سنڌي ورڊنيٽ کي مختلف ڊجيٽل ڪنسورشيم جيئن ماڪروسوفٽ، گوگل، اوپن اي آءِ، وغيره، مشينن جھڙوڪ: موبائل، سمارٽ واچن، روباٽڪس انجنيئرنگ جي پروگرامن، ماھراڻي سافٽويئرن ۽ ايپليڪيشنز ۾ شامل ڪرڻ، ته جيئن انٽرنيٽ تي موجود سرچ انجڻيون، ٽيڪسٽ پروسيسنگ سرشتا، ۽ ٻيا مصنوعي ذهانت تي ٻڌل سرشتا سنڌي ٻوليءَ کي دنيا جي ٻين اڳرين ٻولين جيان نه رڳو شامل ڪن، پر اھا دنيا جي ھر ھنڌ دستياب پڻ ھجي.

4.     سنڌي ٻوليءَ تي تحقيقي ڪم: سنڌي ورڊنيٽ جي بنياد تي نون تحقيقي منصوبن جي شروعات، جيڪي سنڌي ٻوليءَ جي لغوي جوڙجڪ، ٻولن جي ڌاتن، آوازي تصورن تي تحقيقون ڪندڙن لاءِ ھڪ جامع ٻوليءَ جو نقشو مھيا ڪري اوائلي سنڌو لکتن جي ڀاڃ ۾ ممڪنه طور تي ڪا اڳڀرائي ٿي سگهي، ان سان گڏ اھي محقق ڊجيٽل دنيا ۾ سنڌي ٻوليءَ کي استعمال ڪرڻ جي مختلف پاسن تي پڻ اڀياس ڪري سگهن.

اسان جي اها ڪوشش آهي ته سنڌي ورڊنيٽ سرشتو سنڌي ٻوليءَ کي جديد ٽيڪنالاجيءَ جي مدد سان عالمي سطح تي پھچائڻ ۾ اهم ڪردار ادا ڪري، ۽ مصنوعي ذھانت، روباٽڪس انجنيئرنگ ۽ مستقبل ۾ متوقع اڃا گهڻي ايڊوانس ٽيڪنالاجين ۾ سنڌي ٻوليءَ جي استعمال ۽ واڌاري لاءِ هڪ مضبوط پيڙهه جي پٿر جيان ثابت ٿي سنڌي ٻوليءَ جو آئيندو ايترو محفوظ ڪري، جيترو انگريزيءَ، چيني يا ڪنھن ٻِي عالمگير ٻوليءَ جو ڀانئِجي رھيو آھي.

دنيا جي سگهارين ٻولين ۾ ورڊ نيٽ (Word Net) هڪ جامع لغوي وسيلي طور سڃاتو ويندو آهي، جيڪو ان ٻوليءَ جي لفظن، انھن جي معنائن ۽ ٻولن جا ھڪٻئي سان لاڳاپا ڏيکاريندو آھي. ورڊنيٽ سرشتو ان ٻوليءَ جي لفظن، انھن جي ھم معنائن، ضدن، ۽ تصوراتي لاڳاپن کي ھڪ ھنڌ ڪٺو ڪرڻ ۽ ترتيب ڏيڻ ۾ مدد ڪندو آھي.[8]

مصنوعي ذهانت ۽ قدرتي ٻولين جي مشيني سرشتن (نيچرل لئنگئيج پروسيسنگ) جي شعبن ۾، انساني ٻولين جي وسيلن جھڙوڪ: ٻول، ٻولن جا قانون، آوازي صورتون، لکت جي سمورين شڪلين وغيره جي موجودگي ضروري ھوندي آهي. ورڊ نيٽ ڪنھن به ٻوليءَ جي ٻولن ۽ جملن جي سمجهڻ ۾ مدد ڪندوآهي.

سنڌي ورڊ ڇو ضروري آهي: سنڌي ورڊ نيٽ جڙڻ سان سنڌي ٻوليءَ جا لفظ ۽ انھن جون معنائون ڊجيٽل دنيا جي مختلف سرشتن ۾ پنھنجي قد ڪاٺ سان موجود  هوندا، جنھن ڪري سنڌي ٻوليءَ جي تعليم ۽ تحقيق ۾ هٿي ۽ مدد ملندي. هيءُ وسيلو ٻوليءَ تي ڪم ڪندڙ محققن لاءِ ئي نه پر ھڙني شعبن جي اسڪالرن، استادن، ۽ شاگردن لاءِ دنيا جي ھر ھنڌ ۽ ھر وقت دستياب ٿيندو، جنھن سان ٻوليءَ جي تعليم ۽ واڌارن ۾ نواڻ اچي سگهندي.

سنڌي ورڊنيٽ سرشتي کي ٺاھڻ، دنيا جي ٻين ٻولين جيان رڳو اھم ئي نه، پر تمام گهڻو ضروري ان ڪري به آھي جو سنڌي ٻوليءَ ۾ ڪي خاصيتون اھڙيون آھن، جيڪي ھتي ايشيائي ٻولين ۾ ورلي ملن پيون. جھڙوڪ: سنڌي ٻوليءَ جا سڀ آواز متحرڪ ٿيندا آھن. ھر لفظ جو آخري آواز متحرڪ ڪري ان ٻول جو نه صرف انگ ٻڌايو ويندو آھي، پر ان جي جنس پڻ پڌري ٿيندي آھي. ان ڪري سنڌي ٻوليءَ ۾ ورڊنيٽ دنيا جي ٻين ٻولين جي ڀيٽ ۾ ڪجهه وڌيڪ اھم آھي. جنھن جي ٺھڻ کان پوءِ سنڌي ٻوليءَ جي ڪمپيوٽيشنل پروسسنگ ۾ پنھنجي ھڏ ڪاٺ سميت بيھڪ بنائڻ لاءِ انيڪ مقصد حاصل ٿيندا.

حوالا:

1.      بل ھئانگ، پرنسٽن يونيورسٽي، WNSpell: a WordNet-Based Spell Correctorhttps://aclanthology.org/2016.gwc-1.21.pdf

2.     لائرا بنٽز، METHODS AND TOOLS FOR BUILDING THE CATALAN WORDNET https://www.cs.upc.edu/~escudero/wsd/98-lrec.pdf

3.     پروڪزيٽ، Automatic Synonym Implementation with AI: How it Works https://www.proxet.com/blog/automatic-synonym-implementation-with-ai-how-it-works

4.     سنڌي انفرميٽڪس (آءَ ٽي) شعبو، سنڌي لئنگئيج اٿارٽي، https://sl.sindhila.org/sections/detail/sindhi-informatics

5.     سنڌي ٻولن جي کاڻ، عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ، https://ambile.pk/dev/corpus/

6.     سنڌي گردان ساز، عبدالماجد ڀرڳڙي انسٽيٽيوٽ آف لئنگئيج انجنيئرنگ، https://ambile.pk/dev/girdan/

7.     روزاني ايڪسپريس ٽربيون، Importance of Sindhi WordNet highlighted، https://tribune.com.pk/story/2477269/importance-of-sindhi-wordnet-highlighted

8.     جارج اي ملر، Introduction to WordNet: An On-line Lexical Database، https://wordnetcode.princeton.edu/5papers.pdf

 

 

نئون صفحو --  ڪتاب جو ٽائيٽل صفحو
ٻيا صفحا 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
هوم پيج - - لائبريري ڪئٽلاگ

© Copy Right 2007
Sindhi Adabi Board (Jamshoro),
Ph: 022-2633679 Email: bookinfo@sindhiadabiboard.org