ঢাকা     শুক্রবার   ১৯ এপ্রিল ২০২৪ ||  বৈশাখ ৬ ১৪৩১

কথা হবে বাংলায়, অনুবাদ হবে বিভিন্ন ভাষায়

মনিরুল হক ফিরোজ || রাইজিংবিডি.কম

প্রকাশিত: ১১:১৩, ২ ফেব্রুয়ারি ২০১৭   আপডেট: ০৫:২২, ৩১ আগস্ট ২০২০
কথা হবে বাংলায়, অনুবাদ হবে বিভিন্ন ভাষায়

বিজ্ঞান-প্রযুক্তি ডেস্ক : বাংলা ভাষায় ইউনিকোড ফন্ট ব্যবহার করা হয়েছে। বাংলা ইউনিকোড আইএসও স্ট্যান্ডার্ড ১৫২০:২০১১ স্বীকৃতি পেয়েছে। ইউটিএফ ৬ থেকে শুরু হওয়ার পর ইউটিএফ ১০ ভার্সন নিয়ে কাজ চলছে। ভাষা গবেষণা এবং প্রযুক্তিতে বাংলা ভাষার প্রমিতরূপ ব্যবহারের জন্য ১৫৯ কোটি ২ লাখ টাকার প্রকল্প পাশ হয়েছে। কৃত্তিম বুদ্ধিমত্তা ব্যবহার করে এক সময় সম্মেলন কক্ষে বাংলায় কথা বললে সেই ভাষা অনুবাদ হয়ে তাৎক্ষণিক বিভিন্ন ভাষায় শোনার প্রযুক্তিও আমরা তৈরি করতে সক্ষম হবো।

২ ফেব্রুয়ারি বৃহস্পতিবার, বেসিস সফটএক্সপোর দ্বিতীয় দিনে বঙ্গবন্ধু আন্তর্জাতিক সম্মেলন কেন্দ্রের উইন্ডি টাউন হলে ‘তথ্যপ্রযুক্তিতে বাংলা ভাষা’ শীর্ষক গোলটেবিল বৈঠকে বক্তারা এসব কথা বলেন।

বেসিস সভাপতি মোস্তাফা জব্বারের সঞ্চালনায় বৈঠকে মূল প্রবন্ধ উপস্থাপন করেন বাংলাদেশ কম্পিউটার কাউন্সিলের প্রাক্তন নির্বাহী পরিচালক এস এম আশরাফুল ইসলাম। বৈঠকে আলোচক হিসেবে ছিলেন বাংলাদেশ কম্পিউটার কাউন্সিলের পরিচালক ইঞ্জিনিয়ার এনামুল কবির, টিম ইঞ্জিন লিমিটেডের ব্যবস্থাপনা পরিচালক সামিরা জুবেরি হিমিকা, ইউনাইটেড ইন্টারন্যাশনাল বিশ্ববিদ্যালয়ের (ইউআইইউ) অধ্যাপক ড. হাসান সরওয়ার, প্রথম আলো ইয়ুথ গ্রুপের সমন্বয়ক মুনির হাসান, জাহাঙ্গীরনগর বিশ্ববিদ্যালয়ের অধ্যাপক এ. এফ. এম দানিয়াল হক, বাংলাদেশ কম্পিউটার কাউন্সিলের নির্বাহী পরিচালক স্বপন কুমার সরকার এবং ঢাকা বিশ্ববিদ্যালয়ের অধ্যাপক মনসুর মুসা।

আশরাফুল ইসলাম বলেন, বাংলা ভাষায় ফন্ট, কিবোর্ড, অনুবাদ, বাংলা বাণীকে লিখিত বাক্যে রুপান্তর (ভয়েস টু টেক্সট), টেক্সট টু ভয়েস, বাংলা ওসিআর ও বাংলা হাতের লেখা চিহ্নিতকরণ বিষয়ে এখনো অনেক প্রতিবন্ধকতা রয়েছে। সবচেয়ে বড় সমস্যা রয়ে গেছে বাংলা বানান ঠিক করা নিয়ে। যতগুলো কিবোর্ড বাংলায় ব্যবহৃত হয় তার মধ্যে একটি কিবোর্ডও এখনো পরিপূর্ণভাবে বানান শুদ্ধকরণে সফলতা অর্জন করতে পারেনি। আইসিটি ডিভিশনের উচিত বাংলা ভাষার ওসিআর উন্মুক্ত করে দেয়া। তাহলে অ্যাপস ডেভেলপাররা এই বিষয়ে কাজ করতে পারবেন।

তিনি আরো বলেন, বাংলা ভাষায় দুটি স্টাইল গাইড ব্যবহৃত হয়। যার একটি পশ্চিমবঙ্গের এবং অন্যটি বাংলাদেশের। পশ্চিমবঙ্গের স্টাইল গাইড প্রণয়ন হয়ে গেলেও বাংলাদেশেরটা এখনো চালু হয়নি। আমাদের স্টাইল গাইড নিয়ে কাজ করতে হবে। এছাড়াও ক্ষুদ্র নৃ-গোষ্ঠীদের ভাষা নিয়েও গবেষণা চলছে। ইতোমধ্যে মারমা, চাকমা ভাষায় পাঠ্যবই রচিত হয়েছে।

ইঞ্জিনিয়ার এনামুল কবির বলেন, ইংরেজি, ফ্রেঞ্চ, চাইনিজ ভাষায় অনেক কনটেন্ট থাকলেও বাংলা ভাষায় কনটেন্টের সংখ্যা খুবই অল্প। একটি অ্যানালাইটিক্যাল সাইটের পরিসংখ্যান অনুসারে এই সংখ্যা .১ শতাংশেরও কম। তথ্যপ্রযুক্তিতে বাংলা ভাষার প্রমিতকরণে আমাদের দক্ষ লোক দরকার। কিন্তু এই জায়গায় আমরা সঠিক কাজ সঠিক মানুষকে দিয়ে করানোর লোক খুঁজে পাইনা। এছাড়াও গুগল দেবনগরী ফন্টের জন্য দাড়ি এবং ডাবল দাড়িতে ইউনিকোড দিলেও আমাদের জন্য এখনো সেই জায়গা খালি রয়ে গেছে।

সামিরা জুবেরি হিমিকা বলেন, ২০১২ সাল থেকে আমরা বাংলা কনটেন্ট নিয়ে কাজ শুরু করি। ইংরেজিতে অনেক লাইব্রেরি ডিজিটাল করা হলেও দেশে এই ধরনের ডিজিটাল লাইব্রেরির সংখ্যা নেহায়েত কম। ইংরেজি করা সম্ভব হলে বাংলাও করা সম্ভব। নিজেদের অর্থ খরচ করে আমরা একটা ওসিআর তৈরি করি। কিন্তু আক্ষেপের বিষয় হচ্ছে সরকারের কাছে এই প্রজেক্ট জমা দেয়ার পরেও সরকারিভাবে এই ওসিআর ব্যবহৃত হয় না। আমরা নিজেরাই ৬০টি প্রতিষ্ঠানে এই ওসিআর ইনস্টল করে দিয়ে এসেছিলাম। আমরা আমাদের প্রজেক্টের এপিআই এক্সচেঞ্জ উন্মুক্ত রেখেছি। ভাষাকে তথ্যপ্রযুক্তিতে সমৃদ্ধ করতে আমাদের গ্লোবাল টিম তৈরি করা দরকার। এতে আমরা দেশে-বিদেশে সবখানেই লাভবান হব।

অধ্যাপক ড. হাসান সরওয়ার বলেন, ২০০৫ থেকে কম্পিউটার সায়েন্সের পাশাপাশি আমি ভাষা নিয়ে কাজ করছি। বাংলা বইগুলোকে স্ক্যান করে অটোমেশন রিডারে নিয়ে এসে ফন্টে ব্যবহার করার জন্য অনেক বছর আগে ২৩ লাখ টাকার প্রকল্প পেয়ে একটি ওসিআর তৈরি করেছিলাম। তখন খুব অল্প টাকার ফান্ড ছিল। এখন টাকা হয়েছে। যোগ্য লোক দিয়ে কাজ করানো গেলে আমরা ৩বছরে পরিপূর্ণ না হলেও একটি গাইডলাইন পেয়ে যাবো।

মুনির হাসান বলেন, শাহজালাল বিশ্ববিদ্যালয়ের তৈরি ২ লাখ করপাস (ভাষাংশ) আছে। গুগলে ২৪ লাখ করপাস আছে। ৪ দিনে ৭ লাখ এবং ২ বছরে আমরা তৈরি করেছি আরো ৭ লাখ করপাস। কিন্তু গুগলে এই সংখ্যা নগণ্য। শুধু ইংরেজিতে গুগলে করপাস জমা আছে ৬ কোটি। কমপক্ষে ৫০ লাখ করপাস হলেও গুগলে আমাদের অবস্থান ভালো হবে। আমাদের কল সেন্টারে কাজ করার জন্য যোগ্য শিক্ষার্থী পাওয়া যায় না। অথচ মাত্র ৬০০ শব্দ আর ১৫০ টি বাক্য জানলেই কল সেন্টারে কাজ করা সম্ভব।

অধ্যাপক এ. এফ. এম দানিয়াল হক বলেন, ভাষার প্রমিতকরণ নিয়ে তথ্যপ্রযুক্তিতে কাজ করার প্রাথমিক স্টেজে রয়েছি আমরা। একসময় ঢাকা বিশ্ববিদ্যালয়ে রেমিংটন মেশিন দিয়ে কাজ করা হত। আমাদের বাংলা ফন্টগুলো এখনো পর্যন্ত প্রমিত হয়নি। সরকারি, আধা-সরকারি এবং বেসরকারি এ তিন স্থানে একসঙ্গে কাজ করতে হবে। এজন্য অনলাইনে গ্রুপিং করে কাজ করা যেতে পারে।

স্বপন কুমার সরকার বলেন, তথ্যপ্রযুক্তির এ বিভাগে আমার কাজের কোনো অভিজ্ঞতা নেই। নতুন হিসেবে আমি আপনাদের সবার সহযোগিতা কামনা করি। কীভাবে কাজ করবো এবং কাকে কাজে নিয়োগ দিবো এ ব্যাপারে আপনারা আমাকে নির্ধিদ্বায় পরামর্শ দেবেন। আপনাদের আমি সবসময় স্বাগত জানাই।

অধ্যাপক মনসুর মুসা বলেন, দেশের ৯৯ শতাংশ মানুষ জানেই না ভাষা কি? অথচ আমাদের সবার মধ্যে ব্যাকরণ আছে। বাংলা ব্যাকরণ না জানলে ভাষা জানা যাবে না। আমি চট্টগ্রামের ভাষা নিয়ে গবেষণা করেছি। চট্টগ্রামের ভাষা নিয়ে গবেষণা করতে গিয়ে দেখেছি, প্রতি ৫ কিলোমিটার পর পর ভাষার পরিবর্তন আছে। জীবিত পরিবর্তনশীল। বাংলা ভাষায় তুমি, তুই এবং আপনি তিনটি ভাগ থাকলেও ইংরেজিতে নেই। কৃত্রিম ভাষা মানুষের মনের ভাব বুঝতে পারে না। বাংলার ক্ষেত্রে কৃত্তিম ভাষা ব্যবহার করে ভাষা বুঝা আরো কঠিন। দেশে ভাষা গবেষণা এবং প্রমিতকরণ করে প্রযুক্তিতে ব্যবহারের জন্য যে প্রকল্প করা হয়েছে তার জন্য প্রধানমন্ত্রীকে আন্তরিক ধন্যবাদ। আগামী পাঁচ বছরে এ কাজ সম্পন্ন হবে বলে আমি আশাবাদী।

মোস্তাফা জব্বার বলেন, আমরা তথ্যপ্রযুক্তিতে বাংলা ভাষায় অনেকদুর এগিয়ে গেছি। অনেক প্রতিবন্ধকতা ছিল। ভবিষ্যতেও থাকবে। তবে জয়ী আমরা হবোই। ১৯৬৯ সালে দেশে প্রথম বাংলা টাইপ রাইটার মেশিন আছে। ১৯৭২ সালে বঙ্গবন্ধু প্রথম অপ্টিমা মুনীর টাইপ রাইটার মেশিন দেশে নিয়ে আসেন। ভাষার ১৬টি টুলস বানাতে প্রকল্প হাতে নেয়া হয়েছে। আশা করা যায়, এই প্রকল্প সম্পন্ন হলে আমাদের সমস্যাগুলোর সমাধান অতি দ্রুত হয়ে যাবে।



রাইজিংবিডি/ঢাকা/২ ফেব্রুয়ারি ২০১৭/ফিরোজ

রাইজিংবিডি.কম

আরো পড়ুন  



সর্বশেষ

পাঠকপ্রিয়