ইউনিকোড অর্থাৎ ইউনিক কোড। ইউনিকোড হলো একটি সংস্থা যারা বিভিন্ন ভাষার প্রতিটি ক্যারেক্টার এর জন্য একটি ইউনিক কোড প্রদান করে থাকে।
একটা সময় কম্পিউটারে ইংরেজি ছাড়া আর কোন ভাষায় লেখার কোন সুব্যবস্থা ছিল না। সে সময় ইংরেজি বাদে অন্যান্য ভাষাতে লেখা গেলেও সেটা আরেকটা কম্পিউটারে পাঠানো যেত না। পাঠানো গেলেও সেটা আর সেই কম্পিউটারে পড়ার উপযোগী ছিল না।
ইউনিকোড আসার ফলে প্রত্যেক টি বর্ণকে আলাদা ভাবে চিহ্নিত করা যাচ্ছে। এর ফলে বাংলাতেও এখন যদি আমরা কোন কিছু লিখি সেটা অন্য ডিভাইসে সঠিক ভাবে দেখানো সম্ভব হচ্ছে।
আমরা আজকের আর্টিকেলটি থেকে মূলত জানতে পারবো – ইউনিকোড কি? ইউনিকোড এর সুবিধা ও বৈশিস্ট্য কি? এবং এটি কিভাবে কাজ করে সে সম্পর্কেও আপনাদের প্রয়োজনীয় ধারনা দেওয়া হবে। তো চলুন শুরু করা যাক?
ইউনিকোড কি বা কাকে বলে?
ইউনিকোড( uni code) এই শব্দটির পূর্ণরূপ হলো – Universal Code.
বিশ্বের সকল ধরনের ভাষাকে কম্পিউটারের কোডভুক্ত করার জন্য বড় বড় যে কোম্পানি গুলো রয়েছে সেগুলো একটি মান তৈরি করেছে যাকে ইউনিকোড বলা হয়ে থাকে। আবার একে সার্বজনীন কোডও বলা যেতে পারে । বর্তমানে পৃথিবীব্যাপী প্রচলিত আসকি বা ASCII (আমেরিকান স্ট্যান্ডার্ড কোড ইন ইনফরমেশন ইন্টারচেঞ্জ) কোডের পাশাপাশি ইউনিকোড সিস্টেম চালু হয়েছে। এটি ১৬ বিট এর একটি কোড। বিভিন্ন ধরণের ক্যারেক্টার ও যেকোনো ধরনের টেক্সটকে প্রকাশ করার জন্য ইউনিকোড ব্যবহার করা হয়ে থাকে। এর মাধ্যমে ২১৬ = ৬৫৫৩৬ টি অদ্বিতীয় চিহ্নকে নির্দিষ্ট করা যায়। ১৯৯১ সালে অ্যাপল(Apple) কম্পিউটার কর্পোরেশন এবং Xerox Corporation এর একদল কম্পিউটার প্রকৌশলী পৃথিবীর সব ভাষাভাষী মানুষের জন্য তাদের ভাষায় কম্পিউটিং করা সহজ করার লক্ষ্যে যৌথভাবে ইউনিকোড উদ্ভাবন করেন। Unicode consortium ( ইউনিকোড কনসোর্টিয়াম) এর সদস্য হয়ে বাংলা ভাষাও এখন ইউনিকোডভুক্ত হয়েছে।
ইতিহাস:
১৯৮৭ সালে ইউনিকোডের কাজ শুরু করেছিলেন Xerox এর Joe Becker এবং Apple এর Lee Collins ও Mark Davis।তাদের মূল লক্ষ্য ছিল সকল ভাষাকে একটি সার্বজনীন সংকেতায়নের মানদন্ডে নিয়ে আসা।ফলশ্রুতিতে পরবর্তী বছরের আগষ্ট মাসে Joe Becker “international/multilingual text character encoding system, tentatively called Unicode.” নামে একটি খসড়া প্রস্তবনা তৈরি করেন।এই প্রস্তাবনাটি ছিল একটি ১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থা।
১৬ বিট এর বর্ণ সংকেতায়ন ব্যবস্থার কারণ ছিল তিনি মনে করেছিলেন শুধুমাত্র আধুনিক ভাষার বর্ণগুলি ব্যবহৃত হবে।
পরবর্তীতে অনেক পুরাতন ভাষার জন্য ও তালিকাভুক্ত করার প্রয়োজন পড়ে। এদের মাঝ এমন ভাষাও রয়েছে যেগুলি বর্তমানে আর ব্যবহৃত হয় না। (যেমন: Egyptian Hieroglyphs)
১৯৮৯ সালে Metaphor এর Ken Whistler এবং Mike Kernaghan, RLG এর Karen Smith-Yoshimura ও Joan Aliprand এবং Sun Microsystems এর Glenn Wright ইউনিকোডের গ্রুপে যোগদান করেন। পরবর্তীতে ১৯৯০ সালে Microsoft এর Michel Suignard ও Asmus Freytag এবং NeXT এর Rick McGowan যোগদান করেন। ১৯৯০ সালের শেষের দিকে ইউনিকোডের খসড়া প্রস্তাবনা সম্পন্ন হয়। ১৯৯১ এর অক্টবরে ইউনিকোডের প্রথম খন্ড প্রকাশিত হয়। ১৯৯২ সালের জুনে ইউনিকোডের দ্বিতীয় খন্ড প্রকাশিত হয়।
ইউনিকোড কিভাবে কাজ করে
তবে ইউনিকোড লিখতে সফটওয়্যার প্রয়োজন হয়। বাংলাদেশে Avro এবং Bijoy দিয়ে ইউনিকোড টাইপ করতে হয়। এ দুটো সফটওয়্যার তাদের নিজস্ব কয়েকটি উপায়ে ইউনিকোড টাইপ করে থাকে। আমাদের একটি ভুল ধারণা Unicode কে আমরা Avro বলে থাকি, আসলে Avro হচ্ছে Unicode লিখার একটি মাধ্যম। Unicode-এ লিখতে Avro সফটওয়্যারের প্রয়োজন হয়। Avro ব্যতিক্রম যে কাজটি করেছে তা হচ্ছে Avro Phonetic (English to Bangla)। আপনি Avro চালু করে যে কোন ধরণের বাংলা শব্দ ইংরেজিতে লিখবেন সেটা বাংলা হয়ে যাবে। বাংলা হয়ে যাওয়া ওই অক্ষর বা বাক্যটি মূলত Unicode হয়ে আপনার কম্পিউটার বা মোবাইলে দেখা যায়। Avro তাদের প্রথম ভার্সনে Bijoy কীবোর্ড ব্যবহার করে। Bijoy’র আপত্তির মুখে পরবর্তী সংস্করণে বিজয় কীবোর্ড তুলে দেয়। Avro তে আরো কয়েকটি টাইপ করার মাধ্যমে (লেআউট) রয়েছে- Avro Easy, Bornona, National (Jatiyo),
ইউনিকোড (Unicode) ব্যবহার
অন্যদিকে, বিজয় দিয়ে আমরা সাধারণত SutonnyMJ’র মতো ফন্টগুলো সিলেক্ট করে বাংলা টাইপ করতাম। সে ক্ষেত্রে CTRL + ATL + B ব্যবহার করা হতো বাংলা লিখার জন্য। বাংলা লিখার এ মাধ্যমে বলা হয় ANSI (এস-এস-আই)। বিজয় কীবোর্ড সফটওয়্যারও তাদের ANSI’র সাথে সাথে Unicode অ্যাড করে। তারা CTRL + ATL + V চেপে বিজয় পুরোনো কীবোর্ড টাইপ (লেআউট ) ব্যবহার করে Unicode সিস্টেম চালু করে।
ব্যাপারটা কিন্তু ঘুরে ফিরে একই হলো। Avro এবং Bijoy তাদের নিজস্ব মাধ্যম ব্যবহার করে অক্ষর বা বাক্যকে Unicode-এ প্রকাশ করে।
ইউনিকোড এর বৈশিষ্ট্য বা সুবিধাগুলো কি কি?
ইউনিকোডের কিছু বৈশিষ্ট্য বা সুবিধা রয়েছে। যেমন–
১। এটি ১৬ বিট বিশিষ্ট একটি কোড, একারণে এর সাহায্যে ২১৬বা ৬৫৫৩৬ টি অদ্বিতীয় চিহ্নকে নির্দিষ্ট করা যায়।
২। পৃথিবীর ছোট বড় যেকোনো ভাষাকে কম্পিউটারের কোডভুক্ত করা যায় এর মাধ্যমে ।
৩। যেকোনো ক্যারেক্টার বা টেক্সট কে কোড করার জন্য ১৬ টি বিটই ব্যবহার করা হয়ে থাকে।
৪। বিশ্বের শত শত ভাষার হাজার হাজার বর্ণ বা চিহ্নের জন্য এ কোড ব্যবহৃত হয়।
৫। মূলত ইউনিকোড কনসোর্টিয়াম নামক একটি অলাভজনক প্রতিষ্ঠান এর দায়িত্বে রয়েছে।
৬। খুব বেশি মেমোরির প্রয়োজন হয়।
৭। এর প্রথম ২৫৬ টি কোড অ্যাসকি(ASCII) ২৫৬ টি কোডের অনুরূপ।
৮। এটি থেকে খুব সহজে অন্যান্য স্ট্যান্ডার্ড কোডে পরিবর্তন করা যায়।
৯। Example: A= u0041 ইত্যাদি ।