യൂണികോഡ്
ലോകത്തിലെ എല്ലാ ഭാഷകള്ക്കും പര്യാപ്തമായ അക്ഷരങ്ങളുടെ കൂട്ടം
... മലയാളത്തിനും
കമ്പ്യൂട്ടറിന്റെ ഭാഷ
- 1 0 എന്നീ അക്കങ്ങള് മാത്രമുള്ളതാണ് കമ്പ്യൂട്ടറിന്റെ ഭാഷ.
- ഇതു മാത്രം ഉപയോഗിച്ച് എങ്ങനെ സാധാരണയായുള്ള വിവരങ്ങള് കൈകാര്യം
ചെയ്യും?
- അക്ഷരങ്ങള്ക്ക് ഒരു സംഖ്യ കൊടുക്കുന്നു.(സംഖ്യകള്ക്കും :-))
- 7 ബിറ്റുകളുപയോഗിച്ചായിരുന്നു ഇതു് ആദ്യകാലങ്ങളില് ചെയ്തിരുന്നത്.
- ഇതുപയോഗിച്ച് 128 അക്ഷരങ്ങളേ പ്രതിനിധാനം ചെയാനാകൂ.
ആസ്കി ASCII
- ഓരോ അക്ഷരത്തിനും ഒരു ബൈറ്റ് (8 ബിറ്റ് )
- അപ്പോള് 256 അക്ഷരങ്ങള് ഉപയോഗിക്കാം.
- ഉദാഹരണം A= 95, B=96...
- ലാറ്റിന് ലിപി മാത്രമേ പരിഗണിച്ചിരുന്നുള്ളൂ.
- മറ്റു ഭാഷകളൊന്നും ഇതു കൊണ്ട് പ്രതിനിധാനം ചെയാന് പറ്റില്ല
- ഇതിന് നാം ഉപയോഗിച്ച കുറുക്കു വഴി ഫോണ്ട് എന്കോഡിങ്ങ്.
- അക്ഷരങ്ങള് ശേഖരിക്കുന്നത് ഇംഗ്ലീഷിലും പ്രദര്ശിപ്പിക്കുമ്പോള്
മലയാളത്തിലും..
- ഫോണ്ടില് ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സ്ഥാനത്ത് മലയാളം അക്ഷരങ്ങള്
വച്ചു.
- പ്രമുഖ പത്രങ്ങളെല്ലാം ഈ രീതിയാണ് ഇപ്പോളും പിന്തുടരുന്നത്.
മലയാളം നേരിടുന്ന പ്രശ്നങ്ങള്
- 900 ത്തിലധികമുള്ള കൂട്ടക്ഷരങ്ങളുള്ള മലയാളം ഒരു ഫോണ്ടിലൊതുങ്ങില്ല.
- രചന 6 ആസ്കി ഫോണ്ടുകളുപയോഗിച്ചാണ് എല്ലാ കൂട്ടക്ഷരങ്ങളും കാണിച്ചത്.
- ഫോണ്ടുകളില് ഈ മാപ്പിങ്ങിന് ഐക്യ രൂപം ഇല്ല.
- മാതൃഭൂമിയുടെ ഫോണ്ട് ഉപയോഗിച്ച് മലയാള മനോരമയുടെ സൈറ്റ്
കാണാന് പറ്റില്ല.
- വിവരങ്ങള്ക്കൊപ്പം ഫോണ്ടും കൂടി കൈമാറേണ്ട അവസ്ഥ.
- തിരയാനും തരം തിരിക്കാനും ഏകീകൃത രീതിയില്ല.
- കമ്പ്യൂട്ടറിന് അറിയില്ല ഇത് മലയാളമാണെന്ന്.
- ഇംഗ്ലീഷും മലയാളവും ഒരു ഫയലില് പറ്റില്ല.
യൂണികോഡ്
- 65536 അക്ഷരങ്ങള്
- ഇത് ലോകത്തിലെ എല്ലാ ഭാഷകള്ക്കും ഇത് മതിയാണ്.
- ഓരോ ഭാഷയ്ക്കും അതിന്റേതായ സ്ഥാനം.
- ആദ്യത്തെ 256 അക്ഷരങ്ങള് ആസ്കിയുടെ തന്നെ.
- 0D00 - 0D7F (3328- 3455) മലയാളത്തിന് വേണ്ടി.
യൂണികോഡിന്റെ മെച്ചങ്ങള്
- മലയാളമായിത്തന്നെ കമ്പ്യൂട്ടര് മനസ്സിലാക്കുന്നു
- ഏതെങ്കിലുമൊരു യൂണികോഡ് ഫോണ്ടുണ്ടായാല് മതി
- വെട്ടിച്ചുരുക്കിയ ലിപിയും മലയാളത്തിന്റെ സ്വതസിദ്ധമായ ലിപിയും
തമ്മിലുള്ള വ്യത്യാസം ഇല്ലാതായി
- ഏത് ഫോണ്ടാണോ സിസ്റ്റത്തിലുള്ളത് ആ ലിപിയില് കാണാം
- ഒന്നിലധികം ഭാഷകള് ഒരേ ഫയലില് സൂക്ഷിയ്ക്കാം
- പക്ഷേ 3328 - 3455 വരെയുള്ള സ്ഥാനത്ത് 900 ത്തിലധികമുള്ള
കൂട്ടക്ഷരങ്ങളെങ്ങനെ
കാണിയ്ക്കും?
ഓപ്പണ്ടൈപ്പ് ഫോണ്ട് സാങ്കേതികവിദ്യ
- യൂണികോഡിനൊപ്പം ഇതു കൂടിച്ചേര്ന്നപ്പോള് മുഴുവന്
കൂട്ടക്ഷരങ്ങളേയും കാണിയ്ക്കാമെന്ന് വന്നു
- അക്ഷരങ്ങളുടെ ശ്രേണിയ്ക്കു പകരമായി ഒറ്റ കൂട്ടക്ഷരം മാറ്റി
വയ്ക്കാമെന്നായി
- പ + ചന്ദ്രക്കല + ര എന്നതിന് പകരം പ്ര എന്ന് കാണിയ്ക്കുന്നു
- ജനകീയമായ യൂണികോഡ് ഫോണ്ടുകളാണ് രചന, അഞ്ജലി തുടങ്ങിയവ
സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്
ശുഭം