Thursday, December 17, 2009

മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ

വെറും 140 അക്ഷരങ്ങളിൽ താഴെ ജീവിതം വിവരിക്കാനുതകുന്ന റ്റ്വിറ്റർ എന്ന സർവീസിനെ ആർക്കും പരിചയപ്പെടുത്തേണ്ടുന്ന കാര്യമില്ലല്ലോ. എന്നാൽ കേട്ടോളൂ: റ്റ്വിറ്ററിന്‍റെ മലയാള ഭാഷാവിവേചനത്തിൽ പ്രതിഷേധിച്ചു് ബ്ലോഗുകറുപ്പിക്കേണ്ടുന്ന നേരമായി. എന്താണെന്നോ? 140 അക്ഷരങ്ങൾ എണ്ണിപ്പെറുക്കി മലയാളഭാഷയിൽ റ്റ്വീറ്റു ചെയ്യാൻ ചെന്നു നോക്കൂ. വിവരമറിയും.

140 പോയിട്ടു്, അതിന്‍റെ പകുതി എണ്ണം പോലും അക്ഷരങ്ങളില്ലാത്ത ഒരു വാചകവുമായി റ്റ്വീറ്റാൻ ചെന്നപ്പോൾ റ്റ്വിറ്റർ പറയുകയാണു് ഒരക്ഷരം കൂടുതലാണെന്നു്. ഇതു് പോലീസിനു് എല്ലു കൂടിയതുപോലെയൊന്നുമല്ല. റ്റ്വിറ്റർ പറഞ്ഞാൽ പറഞ്ഞതാണു്. മലയാളികളേ, നമ്മൾ ഇതെങ്ങെനെ സഹിക്കും!

ഹുതാശനശ്ചന്ദനപങ്കശ്ശീതളമായ മനസ്സുകൾക്കുടമകളായ മൂപ്പനേയും മുഗ്ദ്ധസ്സാന്നിദ്ധ്യക്വാണനേയുമ്പോലുള്ള നിരക്ഷരകുക്ഷികളെല്ലാമിക്ഷണമിക്ഷിതിവിട്ടകലേണം.

എന്നതായിരുന്നു റ്റ്വിറ്ററിലൂടെ ഞാൻ ആഹ്വാനം ചെയ്യാൻ ഉദ്ദേശിച്ചതു്. സ്പേയ്സസ് (അകലം), ചില്ലു്, വിരാമ ചിഹ്നം എന്നിവയുൾപ്പടെ വെറും 66 അക്ഷരങ്ങൾ മാത്രമാണു് ഈ വാചകത്തിലുള്ളതു്. എന്നാൽ റ്റ്വിറ്ററിന്‍റെ കണ്ണിൽ ഈ വാചകത്തിൽ 141 ക്യാരക്റ്റേഴ്സ് ഉണ്ടുപോലും. (ചില്ലുകളെ സാധാരണഗതിയിൽ അക്ഷരങ്ങളായി കൂട്ടാറില്ലെങ്കിലും പദപ്രശ്നത്തിൽ ചില്ലിനെ അക്ഷരമാക്കി കണക്കാക്കാറുണ്ടു്.)

എന്താ ഇതിങ്ങിനെ? ലാറ്റിൻ സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്ന ഇംഗ്ലീഷുപോലുള്ള ഭാഷകളിൽ ഒരു യൂണികോഡ് ക്യാരക്റ്റർ കോഡ് ഒരു ഗ്ലിഫിനെ പ്രതിനിധാനം ചെയ്യുന്നതിനാൽ 140 അക്ഷരങ്ങളുള്ള വാക്കുകൾക്കും വാചകങ്ങൾക്കും 140 യൂണികോഡ് ക്യാരക്റ്റർ കോഡുകൾ ഉപയോഗിച്ചാൽ മതി. എന്നാൽ, പലപ്പോഴും ഒന്നിലധികം ക്യാരക്റ്ററുകൾ ഉപയോഗിച്ചു് ഒരു ഗ്ലിഫ് നിർമ്മിച്ചെടുക്കുന്ന മലയാളം പോലുള്ള കോം‍പ്ലക്സ് സ്ക്രിപ്റ്റ് ഭാഷകൾക്കു് 140 അക്ഷരമെത്താൻ 200-ഉം 250-ഉം വരെ ക്യാരക്റ്ററുകൾ ഉപയോഗിക്കേണ്ടി വരുന്നു. 66 അക്ഷരങ്ങളുള്ള വാചകമുണ്ടാക്കാൻ 141 യൂണികോഡ് ക്യാരക്റ്റർ കോഡുകൾ ഉപയോഗിക്കേണ്ടി വന്നതാണു് മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണനുപറ്റിയ തെറ്റു്.

ഉദാഹരണത്തിനു്, മലയാളം പദപ്രശ്നത്തിൽ ഗ്ദ്ധ്യ എന്നത് ഒരു അക്ഷരമായി കണക്കാക്കുമ്പോൾ റ്റ്വിറ്റർ അതിനെ ഏഴക്ഷരമായാണു് എണ്ണുക. ഗ്ദ്ധ്യ എന്ന അക്ഷരമുണ്ടാക്കാൻ ഗ, ്, ദ, ്, ധ, ്, യ എന്നീ ഏഴു യൂണികോഡ് കഥാപാത്രങ്ങൾ രംഗത്തുണ്ടു് എന്നതു തന്നെ കാരണം. ഇതുപോലുള്ള അക്ഷരക്കൂട്ടമങ്ങൊന്നായ് അർത്ഥം ഭേദിച്ചിടുംപടിയോ അല്ലാതെയോ ഉപയോഗിക്കുന്ന മലയാളികളെയാണു് റ്റ്വിറ്ററിന്‍റെ അക്ഷരമെണ്ണൽ വെട്ടിലാക്കുന്നതു്.

ചുരുക്കത്തിൽ, ഓരോ റ്റ്വീറ്റുകളിലും 140 ക്യാരക്റ്റർ അനിവദനീയമാണെങ്കിലും, സാധാരണമലയാളിയ്ക്കു് 50-നും 80-നും ഇടയ്ക്കു അക്ഷരങ്ങൾ മാത്രമേ ഒരു റ്റ്വീറ്റിൽ കൊള്ളിക്കാനാവുന്നുള്ളൂ. അതായതു്, ലാറ്റിൻ സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്നവർ ഒരു പ്രാവശ്യം റ്റ്വീറ്റു ചെയ്യുന്നിടത്തു്, കോം‍പ്ലക്സ് സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്നവർ രണ്ടോ അതിലധികമോ റ്റ്വീറ്റുകൾ ചെയ്യേണ്ടി വരുന്നു. ചില നേരത്തു് (ഇബ്രുവല്ല) എഴുതാനുള്ളതു മുഴുവൻ എഴുതാനാവാതെ വല്ലാത്ത ബുദ്ധിമുട്ടനുഭവിക്കേണ്ടി വരുന്ന മലയാളി റ്റ്വിറ്റർ ഉപഭോക്താക്കളുടെ എണ്ണം ചില്ലറയല്ല.



(ചിത്രം: ആദിത്യന്‍റെ റ്റ്വീറ്റ്)

ഒരു റ്റ്വീറ്റിൽ പറയാനുള്ള വക പല റ്റ്വീറ്റിലാക്കേണ്ടി വരുമ്പോൾ തന്നെ പറയാനുള്ളതിന്‍റെ പഞ്ഛ് നഷ്ടപ്പെടും. മുമ്പെഴുതിയതിന്‍റെ ബാക്കിയാണു് രണ്ടാമതെഴുതിയത് എന്ന ആമുഖത്തോടെ രണ്ടാമത്തെ റ്റ്വീറ്റ് തുടങ്ങാമെന്നുവച്ചാൽ ആമുഖം പകുതിയിലേറെ സ്ഥലമപഹരിക്കും. ഇതു് ന്യൂനപക്ഷങ്ങൾക്കെതിരേയുള്ള അവഗണനയല്ലെങ്കിൽ പിന്നെയെന്താണു്?

ഈ ‘കീഴാളൻ’ മനോഭാവം റ്റ്വിറ്ററിൽ മാത്രം ഒതുങ്ങുന്നില്ല. വിൻഡോസ് ഓപറേറ്റിംഗ് സിസ്റ്റത്തിൽ ഡയറക്റ്ററികളുണ്ടാക്കാൻ 260 ക്യാരക്റ്റേഴ്സിനു പകരം മലയാളിക്കു ലഭിക്കുന്നതു് 150-ൽപ്പരം അക്ഷരങ്ങൾ മാത്രം. വിൻഡോസിലെ മറ്റുപല ആപ്ലികേയ്ഷനുകളിലും ഫയൽ പേരുകൾക്കും മറ്റും ക്യാരക്റ്റർ പരിധിയുണ്ടു്. എന്തിനു്, ഡൊമൈൻ പേരുകൾക്കുള്ള 63 ക്യാരക്റ്റർ ലിമിറ്റുപോലും മലയാളിക്കു് സ്വന്തമാക്കണമെങ്കിൽ കൂട്ടക്ഷരങ്ങളോ സ്വരചിഹ്നങ്ങളോ ഉപയോഗിക്കാതെ വേണം എന്നതാണു് അവസ്ഥ.

മൈക്രോസോഫ്റ്റ് വേഡ് പോലുള്ള സോഫ്റ്റ്‍വെയറുകൾ അക്ഷരങ്ങളുടെ എണ്ണം തെറ്റായി പറയുന്നതും പ്രശ്നമാണു്. അക്ഷരങ്ങളുടെ എണ്ണത്തിൽ കൃത്യതവേണ്ടുന്ന ഒന്നാണല്ലോ ശ്ലോകനിർമ്മാണം. സമവൃത്തങ്ങളിലുള്ള ശ്ലോകങ്ങളിൽ വരികളിലെ എണ്ണം തുല്യമാവേണ്ടതുണ്ടു്. ഒരു വരിയിൽ വെറും 11 അക്ഷരങ്ങൾ വേണ്ടുന്ന രഥോദ്ധതവൃത്തത്തിലെ ഈ ശ്ലോകത്തിനു് (കുത്തും കോമയുമുൾപ്പടെ 58 അക്ഷരങ്ങൾ) 108 അക്ഷരങ്ങളുണ്ടെന്നാണു് മൈക്രോസോഫ്റ്റ് വേഡ് പറയുന്നതു്. കുറേക്കൂടി പ്രാവർത്തികമായി ചിന്തിച്ചാൽ, മത്സരപ്പരീക്ഷയ്ക്കോ മറ്റോ 1000 അക്ഷരത്തിൽ കുറയാതെ ലേഖനം എഴുതുക എന്ന നിബന്ധനയുണ്ടെന്നു വിചാരിക്കുക. വേഡിൽ എഴുതുന്ന ലേഖനത്തിലെ അക്ഷരങ്ങളുടെ എണ്ണം സ്വയം എണ്ണിനോക്കേണ്ടുന്ന ഗതികേടു വരുന്നു.

ഇക്കാര്യം അധികം പ്രയാസമില്ലാതെ പരിഹരിക്കാവുന്നതേയുള്ളൂ. ക്യാരക്റ്റർ എണ്ണുന്നതിനു പകരം ഖ്ലസ്റ്ററുകൾ എണ്ണുക. ക്യാരക്റ്ററുകളെ സം‌യോജിപ്പിച്ചോ [combined] അടുക്കിയോ [stacked] ഉണ്ടാക്കിയെടുക്കുന്ന ഗ്ലിഫിനെയാണു് ഖ്ലസ്റ്റർ എന്നു വിളിക്കുന്നതു്. ഇപ്പോൾത്തെന്നെ, വിഘടിക്കാനാവാത്ത ഖ്ലസ്റ്ററുകളെ (indivisible clusters) വിൻഡോസ് ആപ്ലികേയ്ഷനുകളെല്ലാം ഒരു entity ആയാണു് കണക്കാക്കുന്നതു്. നോട്പാടിലും വേഡിലും മറ്റും ഇത്തരം ഖ്ലസ്റ്ററുകൾ ഒരുമിച്ചാണു് സെലക്റ്റ് ആവുന്നതു്. Arrow keys ഉപയോഗിച്ചു് navigate ചെയ്താൽ, ഒരു ഖ്ലസ്റ്റർ ചാടിക്കടക്കാൻ ഒരു ഖഴ്സർ നീക്കം (cursor move) മതി. അതായതു്, മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്നെഴുതിയിട്ടു് arrow keys ഉപയോഗിച്ചു് മു മുതൽ ൻ വരെ എത്തിപ്പെടാൻ എട്ടുതവണ ഖഴ്സർ നീക്കിയാൽ മതി. മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്ന വാക്കിനു് 24 അക്ഷരമുണ്ടെന്നതിനു പകരം 8 ഖ്ലസ്റ്റേഴ്സ് ഉണ്ടെന്നു പറഞ്ഞാൽ അതു് മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്ന വാക്കിലെ അക്ഷരങ്ങളുടെ എണ്ണമായി നമുക്കു് കണക്കാക്കാവുന്നതേയുള്ളൂ. (ഈ ഉച്ചാരണമൊക്കെ ശരിയാണോ ഭഗവാനേ! കർമ്മഫലം, അല്ലാതെന്തു്?)

വൃത്തസഹായി അക്ഷരങ്ങളുടെ എണ്ണം കൃത്യമായി കണക്കാക്കുന്നുണ്ടു് എന്നതു് അത്ഭുതത്തിനു് വകനൽകേണ്ടുന്ന കാര്യമല്ല. വേഡ് ഒഴികെയുള്ള എഡിറ്റിംഗ് സോഫ്റ്റ്‍വെയറുകൾ ഈ പ്രശ്നം എങ്ങനെയാണു് പരിഹരിച്ചിരിക്കുന്നതു് എന്നറിയാൻ താല്പര്യമുണ്ടു്.

(മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ ഈ പോസ്റ്റിന്‍റെ ഐശ്വര്യം.)

8 പ്രതികരണങ്ങൾ:

  1. cALviN::കാല്‍‌വിന്‍

    പരിപൂർണപിന്തുണ പ്രഖ്യാപിച്ചുകൊള്ളുന്നു

  2. അരവിന്ദ് :: aravind

    ങും! അപ്പോള്‍ അങ്ങനെയൊക്കെയാണ് കാര്യങ്ങള്‍. ട്വിറ്റര്‍ സായിപ്പിന് എണ്ണാനറിയെല്ലെന്നാണ് കരുതിയത്!
    സീസ്മിക്കിലൊകെ പോയി ഈ കണക്കിലുള്ള '140+' മലയാളം ട്വീറ്റടിച്ചാല്‍ അവര്‍ അക്സെപ്റ്റ് ചെയ്യുമെങ്കിലും ട്വിറ്റര്‍ പേജില്‍ അപ്‌ഡേറ്റ് ആവില്ല!

    എല്ലാം പറയണമല്ലോ..പറയാനുള്ളത് നൂറ്റി നാല്പ്പതില്‍ ഒതുക്കുന്നത് ഒരു സുഖമുള്ള കാര്യമാണ് കേട്ടോ. ഫേസ് ബുക്കിലെ പോലെ വളവള എഴുത്തും പടവും ഗിഫ്റ്റും കിടുതാപ്പും ഒന്നും ഇല്ലാ താനും.

  3. Amarghosh | വടക്കൂടന്‍

    അതെല്ലാം i18n പൂര്‍ണ്ണമായും നടപ്പാക്കാത്തതിനാലാണെന്ന് വെക്കാം. പക്ഷേ "Oops, your tweet was longer than 140 chars" എന്ന് പറയുന്നതിന്റെ കൂടെ നമ്മള്‍ കഷ്ടപ്പെട്ട് ടൈപ്പ് ചെയ്തുണ്ടാക്കിയത് സ്വാഹയാക്കിക്കളയുന്നതാണ് ഏറ്റവും കലിപ്പുജനകം. വീണ്ടും ഒന്നേന്ന് ടൈപ്പ് ചെയ്ത്, അക്ഷരങ്ങളുടെ എണ്ണം വെട്ടിക്കുറച്ച് വരുമ്പോളേക്കും ഒരു ബ്ലോഗെഴുതാനുള്ള സമയമെടുക്കും ഒരു ട്വീറ്റിടാന്‍.

  4. വക്കാരിമഷ്‌ടാ

    കാല്‍ വിന്‍ ഫുള്‍ പിന്തുണച്ചാല്‍ ഞാന്‍ ഡബിള്‍ വിന്‍, ഡബിള്‍ ഫുള്‍ പിന്തുണ.

  5. ഹരിത്

    :)

  6. cALviN::കാല്‍‌വിന്‍

    @Blogger Amarghosh | വടക്കൂടന്‍,

    എനിക്കാ പ്രശ്നമില്ലല്ലോ.. 140 ഇൽ കൂടുതൽ ആണെങ്കിൽ അപ്ഡേറ്റ് ബട്ടൺ ഓട്ടോ ഡിസേബിൾ ആവും. ഏഡിറ്റ് ചെയ്ത് എണ്ണം കുറക്കുമ്പോൾ വീണ്ടും എനാബിൾ ആവും. അത് കൊണ്ട് ടൈപ് ചെയ്തത് നഷ്ടപ്പെടുന്ന പ്രശ്നമേയില്ല

  7. ആരുടെയുമല്ലാത്ത നായര്‍

    വടക്കൂടാ, സെയിം പ്രാബ്ലം ഹിയര്‍ ടൂ. പ്രോബ്ലം ഇസ് ഒന്‍ലി വിത് മലയാളം ലാന്‍‌ഗ്‌വിജ്. ദേര്‍ഫോര്‍ ഐ ഡിസൈഡഡ് റ്റു സ്വിച് റ്റു റ്റ്വീറ്റിങ് ഇന്‍ എന്‍‌ഗ്‌ലീഷ് ലൈക് ദിസ് കമന്റ്

    കാല്‍‌വിന്‍: മലയാളത്തില്‍ ഒരു 144 ടൈപ്പിനോക്കൂ. എന്നിട്ട് ലോ ഓഫ് ഡിമിനിഷിങ് കാരക്റ്റെരിസ്റ്റിക്‍ മാനിപ്പുലേഷ്യന്‍ വെച്ച് ഓരോ ജൂനിയര്‍ ആര്‍റ്റിസ്റ്റ് ക്യാരക്റ്റര്‍ കുറയ്ക്കുക. വെന്‍ യൂ റീച്ച് 140, ദി അപ്‌ഡേറ്റ് ബട്ടണ്‍ വില്‍ ഗെറ്റ് എനേബിള്‍‌ഡ്. ട്രൈ ക്ലിക്‍കിങ് ഇറ്റ് ആണ്‍റ്റ് എക്സ്പീരിയന്‍സ് ദി കോണ്‍‌സിക്വന്‍സസ് ഫസ്റ്റ് ഹാന്‍‌ഡ്

  8. cALviN::കാല്‍‌വിന്‍

    ആരുടെയുമല്ലാത്ത നായര്‍,

    ദതൊരു വാലിഡ് സിനാരിയോ തന്നെ.... കൊറക്കാൻ അറിയാത്ത ട്വിറ്റർ...