Thursday, December 24, 2009

ഫൈവ് വൈസ്

അടുത്തകാലത്തുണ്ടായ ഒരു പ്രധാന പ്രശ്നത്തിന്‍റെ കാരണം ഫൈവ് വൈസ് (Five Whys) ഉപയോഗിച്ചു മനസ്സിലാക്കാനൊരു ശ്രമം നടത്തിയതാണു് ചുവടേ:

അച്ചു: “എനിക്കു് ഒന്നുമുതല്‍ നൂറുവരെ എഴുതാന്‍ പറ്റില്ല.”

ഞാന്‍: “Why?”

അച്ചു: “എഴുതുമ്പോള്‍ തെളിയുന്നില്ല.”

ഞാന്‍: “Why?”

അച്ചു: “ഈ പെന്‍‍സിലിനു് മുനയില്ല. കൂര്‍പ്പിക്കാന്‍ പറ്റുന്നില്ല.”

ഞാന്‍: “Why?”

അച്ചു: “ഷാര്‍പ്നര്‍ ഇല്ല, അച്ഛാ!”

ഞാന്‍: “Why?”

അച്ചു: “ഇവിടെ ഉള്ളതു കാണാനില്ല, പുതിയതു വേണമെന്നു പറയാന്‍ മറന്നല്ലോ!”

ഞാന്‍: “Why?”

അച്ചു: “എനിക്കു് പഠിക്കുന്നതു് ഇഷ്ടമല്ലെന്നു് അച്ഛനു് പണ്ടേ അറിഞ്ഞുകൂടേ?”

മൂലകാരണം കണ്ടെത്തുവാന്‍ Five Whys പറ്റിയ ഉപാധിതന്നെ.

Thursday, December 17, 2009

മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ

വെറും 140 അക്ഷരങ്ങളിൽ താഴെ ജീവിതം വിവരിക്കാനുതകുന്ന റ്റ്വിറ്റർ എന്ന സർവീസിനെ ആർക്കും പരിചയപ്പെടുത്തേണ്ടുന്ന കാര്യമില്ലല്ലോ. എന്നാൽ കേട്ടോളൂ: റ്റ്വിറ്ററിന്‍റെ മലയാള ഭാഷാവിവേചനത്തിൽ പ്രതിഷേധിച്ചു് ബ്ലോഗുകറുപ്പിക്കേണ്ടുന്ന നേരമായി. എന്താണെന്നോ? 140 അക്ഷരങ്ങൾ എണ്ണിപ്പെറുക്കി മലയാളഭാഷയിൽ റ്റ്വീറ്റു ചെയ്യാൻ ചെന്നു നോക്കൂ. വിവരമറിയും.

140 പോയിട്ടു്, അതിന്‍റെ പകുതി എണ്ണം പോലും അക്ഷരങ്ങളില്ലാത്ത ഒരു വാചകവുമായി റ്റ്വീറ്റാൻ ചെന്നപ്പോൾ റ്റ്വിറ്റർ പറയുകയാണു് ഒരക്ഷരം കൂടുതലാണെന്നു്. ഇതു് പോലീസിനു് എല്ലു കൂടിയതുപോലെയൊന്നുമല്ല. റ്റ്വിറ്റർ പറഞ്ഞാൽ പറഞ്ഞതാണു്. മലയാളികളേ, നമ്മൾ ഇതെങ്ങെനെ സഹിക്കും!

ഹുതാശനശ്ചന്ദനപങ്കശ്ശീതളമായ മനസ്സുകൾക്കുടമകളായ മൂപ്പനേയും മുഗ്ദ്ധസ്സാന്നിദ്ധ്യക്വാണനേയുമ്പോലുള്ള നിരക്ഷരകുക്ഷികളെല്ലാമിക്ഷണമിക്ഷിതിവിട്ടകലേണം.

എന്നതായിരുന്നു റ്റ്വിറ്ററിലൂടെ ഞാൻ ആഹ്വാനം ചെയ്യാൻ ഉദ്ദേശിച്ചതു്. സ്പേയ്സസ് (അകലം), ചില്ലു്, വിരാമ ചിഹ്നം എന്നിവയുൾപ്പടെ വെറും 66 അക്ഷരങ്ങൾ മാത്രമാണു് ഈ വാചകത്തിലുള്ളതു്. എന്നാൽ റ്റ്വിറ്ററിന്‍റെ കണ്ണിൽ ഈ വാചകത്തിൽ 141 ക്യാരക്റ്റേഴ്സ് ഉണ്ടുപോലും. (ചില്ലുകളെ സാധാരണഗതിയിൽ അക്ഷരങ്ങളായി കൂട്ടാറില്ലെങ്കിലും പദപ്രശ്നത്തിൽ ചില്ലിനെ അക്ഷരമാക്കി കണക്കാക്കാറുണ്ടു്.)

എന്താ ഇതിങ്ങിനെ? ലാറ്റിൻ സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്ന ഇംഗ്ലീഷുപോലുള്ള ഭാഷകളിൽ ഒരു യൂണികോഡ് ക്യാരക്റ്റർ കോഡ് ഒരു ഗ്ലിഫിനെ പ്രതിനിധാനം ചെയ്യുന്നതിനാൽ 140 അക്ഷരങ്ങളുള്ള വാക്കുകൾക്കും വാചകങ്ങൾക്കും 140 യൂണികോഡ് ക്യാരക്റ്റർ കോഡുകൾ ഉപയോഗിച്ചാൽ മതി. എന്നാൽ, പലപ്പോഴും ഒന്നിലധികം ക്യാരക്റ്ററുകൾ ഉപയോഗിച്ചു് ഒരു ഗ്ലിഫ് നിർമ്മിച്ചെടുക്കുന്ന മലയാളം പോലുള്ള കോം‍പ്ലക്സ് സ്ക്രിപ്റ്റ് ഭാഷകൾക്കു് 140 അക്ഷരമെത്താൻ 200-ഉം 250-ഉം വരെ ക്യാരക്റ്ററുകൾ ഉപയോഗിക്കേണ്ടി വരുന്നു. 66 അക്ഷരങ്ങളുള്ള വാചകമുണ്ടാക്കാൻ 141 യൂണികോഡ് ക്യാരക്റ്റർ കോഡുകൾ ഉപയോഗിക്കേണ്ടി വന്നതാണു് മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണനുപറ്റിയ തെറ്റു്.

ഉദാഹരണത്തിനു്, മലയാളം പദപ്രശ്നത്തിൽ ഗ്ദ്ധ്യ എന്നത് ഒരു അക്ഷരമായി കണക്കാക്കുമ്പോൾ റ്റ്വിറ്റർ അതിനെ ഏഴക്ഷരമായാണു് എണ്ണുക. ഗ്ദ്ധ്യ എന്ന അക്ഷരമുണ്ടാക്കാൻ ഗ, ്, ദ, ്, ധ, ്, യ എന്നീ ഏഴു യൂണികോഡ് കഥാപാത്രങ്ങൾ രംഗത്തുണ്ടു് എന്നതു തന്നെ കാരണം. ഇതുപോലുള്ള അക്ഷരക്കൂട്ടമങ്ങൊന്നായ് അർത്ഥം ഭേദിച്ചിടുംപടിയോ അല്ലാതെയോ ഉപയോഗിക്കുന്ന മലയാളികളെയാണു് റ്റ്വിറ്ററിന്‍റെ അക്ഷരമെണ്ണൽ വെട്ടിലാക്കുന്നതു്.

ചുരുക്കത്തിൽ, ഓരോ റ്റ്വീറ്റുകളിലും 140 ക്യാരക്റ്റർ അനിവദനീയമാണെങ്കിലും, സാധാരണമലയാളിയ്ക്കു് 50-നും 80-നും ഇടയ്ക്കു അക്ഷരങ്ങൾ മാത്രമേ ഒരു റ്റ്വീറ്റിൽ കൊള്ളിക്കാനാവുന്നുള്ളൂ. അതായതു്, ലാറ്റിൻ സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്നവർ ഒരു പ്രാവശ്യം റ്റ്വീറ്റു ചെയ്യുന്നിടത്തു്, കോം‍പ്ലക്സ് സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുന്നവർ രണ്ടോ അതിലധികമോ റ്റ്വീറ്റുകൾ ചെയ്യേണ്ടി വരുന്നു. ചില നേരത്തു് (ഇബ്രുവല്ല) എഴുതാനുള്ളതു മുഴുവൻ എഴുതാനാവാതെ വല്ലാത്ത ബുദ്ധിമുട്ടനുഭവിക്കേണ്ടി വരുന്ന മലയാളി റ്റ്വിറ്റർ ഉപഭോക്താക്കളുടെ എണ്ണം ചില്ലറയല്ല.



(ചിത്രം: ആദിത്യന്‍റെ റ്റ്വീറ്റ്)

ഒരു റ്റ്വീറ്റിൽ പറയാനുള്ള വക പല റ്റ്വീറ്റിലാക്കേണ്ടി വരുമ്പോൾ തന്നെ പറയാനുള്ളതിന്‍റെ പഞ്ഛ് നഷ്ടപ്പെടും. മുമ്പെഴുതിയതിന്‍റെ ബാക്കിയാണു് രണ്ടാമതെഴുതിയത് എന്ന ആമുഖത്തോടെ രണ്ടാമത്തെ റ്റ്വീറ്റ് തുടങ്ങാമെന്നുവച്ചാൽ ആമുഖം പകുതിയിലേറെ സ്ഥലമപഹരിക്കും. ഇതു് ന്യൂനപക്ഷങ്ങൾക്കെതിരേയുള്ള അവഗണനയല്ലെങ്കിൽ പിന്നെയെന്താണു്?

ഈ ‘കീഴാളൻ’ മനോഭാവം റ്റ്വിറ്ററിൽ മാത്രം ഒതുങ്ങുന്നില്ല. വിൻഡോസ് ഓപറേറ്റിംഗ് സിസ്റ്റത്തിൽ ഡയറക്റ്ററികളുണ്ടാക്കാൻ 260 ക്യാരക്റ്റേഴ്സിനു പകരം മലയാളിക്കു ലഭിക്കുന്നതു് 150-ൽപ്പരം അക്ഷരങ്ങൾ മാത്രം. വിൻഡോസിലെ മറ്റുപല ആപ്ലികേയ്ഷനുകളിലും ഫയൽ പേരുകൾക്കും മറ്റും ക്യാരക്റ്റർ പരിധിയുണ്ടു്. എന്തിനു്, ഡൊമൈൻ പേരുകൾക്കുള്ള 63 ക്യാരക്റ്റർ ലിമിറ്റുപോലും മലയാളിക്കു് സ്വന്തമാക്കണമെങ്കിൽ കൂട്ടക്ഷരങ്ങളോ സ്വരചിഹ്നങ്ങളോ ഉപയോഗിക്കാതെ വേണം എന്നതാണു് അവസ്ഥ.

മൈക്രോസോഫ്റ്റ് വേഡ് പോലുള്ള സോഫ്റ്റ്‍വെയറുകൾ അക്ഷരങ്ങളുടെ എണ്ണം തെറ്റായി പറയുന്നതും പ്രശ്നമാണു്. അക്ഷരങ്ങളുടെ എണ്ണത്തിൽ കൃത്യതവേണ്ടുന്ന ഒന്നാണല്ലോ ശ്ലോകനിർമ്മാണം. സമവൃത്തങ്ങളിലുള്ള ശ്ലോകങ്ങളിൽ വരികളിലെ എണ്ണം തുല്യമാവേണ്ടതുണ്ടു്. ഒരു വരിയിൽ വെറും 11 അക്ഷരങ്ങൾ വേണ്ടുന്ന രഥോദ്ധതവൃത്തത്തിലെ ഈ ശ്ലോകത്തിനു് (കുത്തും കോമയുമുൾപ്പടെ 58 അക്ഷരങ്ങൾ) 108 അക്ഷരങ്ങളുണ്ടെന്നാണു് മൈക്രോസോഫ്റ്റ് വേഡ് പറയുന്നതു്. കുറേക്കൂടി പ്രാവർത്തികമായി ചിന്തിച്ചാൽ, മത്സരപ്പരീക്ഷയ്ക്കോ മറ്റോ 1000 അക്ഷരത്തിൽ കുറയാതെ ലേഖനം എഴുതുക എന്ന നിബന്ധനയുണ്ടെന്നു വിചാരിക്കുക. വേഡിൽ എഴുതുന്ന ലേഖനത്തിലെ അക്ഷരങ്ങളുടെ എണ്ണം സ്വയം എണ്ണിനോക്കേണ്ടുന്ന ഗതികേടു വരുന്നു.

ഇക്കാര്യം അധികം പ്രയാസമില്ലാതെ പരിഹരിക്കാവുന്നതേയുള്ളൂ. ക്യാരക്റ്റർ എണ്ണുന്നതിനു പകരം ഖ്ലസ്റ്ററുകൾ എണ്ണുക. ക്യാരക്റ്ററുകളെ സം‌യോജിപ്പിച്ചോ [combined] അടുക്കിയോ [stacked] ഉണ്ടാക്കിയെടുക്കുന്ന ഗ്ലിഫിനെയാണു് ഖ്ലസ്റ്റർ എന്നു വിളിക്കുന്നതു്. ഇപ്പോൾത്തെന്നെ, വിഘടിക്കാനാവാത്ത ഖ്ലസ്റ്ററുകളെ (indivisible clusters) വിൻഡോസ് ആപ്ലികേയ്ഷനുകളെല്ലാം ഒരു entity ആയാണു് കണക്കാക്കുന്നതു്. നോട്പാടിലും വേഡിലും മറ്റും ഇത്തരം ഖ്ലസ്റ്ററുകൾ ഒരുമിച്ചാണു് സെലക്റ്റ് ആവുന്നതു്. Arrow keys ഉപയോഗിച്ചു് navigate ചെയ്താൽ, ഒരു ഖ്ലസ്റ്റർ ചാടിക്കടക്കാൻ ഒരു ഖഴ്സർ നീക്കം (cursor move) മതി. അതായതു്, മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്നെഴുതിയിട്ടു് arrow keys ഉപയോഗിച്ചു് മു മുതൽ ൻ വരെ എത്തിപ്പെടാൻ എട്ടുതവണ ഖഴ്സർ നീക്കിയാൽ മതി. മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്ന വാക്കിനു് 24 അക്ഷരമുണ്ടെന്നതിനു പകരം 8 ഖ്ലസ്റ്റേഴ്സ് ഉണ്ടെന്നു പറഞ്ഞാൽ അതു് മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ എന്ന വാക്കിലെ അക്ഷരങ്ങളുടെ എണ്ണമായി നമുക്കു് കണക്കാക്കാവുന്നതേയുള്ളൂ. (ഈ ഉച്ചാരണമൊക്കെ ശരിയാണോ ഭഗവാനേ! കർമ്മഫലം, അല്ലാതെന്തു്?)

വൃത്തസഹായി അക്ഷരങ്ങളുടെ എണ്ണം കൃത്യമായി കണക്കാക്കുന്നുണ്ടു് എന്നതു് അത്ഭുതത്തിനു് വകനൽകേണ്ടുന്ന കാര്യമല്ല. വേഡ് ഒഴികെയുള്ള എഡിറ്റിംഗ് സോഫ്റ്റ്‍വെയറുകൾ ഈ പ്രശ്നം എങ്ങനെയാണു് പരിഹരിച്ചിരിക്കുന്നതു് എന്നറിയാൻ താല്പര്യമുണ്ടു്.

(മുഗ്ദ്ധസാന്നിദ്ധ്യക്വാണൻ ഈ പോസ്റ്റിന്‍റെ ഐശ്വര്യം.)