February 2008

തീവണ്ടി and the girl – ഒരു Valentine വിലാപകാവ്യം

(1992, Bombay, Waiting for a train to go to an interview)
Perhaps if I miss it
I may lose my bread;
But if I rush to get it
It will cost my head.
തീവണ്ടി കിട്ടിയില്ലെന്നാല്‍
ജോലി കിട്ടാതിരുന്നിടാം;
അതു കിട്ടാനോടിയെന്നാല്‍
തല പോയെന്നുമായിടാം.
Perhaps if I miss her
I may lose a wife;
But if I haste to get her
It will cost my life.
അവളെക്കിട്ടിയില്ലെങ്കില്‍
ഭാര്യയില്ലാതെയായിടാം;
കിട്ടാനായി പ്രയത്നിച്ചാല്‍
തടി കേടായി വന്നിടാം.


(1994, Valentine’s day, Bombay)
The train knew my mind
And stopped – oh, how kind!
I achieved my bread
Without losing my head.
മമ മനമറിഞ്ഞിട്ടു തീവണ്ടിയിന്നെന്റെ-
യരികത്തു വന്നു നിന്നല്ലോ
തലയെന്റെ ഗളമതിന്‍ മുകളിലിരിപ്പുണ്ടു
കരതാരില്‍ ജോലി വന്നല്ലോ
The girl saw my heart
And came – oh, how smart!
I achieved my wife
Without losing my life.
അവളെന്റെ ഹൃദയം മിടിക്കുന്ന ശബ്ദത്തില്‍
തരളിതയായി വന്നെത്തി
ഒരു നല്ല ഭാര്യയെക്കിട്ടുമെനിക്കിപ്പോള്‍
ഉയിരുണ്ടു മമ ശരീരത്തില്‍!


(Some time later…)
The train went forward
Before I could catch;
I fell down in dirt
And scattered into pieces.
കേറിപ്പിടിക്കുന്നതിന്റെ മുമ്പയ്യയ്യോ
തീവണ്ടിയെന്നെയും വിട്ടുപോയേ…
നാറുന്ന ചേറില്‍ പതിച്ചു ഞാനന്നേരം
ആയിരം പീസുപീസായിപ്പോയേ..
(താനാരോ… തെന്നാരോ…)
The girl
Went
Away
Before
I could
Love her.
My life
Lost its
Rhythm
And rhyme
And
I
Became
A
Modern
Poet.
എനിക്കു്
ഒന്നു
കാമിക്കാന്‍
കഴിയുന്നതിനു മുമ്പു്
അവള്‍ പോയി.
എന്റെ ജീവിതം
വൃത്തമില്ലാതെ
പ്രാസമില്ലാതെ
ഞാനൊരു
ആധുനികകവിയായി
മാറി.

സമര്‍പ്പണം: ബൂലോഗത്തിലെ നിരാശാകാമുകനും ഏറ്റവും പുതിയ യുവ-ആധുനിക-കവിയുമായ പച്ചാളത്തിനു്.

ആക്ഷേപഹാസ്യം (satire)
നര്‍മ്മം
English

Comments (18)

Permalink

കുട്ടികളും വയറിളക്കവും

ചില പോസ്റ്റുകള്‍ കുട്ടികളെപ്പോലെയാണു്. മറ്റു ചിലവ വയറിളക്കം പോലെയും.

വളരെയധികം കാലം ആലോചിച്ചിട്ടാണു് ആദ്യത്തെ ജനുസ്സില്‍ പെടുന്ന പോസ്റ്റുകളില്‍ ഒരെണ്ണം‍ ഉണ്ടാക്കുന്നതു്. വരുംവരായ്കകളെപ്പറ്റി ആലോചിക്കും, അതു പുറത്തു വരുമ്പോള്‍ ഏറ്റവും മികച്ചതാവാന്‍ കഴിയുന്നത്ര ശ്രമിക്കും, അതിനെപ്പറ്റി ആരെങ്കിലും നല്ല അഭിപ്രായം പറഞ്ഞാല്‍ അഭിമാനം കൊള്ളും, പിഴവുകള്‍ ചൂണ്ടിക്കാട്ടിയാല്‍ അതിനെ തിരുത്താന്‍ ശ്രമിക്കും, എത്ര പ്രായമായാലും വീണ്ടും വീണ്ടും പോയി അതിനെ ഓമനിക്കും.

പലപ്പോഴും ഉണ്ടാവണമെന്നു നാം ആഗ്രഹിക്കുന്ന സമയത്തൊന്നും അതു് ഉണ്ടാവണമെന്നില്ല. അതിനു് അതിന്റേതായ സമയമുണ്ടു്.

കുറേക്കാലം വേണമെന്നു വിചാരിച്ചിട്ടു് പ്രായോഗികബുദ്ധിമുട്ടുകള്‍ പരിഗണിച്ചു വേണ്ടെന്നു വെയ്ക്കുകയും ചെയ്താറുണ്ടു്. എങ്കിലും സൃഷ്ടി ആരംഭിച്ച ഒന്നിനെയും ഡിലീറ്റ് ചെയ്തു കളയാന്‍ ഒരിക്കലും തോന്നാറില്ല. ഗാന്ധാരിയുടെ ഗര്‍ഭം പോലെ, അവ പലപ്പോഴും കുറേക്കാലത്തിനു ശേഷം നൂറു കഷണങ്ങളായി ചിന്നിച്ചിതറുന്നതും കാണാറുണ്ടു്.

രണ്ടാമത്തെ ജനുസ്സില്‍ പെടുന്നവ പ്രായേണ കാലികപ്രാധാന്യമുള്ളവയായിരിക്കും. അപ്പോള്‍ ചെയ്തില്ലെങ്കില്‍ പിന്നെ പശ്ചാത്തപിച്ചിട്ടു കാര്യമില്ല എന്ന ചിന്തയില്‍ നിന്നാണു് അവ ഉണ്ടാകുന്നതു്. എഴുതണമെന്നു തോന്നിയാല്‍ പിന്നെ ഒരു കണ്ട്രോളും ഉണ്ടാവില്ല, തീരുന്നതു വരെ. എഴുതിക്കഴിഞ്ഞാലും തൃപ്തിയാകാത്തതു പോലെ തോന്നും. ചിലപ്പോള്‍ തുടര്‍ച്ചയായി പിന്നെയും ഉണ്ടായെന്നും വരും. ഉള്ളിലേയ്ക്കു കഴിയ്ക്കുന്ന ഭക്ഷണത്തിന്റെ ഗുണമാണോ എന്തോ, ഭാഗ്യവശാല്‍ ഇതു വരെ അവ വലിയ നാറ്റമൊന്നും ഉണ്ടാക്കിയിട്ടില്ല.

രണ്ടിനും വേദനയുണ്ടു്. ആദ്യത്തേതിന്റെ വേദനയാണു വലുതെന്നു ഭൂരിപക്ഷം ആളുകളും പറയുന്നു. എങ്കിലും കൂടുതല്‍ സുഖവും ആനന്ദവും തരുന്നതും ആദ്യത്തേതാണു് എന്റെ വിശ്വാസം.

വയറിളക്കങ്ങളുടെ ഇടയില്‍ വലയുമ്പോഴും വല്ലപ്പോഴും ഒരു കുട്ടിയുണ്ടാവണേ എന്നാണു പ്രാര്‍ത്ഥന.


പോസ്റ്റിലെ ഉള്ളടക്കത്തോളം തന്നെ പ്രാധാന്യം തലക്കെട്ടിനാണു് എന്നു രാം മോഹന്‍ പാലിയത്തു് പറഞ്ഞിട്ടുള്ളതായി ഒരു കിം‌വദന്തി പ്രചരിക്കുന്നുണ്ടു്. അതൊന്നു പരീക്ഷിച്ചു കളയാം എന്നു കരുതി. ഇനി വയറിളകുന്ന ഒരു കുട്ടിയുടെ പടം കൂടി കിട്ടിയിരുന്നെങ്കില്‍ വലിപ്പം കുറച്ചു് ഈ പോസ്റ്റിന്റെ മുകളില്‍ ഇടത്തുവശത്തായി കൊടുക്കാമായിരുന്നു 🙂

നര്‍മ്മം
നുറുങ്ങുചിന്തകള്‍

Comments (28)

Permalink

എഴുതുന്നതു പോലെ ഉച്ചരിക്കുന്ന ഭാഷ

പഴയൊരു നമ്പൂതിരിഫലിതമുണ്ടു്. ഇംഗ്ലീഷും മലയാളവും തമ്മില്‍ ഒരു താരതമ്യം. ഇംഗ്ലീഷില്‍ “സി-ഏ-റ്റി” എന്നെഴുതും, “ക്യാറ്റ്” എന്നു വായിക്കും, അര്‍ത്ഥം “പൂച്ച” എന്നും. മലയാളമാകട്ടേ “പൂച്ച” എന്നെഴുതും, “പൂച്ച” എന്നു വായിക്കും, അര്‍ത്ഥവും “പൂച്ച” എന്നു തന്നെ!

കുറച്ചു് ഇംഗ്ലീഷിലെ സ്പെല്ലിംഗിന്റെ പ്രശ്നവും ഏറെ നര്‍മ്മവും കലര്‍ന്ന ഈ കഥയ്ക്കു് ഒരു അനുബന്ധമുണ്ടു്. മലയാളം എഴുതുന്നതു പോലെയാണു എപ്പോഴും വായിക്കുന്നതു് എന്ന അബദ്ധധാരണയാണു് അതു്.

സുരേഷ് (സുറുമ) ഇവിടെ പറയുന്നു:

ഞാന്‍ ധരിച്ചിരിക്കുന്നത് മലയാളം എഴുതുന്നതുപോലെ വായിക്കപ്പെടുന്നതിനാല്‍ (‘ഹ്മ’, ‘ഹ്ന’ എന്നീ അപവാദങ്ങള്‍ ഒഴിവാക്കിയാല്‍) സ്പെല്ലിങ്ങ് എന്ന സംഗതി അപ്രസക്തമാണെന്നാണ്. അക്ഷരമറിയുന്ന, ഉച്ചാരണശുദ്ധി പാലിക്കുന്ന ആര്‍ക്കും മലയാളത്തിന്റെ സ്പെല്ലിങ്ങിനെ ചൊല്ലി വേവലാതിപ്പെടേണ്ട എന്നും.

എഴുതുന്നതു പോലെ വായിക്കുന്ന സന്ദര്‍ഭങ്ങളില്‍ പോലും സ്പെല്ലിംഗ് വ്യത്യാസങ്ങള്‍ ഇല്ലേ? അദ്ധ്യാപകന്‍/അധ്യാപകന്‍, പാര്‍വ്വതി/പാര്‍വതി, താത്പര്യം/താല്‍പ്പര്യം/താല്‍‌പര്യം, എനിക്കു്/എനിക്ക്, ഗംഗ/ഗങ്ഗ തുടങ്ങി. ഇംഗ്ലീഷിനുള്ളത്രയും തീക്ഷ്ണമല്ലെങ്കിലും മലയാളത്തിലും സ്പെല്ലിംഗ് വ്യത്യാസങ്ങള്‍ ഉണ്ടു്.

പറയാന്‍ വന്നതു് അതല്ല. മലയാളം എഴുതുന്നതു പോലെ ഉച്ചരിക്കുന്ന ഭാഷയാണു്, അഥവാ ഉച്ചരിക്കുന്നതു പോലെ എഴുതുന്ന ഭാഷയാണു് എന്നതു ശരിയാണോ എന്നതിനെപ്പറ്റിയാണു്. ഹ്മ, ഹ്ന എന്നീ അക്ഷരങ്ങളൊഴികെ എല്ലാറ്റിലും ഇതു ശരിയാണെന്നാണു സുരേഷ് വാ‍ദിക്കുന്നതു്.

ഈ കാര്യം എന്റെ എന്താണു് ഈ അറ്റോമിക് ചില്ലു പ്രശ്നം? എന്ന പോസ്റ്റിന്റെ കമന്റുകളിലും ഉണ്ടായി. റാല്‍മിനോവിന്റെ ചോദ്യം:

എ.ആര്‍ റഹ്മാന്‍ എന്നല്ല എ.ആര്‍ റഹ്‌മാന്‍ എന്നാണു് എപ്പോഴും കാണിക്കേണ്ടതു്. ഗൂഗ്ള്‍ ഒരിക്കലും അതു് കാണിക്കില്ല, രചന ഫോണ്ട് ഉപയോഗിക്കുന്നവരെ.

എന്താണു് റാല്‍മിനോവ് ഉദ്ദേശിച്ചതെന്നു വ്യക്തമായതു പിന്നീടു സുരേഷ് വിശദീകരിച്ചപ്പോഴാണു്.

ആ ‘റഹ്‌മാന്‍’ ഉദാഹരണം വളരെ പ്രസക്തമാണു്.’റഹ്‌മാന്‍’ എന്നെഴുതിയാല്‍ വായിക്കുന്നതും അങ്ങനെയാണു്.എന്നാല്‍ ‘റഹ്മാന്‍’ എന്നതില്‍ അങ്ങനെയല്ല.’ഹ്മ’ എന്ന കൂട്ടക്ഷരം ഉച്ചാരണത്തില്‍ ‘മ്ഹ’ എന്നായി മാറും.(ഉദാ: ബ്രഹ്മം.യേശുദാസിന്റെയോ ജയചന്ദ്രന്റെയോ ചില സിനിമാഗാനങ്ങള്‍ ഒന്നു് ഓര്‍ത്തുനോക്കൂ.ഉച്ചാരണത്തില്‍ ഇരുവരും സ്വതേ കണിശക്കാരാണു് ). ‘ഹ്ന’ കാര്യത്തിലും ഇതു തന്നെയാണു് കഥ.ഭാഷയില്‍ നിലനില്ക്കുന്ന ചില rare exceptions ആണിവ.

അപ്പോള്‍ അതാണു കാര്യം. ബ്രഹ്മം എന്നതിലെ ഹ്മ, ചിഹ്നം എന്നതിലെ ഹ്ന എന്നിവ സംസ്കൃതത്തില്‍ യഥാക്രമം മ്‌ഹ, ന്ഹ എന്നാണു് ഉച്ചരിക്കുന്നതു്. (മലയാളികള്‍ യഥാക്രമം ‘മ്മ’ എന്നും ‘ന്ന’ എന്നും. അതിന്റെ കാര്യം വഴിയേ.)

ആദ്യമായി ഒരു ചോദ്യം “ബ്രഹ്‌മം” എന്നു് അച്ചടിച്ചതു് ഒരു സംസ്കൃതപണ്ഡിതന്‍ എങ്ങനെ വായിക്കും? ബ്ര-ഹ്‌-മം എന്നോ ബ്ര-മ്‌-ഹം എന്നോ?

“ബ്രഹ്മം” എന്നതിനെ “ബ്രമ്ഹം” എന്നു വായിക്കുന്നതു് സംസ്കൃതത്തിന്റെ ഒരു രീതിയാണു്. ദേവനാഗരിയില്‍ (ഹിന്ദി, ഉദാഹരണത്തിനു്) ब्रह्म എന്നും रह्मान എന്നും (സാധാരണയായി അവര്‍ രഹമാന്‍-रहमान-എന്നാണു് എഴുതുന്നതു് എന്നു മറ്റൊരു കാര്യം.) എഴുതാന്‍ രണ്ടു ലിപിയില്ല. (സംസ്കൃതത്തില്‍ റഹ്മാന്‍ എന്നെഴുതുമോ എന്നറിയാത്തതിനാലാണു ഹിന്ദിയെ കൂട്ടുപിടിച്ചതു്.) മലയാളത്തില്‍ ഇതെഴുതുമ്പോള്‍ ഹ, മ എന്നിവയെ ചേര്‍ക്കാന്‍ ഹ്മ എന്ന കൂട്ടക്ഷരമോ ഹ്‌മ എന്ന രൂപമോ ഉപയോഗിക്കാം. അതല്ല, ഹ്മ എന്നു വെച്ചാല്‍ “മ്‌-ഹ” ആണെന്നും ഹ്‌മ എന്നു വെച്ചാല്‍ “ഹ്-മ” എന്നാണെന്നുമല്ല അര്‍ത്ഥം. ഈ രണ്ടു വിധത്തിലെഴുതിയാലും സംസ്കൃതപദങ്ങള്‍ ഉച്ചരിക്കുമ്പോള്‍ “മ്-ഹ” എന്നു് ഉച്ചരിക്കണം. അത്ര മാത്രം.


എഴുത്തും വായനയും തമ്മില്‍ സംസ്കൃതത്തില്‍ത്തന്നെയുള്ള ചില വ്യത്യാസങ്ങള്‍ മലയാളത്തിലും കടന്നിട്ടുണ്ടു്. ഗ, ജ, ബ, ഡ, ദ, യ, ര, റ, ല, ശ (ചിലപ്പോള്‍) എന്നീ അക്ഷരങ്ങളെ ‘അ’യ്ക്കു പകരം പദാദിയില്‍ ‘എ’ ചേര്‍ത്തു് ഉച്ചരിക്കുന്നതാണു് ഒരുദാഹരണം. ഗണപതി, ബലം, യമന്‍, രവി, ലത എന്നെഴുതിയിട്ടു് ഗെണപതി, ബെലം, യെമന്‍, രെവി, ലെത എന്നാണല്ലോ ഉച്ചരിക്കുന്നതു്. ഉച്ചരിക്കുന്നതു പോലെ എഴുതിയാല്‍ നമ്മള്‍ അക്ഷരത്തെറ്റാണെന്നു പറയുകയും ചെയ്യും.

ചിലപ്പോള്‍ രണ്ടുമുണ്ടു്. ശരി – ശെരി, പക്ഷേ ശബ്ദം – ശബ്ദം. ശരാശരിയോ?

പദാദിയില്‍ മാത്രമല്ല ഈ ഏകാരോച്ചാരണം. പ്രദക്ഷിണം എന്ന വാക്കു പ്രെദക്ഷിണം എന്നാണുച്ചരിക്കുന്നതു്. അതുപോലെ ഐ എന്ന സ്വരത്തിന്റെ ഉച്ചാരണം “അയ്” എന്നായതുകൊണ്ടു് (യാഥാസ്ഥിതികവൈയാകരണന്മാര്‍ ഇതു സമ്മതിക്കണമെന്നില്ല) അതു് “എയ്” എന്നും ആകും. “ദൈവം” എന്നതു “ദയ്‌വം” എന്നുച്ചരിക്കാതെ “ദെയ്‌വം” എന്നുച്ചരിക്കുന്നതു് ഉദാഹരണം. മറ്റു പല വാക്കുകളും രണ്ടു രീതിയിലും ഉച്ചരിച്ചു കേള്‍ക്കാറുണ്ടു്. “ജൈത്രയാത്ര” എന്ന വാക്കു് “ജയ്‌ത്രയാത്ര” എന്നും “ജെയ്‌ത്രയാത്ര” എന്നും ഉച്ചരിക്കുന്നവരുണ്ടു്. ത്രൈയംബകം തുടങ്ങി മറ്റു വാക്കുകളുമുണ്ടു്.

ഇതൊരു പ്രശ്നമാകുന്നതു് മറ്റു ഭാഷയിലെ പദങ്ങള്‍ മലയാളത്തില്‍ എഴുതുമ്പോഴാണു്. guide, balloon തുടങ്ങിയ ഇംഗ്ലീഷ് പദങ്ങളെയും ഗൈഡ്, ബലൂണ്‍ എന്നെഴുതി ഗെയ്ഡ്, ബെലൂണ്‍ എന്നു വായിക്കുന്നതു മലയാളിയുടെ ആക്സന്റിന്റെ പ്രശ്നം മാത്രമല്ല, ലിപി വരുത്തിയ പ്രശ്നം കൂടിയാണു്. അതായതു്, ഉച്ചരിക്കുന്നതു പോലെ എഴുതാത്തതിന്റെ പ്രശ്നം.

ഇംഗ്ലീഷ് വാക്കുകള്‍ എഴുതുമ്പോള്‍ ഭാരതീയഭാഷകള്‍ക്കു മാത്രം ബാധകമായ ഇത്തരം അപവാദങ്ങള്‍ ഉപയോഗിക്കരുതെന്നാണു് എന്റെ അഭിപ്രായം. അതായതു് പ്രെസിഡന്റ്, ജെനറല്‍ എന്നു തന്നെ എഴുതണമെന്നു്. ലെറ്റര്‍, റെയില്‍‌വേ തുടങ്ങിയ ചില വാക്കുകളില്‍ നാം അതു ചെയ്യുന്നുണ്ടുമുണ്ടു്.

നിര്‍ഭാഗ്യവശാല്‍, ഈ അഭിപ്രായമുള്ള ഒരേയൊരാള്‍ എന്റെ അറിവില്‍ ഞാനാണു്. അതുകൊണ്ടു്, എന്റെ ആ അഭിപ്രായമനുസരിച്ചു് എഴുതുന്നതു നല്ലതു പോലെ ആലോചിച്ചിട്ടു മതി 🙂

അല്ലെങ്കില്‍ പ്രസിഡന്റു പോലെ നമ്മള്‍ പ്രയോറിറ്റിയെ ഉച്ചരിക്കും, പ്രെയോരിറ്റി എന്നു്. ലിപിയുടെ പ്രശ്നം കൊണ്ടു് ആക്സന്റില്‍ വരുന്ന വ്യത്യാസം.

അപ്പോള്‍, പറഞ്ഞുവന്നതു്, രവി എന്നെഴുതി രെവി എന്നു വായിക്കുന്നതു പോലെയുള്ള ഒരു ഉച്ചാരണഭേദമാണു് ബ്രഹ്മം എന്നെഴുതി ബ്‌-ര്‌-എ-മ്-ഹ്-അ-മ്‌ എന്നു വായിക്കുന്നതു്. ചിലവ സാമാന്യനിയമങ്ങള്‍ കൊണ്ടു നാം അറിയും. ചിലവ അപവാദങ്ങളായും. അല്ലാതെ ഹ്മ എന്നെഴുതിയാല്‍ മ്‌-ഹ എന്നും ഹ്‌മ എന്നെഴുതിയാല്‍ ഹ്‌-മ എന്നും വായിക്കണമെന്നല്ല. എഴുതാനോ അച്ചടിക്കാനോ ബുദ്ധിമുട്ടുള്ള വലിയ കൂട്ടക്ഷരങ്ങള്‍ വേര്‍തിരിച്ചു കാണിക്കാനും കൂടിയാണു നാം ചന്ദ്രക്കല ഉപയോഗിക്കുന്നതു്. ഹ്മയും ഹ്‌മയും ഭാഷാശാസ്ത്രപരമായി ഒന്നു തന്നെ. പിന്നെ എഴുതുന്നവര്‍ക്കു് ഒന്നിനെ അപേക്ഷിച്ചു മറ്റോന്നിനോടു കൂടുതല്‍ ആഭിമുഖ്യമുണ്ടാവാം. അവര്‍ അങ്ങനെ എഴുതുകയോ അച്ചടിക്കുകയോ യൂണിക്കോഡില്‍ ZWNJ ഇട്ടു വേര്‍തിരിച്ചെഴുതുകയോ ചെയ്യും.

എല്ലാവര്‍ക്കും അവനവന്റേതായ ചില ഇഷ്ടാനിഷ്ടങ്ങളുണ്ടു്. എന്റെ ചെറുപ്പത്തില്‍ സൂര്യന്‍ എന്നതിലെ രണ്ടാമത്തെ അക്ഷരം എഴുതിയിരുന്നതു് യ്യ എന്ന അക്ഷരത്തിനു മുകളില്‍ രേഫത്തിന്റെ കുത്തിട്ടായിരുന്നു. ഭാര്യയും അങ്ങനെ തന്നെ. അതു വിട്ടിട്ടു് ഇങ്ങനെ എഴുതാന്‍ തുടങ്ങിയപ്പോള്‍ ആദ്യമൊക്കെ കുറേ ബുദ്ധിമുട്ടായിരുന്നു. അദ്ധ്യാപകന്‍ എന്നതിനെ അധ്യാപകന്‍ എന്നു കണ്ടപ്പോഴും അതു തന്നെ. കൂടുതല്‍ കാണുന്ന സ്പെല്ലിംഗുകളോടു നമുക്കു കൂടുതല്‍ അടുപ്പം തോന്നുന്നു എന്നു മാത്രം. അമേരിക്കയില്‍ എത്തിയതിനു ശേഷം ഇപ്പോള്‍ programme, colour എന്നൊക്കെ കാണുമ്പോള്‍ എന്തോ ഒരു `ഇതു്’ തോന്നുന്നതു പോലെ 🙂

രണ്ടു വ്യത്യസ്ത ഭാ‍ഷകളില്‍ നിന്നു മലയാളത്തിനു കിട്ടിയ ബ്രഹ്മം, റഹ്മാന്‍ എന്നവയിലെ ഹ്മകളെ സൂചിപ്പിക്കാന്‍ രണ്ടു തരം എഴുത്തുരീതികള്‍ വേണമെന്നു പറയുന്നതു് പ്രദക്ഷിണം, പ്രയോറിറ്റി എന്നിവയിലെ പ്രകളെ സൂചിപ്പിക്കാന്‍ രണ്ടു രീതി വേണമെന്നു പറയുന്നതു പോലെയാണു്. സീമ, സീറോ എന്നിവയിലെ സീകളെ സൂചിപ്പിക്കാന്‍ രണ്ടു രീതി വേണമെന്നു പറയുന്നതു പോലെയാണു്. മറ്റു ഭാഷകളിലെ വാക്കുകള്‍ നാം കടമെടുക്കുമ്പോള്‍ നമ്മുടെ അക്ഷരമാലയില്‍ കൊള്ളത്തക്കവിധം നാം അതിനെ മാറ്റി എഴുതുന്നു. ഉച്ചരിക്കുമ്പോള്‍ അതിന്റെ ശരിയായ ഉച്ചാരണം അറിയാമെങ്കില്‍ അതുപയോഗിക്കുന്നു. അറിയാത്തവര്‍ ചിലപ്പോള്‍ തെറ്റിച്ചു് ഉച്ചരിച്ചേക്കാം. തമിഴന്‍ സംസ്കൃതം എഴുതുമ്പോഴും ഇംഗ്ലീഷുകാരന്‍ ഫ്രെഞ്ച് എഴുതുമ്പോഴും ഇതു സംഭവിക്കുന്നുണ്ടു്.


എഴുതുന്നതു പോലെ ഉച്ചരിക്കുന്ന കാര്യം പറയുകയാണെങ്കില്‍ രസകരമായ പലതും പറയാനുണ്ടു്.

സുരേഷ് പറയുന്നതു പോലെ ഹ്മ, ഹ്ന എന്നിവയൊഴികെ എല്ലാം എഴുതുന്നതു പോലെ ഉച്ചരിക്കുന്നവരായി ഞാന്‍ മൂന്നു കൂട്ടരേ മാത്രമേ കണ്ടിട്ടുള്ളൂ-അക്ഷരശ്ലോകം ചൊല്ലുന്നവര്‍, കവിത വായിക്കുന്നവര്‍, പ്രസംഗകര്‍. ബാക്കിയുള്ള ബഹുഭൂരിപക്ഷം മലയാളികളും ഉച്ചരിക്കുന്നതു് ഇങ്ങനെയാണു്.

ബ്രഹ്മം – ബ്രമ്മം
ചിഹ്നം – ചിന്നം
നന്ദി – നന്നി
അഞ്ജനം – അഞ്ഞനം
ദണ്ഡം – ദണ്ണം
കട – കഡ
കഥ – കത/കദ

ഇതിനെപ്പറ്റി റാല്‍മിനോവ് എവിടെയോ പറഞ്ഞിട്ടുണ്ടു്.

ഗാനങ്ങളില്‍ മാത്രമല്ല, സംഭാഷണങ്ങളിലും അക്ഷരസ്ഫുടത സൂക്ഷിക്കുന്ന യേശുദാസ് വളരെയധികം ഉപയോഗിക്കുന്ന ഒരു വാക്കാണു് “ദണ്ഡം”. അദ്ദേഹം അതു് “ദണ്ണം” എന്നാണുച്ചരിക്കുന്നതെന്നു പലരും ശ്രദ്ധിച്ചിരിക്കും.

ഇതു് ഉച്ചാരണശുദ്ധിയുടെ പ്രശ്നമാണെന്നാണു പൊതുവേയുള്ള ധാരണ. അതു പൂര്‍ണ്ണമായും ശരിയല്ല എന്നതാണു വസ്തുത. ഇതിന്റെ പിന്നിലുള്ള അനുനാസികാതിപ്രസരത്തെപ്പറ്റി ഭാഷാശാസ്ത്രജ്ഞര്‍ വളരെയധികം പറഞ്ഞിട്ടുണ്ടു്. മലയാളികള്‍ വ്യഞ്ജനങ്ങളില്‍ അനുനാസികത്തെ കലര്‍ത്തും. ഇതു മാങ്കാ മാങ്ങാ ആയിടത്തു മാത്രമല്ല ഉള്ളതു്. ഇതു പോലെ തന്നെ താലവ്യാദേശം മുതലായ മറ്റു കാര്യങ്ങളും.

തച്ചോളി ഒതേനന്‍ എന്ന സിനിമയ്ക്കു വേണ്ടി “അഞ്ജനക്കണ്ണെഴുതി…” എന്ന പാട്ടു് എസ്. ജാനകി “അഞ്ഞനക്കണ്ണെഴുതി…” എന്നു പാടിയതു കേട്ടപ്പോള്‍ മലയാളിയല്ലാത്ത ഗായിക തെറ്റിച്ചു പാടിയതാണെന്നാണു വിചാരിച്ചതു്. പിന്നീടു് അവര്‍ മലയാളികളുടെ തനതായ രീതിയില്‍ത്തന്നെ പാടിയതാണു് എന്നു മനസ്സിലായപ്പോള്‍ ജാനകിയോടുള്ള ബഹുമാനം പതിന്മടങ്ങു കൂടി.


ഒരു വര്‍ഷം മുമ്പേ “ലിപി വരുത്തി വെച്ച വിനകള്‍” എന്നൊരു പോസ്റ്റ് എഴുതിത്തുടങ്ങിയിരുന്നു. മൂന്നു മാസം മുമ്പു് “തെറ്റുകള്‍ ഉണ്ടാവുന്നതും ഇല്ലാതാവുന്നതും” എന്ന ഒരെണ്ണവും. രണ്ടും മടി കൊണ്ടു് ഇടയില്‍ വെച്ചു നിന്നു പോയി. ഇവയില്‍ നിന്നു് എടുത്തതാണു് ഈ പോസ്റ്റിന്റെ ഭൂരിഭാഗവും. ഇതും അറ്റോമിക് ചില്ലുമായി വലിയ ബന്ധമൊന്നുമില്ല. അതിലെ ഒരു ചര്‍ച്ചയില്‍ ഇതും വന്നെന്നു മാത്രം. എങ്കിലും ഇതു് ഈ രൂപത്തിലാക്കാന്‍ പ്രേരണയായ റാല്‍‌മിനോവിനും സുരേഷിനും നന്ദി.

വ്യാകരണം (Grammar)

Comments (36)

Permalink

ഞാന്‍ പ്രതിഷേധിക്കുന്നു

 

ശ്രീ എം. കെ. ഹരികുമാര്‍ ബ്ലോഗു തുടങ്ങുകയും മറ്റു പല ബ്ലോഗുകളിലും പോയി “ഞാന്‍ നിങ്ങളുടെ ബ്ലോഗ് വായിക്കാം. നിങ്ങള്‍ എന്റേതും വായിക്കൂ…” എന്നു കമന്റിടുകയും ചെയ്തപ്പോഴേ അദ്ദേഹത്തിന്റെ ബ്ലോഗ് ശ്രദ്ധിക്കാന്‍ തുടങ്ങിയതാണു ഞാന്‍. പക്ഷേ അദ്ദേഹത്തിന്റെ ബ്ലോഗില്‍ ശ്രദ്ധിക്കേണ്ടതായി ഒന്നും കണ്ടില്ല. ഈ എഴുത്തുകാരന്‍ കലാകൌമുദിയില്‍ പ്രൊഫ. എം. കൃഷ്ണന്‍ നായരുടെ സാഹിത്യവാരഫലത്തിന്റെ തുടര്‍ച്ചയായി ഒരു കോളം എഴുതുന്നുണ്ടെന്നറിഞ്ഞപ്പോള്‍ അദ്ഭുതം തോന്നി. കലാകൌമുദിയില്‍ എഴുതുന്ന ഒരു നിരൂപകനില്‍ നിന്നു പ്രതീക്ഷിക്കാത്ത അക്ഷരത്തെറ്റുകളും പ്രയോഗവൈകല്യങ്ങളും കണ്ടതും പോസ്റ്റുകള്‍ക്കു വിചാരിച്ചതു പോലെ നിലവാ‍രം കാണാതെ വരികയും ചെയ്തതാണു കാരണം. അവഗണിക്കുന്ന അനേകം ബ്ലോഗുകളില്‍ ഒന്നായി അതു മാറി. എങ്കിലും സബ്സ്ക്രൈബ് ചെയ്തിരുന്ന ഒരു ബ്ലോഗായിരുന്നതു കൊണ്ടു് അതില്‍ പുതിയ പോസ്റ്റുകള്‍ വരുമ്പോള്‍ ഞാന്‍ അറിയുമായിരുന്നു. പലപ്പോഴും ഒന്നു് ഓടിച്ചു വായിച്ചു നോക്കുമാ‍യിരുന്നു-എന്തെങ്കിലും നല്ലതു തടഞ്ഞാലോ എന്നു കരുതി.

“കേരളം-50 ഭാവങ്ങള്‍” എന്ന പംക്തി കണ്ടപ്പോള്‍ ചിരിയാണു വന്നതു്. പ്രിന്റ് മീഡിയയില്‍ ഇങ്ങനെ പല ഫീച്ചറുകളും കണ്ടിട്ടുണ്ടു്. ഏതാനും ലക്കങ്ങളിലെ പ്രതിഫലം ഉറപ്പാക്കാന്‍ അമ്പതു ലക്കങ്ങളിലേക്കു് ഒരു പംക്തി തുടങ്ങുന്നതു കണ്ടിട്ടുണ്ടു്. അന്നൊക്കെ വിചാരിച്ചിരുന്നതു് അതെഴുതുന്നവര്‍ നേരത്തേ എഴുതിത്തയ്യാറാക്കിയതു് സ്ഥലപരിമിതി മൂലം പല ലക്കങ്ങളിലായി പ്രസിദ്ധീകരിക്കുന്നു എന്നാണു്. അല്ലെങ്കില്‍ കൃത്യം 50 ഭാവങ്ങള്‍ എന്നെങ്ങനെ അറിയും? ഓരോന്നായി എഴുതുന്ന പോസ്റ്റുകളുടെ മൊത്തം എണ്ണം ആദ്യമേ ഉറപ്പിച്ചതു കണ്ടപ്പോള്‍ ഇദ്ദേഹം പ്രിന്റ് മീഡിയയുടെ ഗിമ്മിക്കുകളില്‍ നിന്നു പുറത്തു വന്നില്ലല്ലോ എന്നോര്‍ത്തായിരുന്നു ചിരിച്ചതു്. ഈ അമ്പതു ഭാ‍വങ്ങളാകട്ടേ, പ്രത്യേകിച്ചു് ഒരു ചമത്കാരവുമില്ലാത്ത കുറേ വിശേഷങ്ങള്‍ മാത്രം.

ദോഷം പറയരുതല്ലോ, ഹരികുമാര്‍ ബ്ലോഗില്‍ എഴുതിയതില്‍ ഏറ്റവും പാരായണയോഗ്യം ഈ ഭാവങ്ങള്‍ തന്നെ. തീയതി വെച്ചു് ദിവസേന ഒന്നെന്ന കണക്കിനു പടച്ചു വിട്ട കുറിപ്പുകളിലും കവിത എന്നു തോന്നിക്കുന്ന കുറേ പടപ്പുകളിലും (ഇവ എഴുതിയ ആളാണല്ലോ വിത്സന്‍ കവിയാണോ എന്നു് ഉത്പ്രേക്ഷിച്ചതു്, കഷ്ടം!) ജീവിത്തത്തില്‍ ഇതു വരെ പരീക്ഷയുടെ ഉത്തരക്കടലാസിലല്ലാതെ മലയാളം എഴുതിയിട്ടില്ല എന്നു പറഞ്ഞു ബ്ലോഗിംഗ് തുടങ്ങുന്നവരുടെ ആദ്യപോസ്റ്റുകളില്‍ കാണുന്നതില്‍ കൂടുതല്‍ ഒന്നും കാണാന്‍ കഴിഞ്ഞിട്ടുമില്ല.

അങ്ങനെയിരിക്കുമ്പോഴാണു് പ്രേം നസീറാണു മലയാളത്തിലെ ഏറ്റവും വലിയ നടന്‍ എന്ന ഒരു പോസ്റ്റ് അദ്ദേഹം ഇട്ടതു്. അതിനു കുഴപ്പമൊന്നുമില്ല. അങ്ങനെ വിശ്വസിക്കാനും എഴുതാനും ഉള്ള അവകാശം അദ്ദേഹത്തിനുണ്ടു്. പക്ഷേ, അതിനോടു വിയോജിക്കാനുള്ള അവകാശം വായനക്കാര്‍ക്കുമുണ്ടു്. കലാകൌമുദിയില്‍ എഴുതിയതിനോടു വിയോജിച്ചെഴുതുന്ന കത്തുകള്‍ പലതും വാരികക്കാര്‍ മുക്കും-സ്ഥലപരിമിതി പറഞ്ഞു്. പക്ഷേ, ബ്ലോഗില്‍ അങ്ങനെയൊരു സംഗതി ഇല്ല. വിമര്‍ശനം സഹിക്കാന്‍ കഴിയാത്തവനുള്ള സ്ഥലമല്ല ബ്ലോഗ്. ആ പോസ്റ്റിന്റെ കമന്റുകളില്‍ ആരെങ്കിലും ഹരികുമാറിനെ വ്യക്തിപരമായി അധിക്ഷേപിച്ചു എന്നെനിക്കു തോന്നുന്നില്ല. മറിച്ചു്, അദ്ദേഹത്തിന്റെ അഭിപ്രായം ശരിയല്ല എന്നു് ഉദാഹരണസഹിതം വിശദീകരിക്കുക മാത്രമാണു ചെയ്തതു്.

വ്യക്തിപരമായ ആക്രമണം തുടങ്ങിവെച്ചതു ഹരികുമാര്‍ തന്നെയാണു്. അദ്ദേഹത്തെ എതിര്‍ത്തു പറഞ്ഞവരെയൊക്കെ ചീത്ത വിളിച്ചു. അവരൊക്കെ ഒരു പത്രാധിപര്‍ക്കുള്ള കത്തു പോലും എഴുതിയിട്ടില്ലാത്തവരാണെന്നു് അധിക്ഷേപിച്ചു. താന്‍ എഴുതുന്ന കോളം മലയാളത്തിലെ ഏറ്റവും മികച്ച പംക്തിയാണെന്നു് അഹങ്കരിച്ചു. നസീറൊഴികെ എതെങ്കിലും നടനെപ്പറ്റി പറഞ്ഞവരൊക്കെ വിവരമില്ലാത്തവരാണെന്നു പ്രഖ്യാപിച്ചു. അദ്ദേഹത്തെ എതിര്‍ത്തവര്‍ പലരല്ല, ഒരാള്‍ തന്നെ പല കള്ളപ്പേരുകളില്‍ എഴുതുന്നവരാണെന്നു് ആരോപിച്ചു.

ഒരേ ആള്‍ തന്നെ പത്രാധിപക്കുറിപ്പും വാരഫല-ജ്യോത്സ്യപംക്തിയും ഡോക്ടറോടു ചോദിക്കുന്ന പംക്തിയും വനിതാലോകത്തിലെ സോദരിച്ചെച്ചിയും വായനക്കാരുടെ കത്തുകളും എഴുതുന്ന സ്ഥാപനങ്ങളില്‍ ജോലി ചെയ്തതു കൊണ്ടാവണം ഹരികുമാറിനു് ഇങ്ങനെയൊരു തോന്നല്‍ ഉണ്ടായതു്. എഡിറ്ററായിരുന്നപ്പോള്‍ പല പേരില്‍ എഴുതുമായിരുന്നു എന്നു രാം മോഹന്‍ പാ‍ലിയത്തു തന്നെ ഇവിടെ പറഞ്ഞിട്ടുണ്ടല്ലോ.

തൂലികാനാമം ഉപയോഗിക്കുന്നവരെ ചീത്ത പറയുകയും അദ്ദേഹത്തെ ഏതെങ്കിലും വിധത്തില്‍ പുകഴ്ത്തിയവരെ മാത്രം വിവരമുള്ളവരായി ചിത്രീകരിക്കുകയും ചെയ്തു് ഹരികുമാര്‍ കൂടുതല്‍ അപഹാസ്യനായി. തന്നെ വിമര്‍ശിച്ച പലരും തന്നെക്കാള്‍ കൂടുതല്‍ വിവരമുള്ളവരാണെന്നു കണ്ടപ്പോള്‍ അവരെ വെട്ടുക്കിളികളെന്നും മറ്റും വിളിച്ചു് പിന്നെയും അപഹാസ്യനായി.

ഇത്രയും മാത്രമേ ചെയ്തുള്ളൂ എങ്കില്‍ അതു വിവരമില്ലാത്ത ഒരു ബ്ലോഗറുടെ തോന്ന്യവാസം എന്നു കരുതി വെറുതേ വിടാമായിരുന്നു. പക്ഷേ, അദ്ദേഹം ഇതേ അഭിപ്രായം തന്നെ “കലാകൌമുദി” വാരികയിലും എഴുതി വിട്ടു. കൂട്ടത്തില്‍ കവിയായ വിത്സനെ അപമാനിച്ചു കൊണ്ടും ഇതിനെപ്പറ്റി ഒന്നുമറിയാത്ത ലാപുടയ്ക്കെതിരെ ഒരു ആരോപണം ഉന്നയിച്ചുകൊണ്ടും. ഇതു് ഗൌരവമായി എടുക്കേണ്ട സംഗതിയാണു്. അടിസ്ഥാനമില്ലാത്ത ഇത്തരം ജല്പനങ്ങള്‍ പ്രസിദ്ധീകരിച്ച “കലാകൌമുദി” മലയാളികളോടു വിശദീകരണം നല്‍കണം. ഹരികുമാര്‍ താന്‍ ചെയ്ത തെറ്റായ പ്രസ്താവനകള്‍ക്കെങ്കിലും മാപ്പു പറയണം.

ഇതു വെളിച്ചത്തു കൊണ്ടു വരാന്‍ വേണ്ടി ഈ പോസ്റ്റിട്ട അഞ്ചല്‍ക്കാരനും അതിനു മുമ്പു് കലാകൌമുദി ലേഖനം സ്കാന്‍ ചെയ്തു് എവിടെയോ ഇട്ട ബ്ലോഗര്‍ക്കും (അനാഗതശ്മശ്രു?) നന്ദി.

(അഗ്രിഗേറ്ററുകളില്‍ വരാത്തതിനാലും എന്റെ സബ്സ്ക്രിപ്ഷന്‍ ലിസ്റ്റില്‍ ഇല്ലാത്തതിനാലും നേരത്തേ കാണാന്‍ പറ്റാഞ്ഞ ഈ പോസ്റ്റിനെപ്പറ്റി ഈ-മെയിലിലൂടെയും ചാറ്റിലൂടെയും നേരിട്ടും വായനലിസ്റ്റിലൂടെ പരോക്ഷമായും എന്നെ അറിയിച്ച എല്ലാ സുഹൃത്തുക്കള്‍ക്കും നന്ദി.)

കലാകൌമുദിയ്ക്കെതിരേ മലയാളം ബ്ലോഗെഴുത്തുകാര്‍ നടത്തുന്ന പ്രതിഷേധത്തില്‍ ഞാനും പങ്കു ചേരുന്നു.


ഹരികുമാര്‍ ബ്ലോഗേഴ്സിനെ വെട്ടുക്കിളികള്‍ എന്നു വിളിച്ചതു് അസംബന്ധമായിരുന്നു. എങ്കിലും ഈ വിഷയത്തെപ്പറ്റി കേട്ട ആരെങ്കിലും മുകളില്‍പ്പറഞ്ഞ (അഞ്ചല്‍ക്കാരന്റെ) പോസ്റ്റില്‍ വന്നു് അതിലെ കമന്റുകള്‍ വായിച്ചാല്‍ ചിലപ്പോള്‍ അങ്ങേരെ ന്യായീകരിച്ചെന്നു വരും. കാരണം, അത്ര മോശം ഭാഷയാണു് നാം അവിടെ ഉപയോഗിച്ചതു്. ഹരികുമാര്‍ എന്തു തെറ്റു ചെയ്താലും, ഇത്ര തരം താണ ഭാഷയില്‍ നമ്മള്‍ സംസാരിക്കരുതായിരുന്നു. കൈപ്പള്ളിയുടെ

തെറി വിളിക്കേണ്ട സമയത്ത്, വിളിക്കേണ്ടവരെ ഭേഷ വിളിക്കാനുള്ളതാണു്. അല്ലാതെ വണ്ടി യോട്ടികുമ്പം കുറുക്കേ ചാടണ മാടിനെം പോത്തിനെ വിളിക്കാനുള്ളതല്ല.

പരസ്യമായി തെറി വിളിക്കാന്‍ ഇതിലും നല്ല ഒരു അവസര്മ് ഇനി കിട്ടിയെന്നു വരില്ല. രണ്ടണ്ണം നീയും വിളിച്ചോ. 🙂

എന്ന പ്രസ്താവത്തോടു യോജിക്കാന്‍ എന്തോ എനിക്കു കഴിയുന്നില്ല.

അതോടൊപ്പം തന്നെ, ഈ ഒറ്റപ്പെട്ട സംഭവത്തെ മുന്‍‌നിര്‍ത്തി പ്രിന്റ് മീഡിയയെ മുഴുവന്‍ തെറി വിളിക്കുന്നതും ശരിയല്ല. പത്രവാര്‍ത്തകളിലും മറ്റും കാണുന്ന തെറ്റുകളെയും ഇരട്ടത്താപ്പുകളെയും നാം വിമര്‍ശിക്കുന്നു എന്നതു ശരി തന്നെ. എങ്കിലും മനുഷ്യരാശിയുടെ അറിവിനെ ഇത്ര കാലവും കാത്തുസൂക്ഷിച്ച കടലാസിനെ ഇപ്പോള്‍ വന്ന കമ്പ്യൂട്ടറിന്റെയും ഇന്റര്‍നെറ്റിന്റെയും പേരില്‍ തള്ളിപ്പറയുന്നതു ശരിയല്ല്ല.

ഞാന്‍ പ്രിന്റ് മീഡിയയില്‍ എന്റെ കൃതികള്‍ പ്രസിദ്ധീകരിക്കണം എന്ന ആഗ്രഹവുമായി നടക്കുന്ന ആളല്ല. എങ്കിലും ഇന്റര്‍നെറ്റില്‍ നിന്നു കിട്ടുന്നതിന്റെ പതിന്മടങ്ങു വായന അച്ചടിച്ച പുസ്തകങ്ങളില്‍ നിന്നു കിട്ടുന്ന ഒരാളാണു്.

ഹരികുമാറിനെ ഇത്ര തരം താണ രീതിയില്‍ തെറി പറഞ്ഞു കമന്റിട്ടതിനും പ്രിന്റ് മീഡിയയെ അടച്ചു ചീത്ത വിളിച്ചതിനും അതു ചെയ്തവര്‍ക്കെതിരേ (അഞ്ചല്‍ക്കാരനും കമന്റിട്ട അനേകം ആളുകള്‍ക്കും എതിരേ അല്ല) ഞാന്‍ പ്രതിഷേധിക്കുന്നു.


ഈ വിഷയത്തില്‍ ഇതു വരെ മൌനം അവലംബിച്ച ബ്ലോഗെഴുത്തുകാരെ ഒളിഞ്ഞും തെളിഞ്ഞും വിമര്‍ശിക്കുന്നതു കണ്ടു. ബൂലോഗത്തു് ഇപ്പോള്‍ ഒരുപാടു കാര്യങ്ങള്‍ നടക്കുന്നുണ്ടു്. കലേഷിന്റെ കല്യാണവും ആദ്യത്തെ ബ്ലോഗ്‌മീറ്റും പണ്ടു് ബ്ലോഗെഴുത്തുകാര്‍ മുഴുവനും കൂടി ആഘോഷിച്ചിട്ടുണ്ടു്. തുടര്‍ന്നു വന്ന എല്ലാ കല്യാണങ്ങള്‍ക്കും മീറ്റുകള്‍ക്കും ആ ആവേശം ഉണ്ടാവണമെന്നില്ല. മഹാത്മാഗാന്ധി നിസ്സഹകരണപ്രസ്ഥാനം തുടങ്ങിയപ്പോള്‍ കിട്ടിയ പിന്തുണയൊന്നും കേരളത്തില്‍ ഇപ്പോള്‍ എല്ലാ ആഴ്ചയിലും നടക്കുന്ന ഹര്‍ത്താലുകള്‍ക്കും കിട്ടാറില്ലല്ലോ.

“അതു ചെയ്തവര്‍ എന്തേ ഇതു ചെയ്യുന്നില്ല?” എന്ന ചോദ്യം അസ്ഥാനത്താണു്. ബ്ലോഗുകളുടെ എണ്ണം കൂടി, പ്രശ്നങ്ങളുടെ എണ്ണം കൂടി, ആളുകളുടെ സമയം കുറഞ്ഞു, വായന തിരഞ്ഞെടുത്ത പോസ്റ്റുകള്‍ മാത്രമായി, പോസ്റ്റുകള്‍ കാണാതെ പോകുന്നു, കണ്ടവയില്‍ പലതും കൂടുതല്‍ ചിന്തിക്കാതെ വിട്ടുകളയുന്നു, അങ്ങനെ പലതും.

കഴിഞ്ഞ കുറേക്കാലമായി പ്രശ്നങ്ങള്‍ പലതുണ്ടു്. വ്യാജ ഐഡി എടുത്ത പല കേസുകള്‍, പോസ്റ്റുകള്‍ മോഷ്ടിച്ച പല കേസുകള്‍, പുഴ.കോം അനുവാദമില്ലാതെ ബ്ലോഗ് സ്നിപ്പറ്റുകള്‍ ഇട്ടതു്, പാചകക്കുറിപ്പുകള്‍ യാഹൂ പൊക്കിയതു്, ലോനപ്പന്‍/വിവിയെ ആരോ മേലധികാരിയോടു പരാതിപ്പെട്ടു് ഉപദ്രവിച്ചതു്, ചിത്രകാരനെ ഫോണില്‍ വിളിച്ചു ഭീഷണിപ്പെടുത്തിയതു്, കുറുമാന്‍ പെണ്ണുപിടിയനാണോ അല്ലയോ എന്നതു്, രാം മോഹന്‍ പാലിയത്തിന്റെ പോസ്റ്റില്‍ അശ്ലീലം ഉണ്ടോ ഇല്ലയോ എന്നതു്, ഹരികുമാര്‍ ബ്ലോഗെഴുത്തുകാരെ അധിക്ഷേപിച്ചതു് തുടങ്ങി നൂറു കാര്യങ്ങള്‍. ഇവയിലെല്ലാം തലയിടാന്‍ എല്ലാവര്‍ക്കും താത്പര്യം ഉണ്ടായെന്നു വരുകില്ല. എന്നെ സംബന്ധിച്ചു്, എനിക്കു കൂടുതല്‍ താത്പര്യം പലപ്പോഴും ജ്യോതിഷം ശാസ്ത്രമാണെന്നു പറയുന്നവരെ എതിര്‍ക്കാനും അക്ഷരത്തെറ്റു തിരുത്താനുമൊക്കെ ആണു്. രാഷ്ട്രീയബോധം കുറവായതുകൊണ്ടായിരിക്കാം. പക്ഷേ ഈ രാഷ്ട്രീയബോധവും ആപേക്ഷികമാണല്ലോ.

മുകളില്‍ പറഞ്ഞ പ്രശ്നങ്ങളില്‍ യാഹൂ കോപ്പിറൈറ്റ് പ്രശ്നത്തിലും ഹരികുമാറിന്റെ പ്രശ്നത്തിലുമൊഴികെ ഒന്നിലും ഞാന്‍ പ്രതിഷേധിക്കുകയോ അഭിപ്രായം പറയുകയോ ചെയ്തിട്ടില്ല. അതു് എന്റെ സ്വാതന്ത്ര്യമാണെന്നു ഞാന്‍ വിശ്വസിക്കുന്നു. എവിടെയങ്കിലും ആരെങ്കിലും പ്രതികരിച്ചിട്ടുണ്ടെങ്കില്‍ പിന്നെയുള്ള എല്ലാ സംഭവങ്ങള്‍ക്കും അവരൊക്കെ പ്രതികരിക്കണം എന്നു ശഠിക്കുന്നതു തെറ്റാണു്. ഒരാള്‍ പ്രത്യേകം പേരെടുത്തു പറഞ്ഞ വക്കാരിയെ ഇപ്പോള്‍ ബ്ലോഗില്‍ത്തന്നെ കാണാനില്ല. ഗവേഷണവിദ്യാര്‍ത്ഥിയായ അദ്ദേഹത്തിനു സമയം കുറവായിരിക്കും. സമയം ഉണ്ടായിരുന്ന സമയത്തു പത്തു പുറത്തില്‍ അഭിപ്രായം എഴുതി. ഇല്ലാത്തപ്പോള്‍ മിണ്ടാതിരിക്കുന്നു. അത്ര മാത്രം.

ബ്ലോഗെഴുത്തുകാര്‍ ‍ എന്തു ചെയ്യണമെന്നു തീരുമാനിക്കുകയും അവര്‍ വിചാരിക്കുന്നതു പോലെ ചെയ്യാത്തവര്‍ക്കെതിരേ അനാവശ്യമായ ഭര്‍ത്സനങ്ങള്‍ ഉതിര്‍ക്കുകയും ചെയ്യുന്നതിനെതിരേ ഞാന്‍ പ്രതിഷേധിക്കുന്നു.

 

പ്രതികരണം
പ്രതിഷേധം
സാഹിത്യം

Comments (25)

Permalink

എന്താണു് ഈ കോണ്ടസാ അറ്റോമിക്ക് ചില്ലു പ്രശ്നം?

“കുറേക്കാലമായി നിങ്ങള്‍ ഈ കോണ്ടസാ, കോ‍ണ്ടസാ എന്നു പറഞ്ഞു നടക്കുന്നുണ്ടല്ലോ.  എന്താ ഈ കോണ്ടസാ പ്രശ്നം?”
കുതിരവട്ടം പപ്പു, “ചന്ദ്രലേഖ”യില്‍.

ആണവ (അറ്റോമിക്) ചില്ലുകള്‍, ജോയിനറുകള്‍, ZWJ, ZWNJ തുടങ്ങിയ വാക്കുകള്‍ ഉപയോഗിച്ചു കുറേക്കാലമായി സിബു, റാല്‍മിനോവ്, അനിവര്‍, പ്രവീണ്‍, സുറുമ, സന്തോഷ് തോട്ടിങ്ങല്‍ തുടങ്ങിയവര്‍ തിരിച്ചും മറിച്ചും സാങ്കേതികവും സര്‍ക്കാസ്റ്റിക്കും ആയി പോസ്റ്റുകള്‍ ഇറക്കുന്നുണ്ടു്. ഇതൊക്കെ വായിച്ചു് ചന്ദ്രലേഖയിലെ പപ്പുവിനെപ്പോലെ “എന്താ ഈ ആണവചില്ല്?” എന്നു ചോദിച്ചു് അന്തം വിട്ടു കുന്തം വിഴുങ്ങി ഇരിക്കുന്ന ബ്ലോഗുവായനക്കാര്‍ക്കു വേണ്ടിയുള്ളതാണു് ഈ പോസ്റ്റ്.

എന്തുകൊണ്ടു ഞാന്‍ ഇതെഴുതുന്നു എന്നു ചോദിച്ചാല്‍,

  1. മലയാളഭാഷയെപ്പറ്റി കുറെയൊക്കെ അറിഞ്ഞിരുന്നെങ്കിലും യൂണിക്കോഡിനെപ്പറ്റിയുള്ള അജ്ഞത മൂലം ഞാനും കുറേക്കാലം ഇങ്ങനെ കുന്തം വിഴുങ്ങി ഇരുന്നിട്ടുണ്ടു്. പിന്നെ കാര്യങ്ങള്‍ കുറേശ്ശെ വ്യക്തമായി. വ്യക്തമായതെങ്ങനെ എന്നു വിശദീകരിച്ചാല്‍ ഇപ്പോള്‍ കുന്തം വിഴുങ്ങിയിരിക്കുന്നവര്‍ക്കു് സഹായകമാകും എന്നൊരു ചിന്ത.
  2. അറ്റോമിക് ചില്ലുകളെപ്പറ്റിയുള്ള ചര്‍ച്ചകളിലെ ഭാഷാപരമായ കാര്യങ്ങളില്‍ അഭിപ്രായം പറഞ്ഞിട്ടുണ്ടെങ്കിലും, ഞാന്‍ ഇതു വരെ അവയെ അനുകൂലിച്ചോ എതിര്‍ത്തോ പറഞ്ഞിട്ടില്ല. ഈ വിഷയത്തെപ്പറ്റി എനിക്കുള്ള അഭിപ്രായം വ്യക്തമാക്കാന്‍ കൂടിയാണു് ഈ ലേഖനം.

യൂണിക്കോഡിനെപ്പറ്റിയും അതില്‍ മലയാളം ഉപയോഗിക്കുന്നതിനെപ്പറ്റിയും നല്ല പല ലേഖനങ്ങളും ഇതിനകം ഉണ്ടായിട്ടുണ്ടു്. ഈ കാര്യങ്ങള്‍ ക്രോഡീകരിച്ചു് സിബു വരമൊഴി വിക്കിയില്‍ ഇട്ടിട്ടുള്ള ഈ ലേഖനം ആണു് അവയില്‍ ഒന്നു്. ഇതു വായിക്കുന്നതിനു മുമ്പു് അതു വായിക്കുന്നതു നന്നായിരിക്കും.

ആദ്യമേ ഒരു അറിയിപ്പു്: മൈക്ക് ടെസ്റ്റിംഗ്, വണ്‍, ടൂ, ത്രീ,…

ദയവായി ഈ പോസ്റ്റ് ഈ ബ്ലോഗില്‍ത്തന്നെ വായിക്കുക. ഫീഡ് റീഡര്‍, ഈ-മെയില്‍ തുടങ്ങിയവയിലൂടെ കടന്നു പോയാല്‍ പല ജോയിനറുകളും നഷ്ടപ്പെട്ടു് ഉദ്ദേശിച്ചതു തെറ്റും എന്നതുകൊണ്ടാണു് ഇതു്. മറ്റു രീതിയില്‍ വായിക്കുന്നവര്‍ക്കായി ഈ പോസ്റ്റിന്റെ ലിങ്ക്: http://malayalam.usvishakh.net/blog/archives/288.

അതുപോലെ ന്‍ (ന + വിരാമം + ZWJ) എന്നതിനെ ന്‍ എന്ന ചില്ലക്ഷരമായി കാണിക്കുന്ന (ന് എന്നു നയുടെ കൂടെ ചന്ദ്രക്കല ഇട്ടതല്ല) ഏതെങ്കിലും ഓപ്പറേറ്റിംഗ് സിസ്റ്റം/ബ്രൌസര്‍ ഉപയോഗിക്കുക.

എന്റെ അറിവില്‍ താഴെപ്പറയുന്ന കോംബിനേഷനുകള്‍ ശരിയായി ചില്ലുകള്‍ കാണിക്കുന്നു:

  • Windows + IE
  • Windows + Firefox 3.0
  • Windows + Firefox 2.0 + IE tab
  • Linux + Firefox 3.0 + Rachana/Meera font
  • Linux + Firefox 2.0 + Rachana/Meera font + Suruma’s Pango patch

അല്ലെങ്കില്‍ താഴെയുള്ളതു നല്ല തമാശയായിരിക്കും. ശയും ഷയും ഒരു പോലെ ഉച്ചരിക്കുന്ന ഒരുത്തന്‍ ഒരിക്കല്‍ എന്നോടു് “ഉമേഷേ, ഉമേഷിന്റെ പേരു ശരിക്കു് ഉമേശ് എന്നല്ലേ പറയേണ്ടതു്, അതെന്തിനാ ഉമേഷ് എന്നു പറയുന്നതു്?” എന്നു ചോദിച്ചതും ഞാന്‍ അന്തം വിട്ടു നിന്നതും ഓര്‍മ്മ വരുന്നു 🙂

ഒരു ഉദാഹരണം:

ഒരു ഉദാഹരണത്തില്‍ തുടങ്ങാം.

ആദ്യമായി ചില്ലക്ഷരങ്ങളെ കാണിക്കുന്ന ഏതെങ്കിലും ഓപ്പറേറ്റിംഗ് സിസ്റ്റം/ബ്രൌസര്‍/ഫോണ്ട്/സേര്‍ച്ച് എഞ്ചിന്‍ ഉപയോഗിച്ചു് അവന്‍ എന്ന വാക്കൊന്നു സേര്‍ച്ചു ചെയ്തു നോക്കുക. വിന്‍ഡോസ് എക്സ് പി/ഇന്റര്‍നെറ്റ് എക്സ്പ്ലോറര്‍ 7/കാര്‍ത്തിക/ഗൂഗിള്‍ ഉപയോഗിച്ചു ഞാന്‍ നടത്തിയ തിരയലിന്റെ ഫലം താഴെ.

അവന്‍ എന്നതു തിരഞ്ഞപ്പോള്‍ കിട്ടിയതു് അവന് എന്നാണു് എന്നു തോന്നും. ഇവയില്‍ ഏതെങ്കിലും ഒരു ഫലത്തില്‍ ക്ലിക്കു ചെയ്തു നോക്കിയാല്‍ അതു് അവന്‍ എന്നു തന്നെയാണെന്നു കാണാം. അതായതു്, സേര്‍ച്ച് എഞ്ചിന്‍ ശരിയായ വാക്കു തന്നെ കണ്ടുപിടിച്ചെങ്കിലും സേര്‍ച്ച് ലിസ്റ്റില്‍ അതിനെ നാം കാണുമ്പോള്‍ അതു് അവന് എന്നായി മാറി. (എല്ലാ ഓപ്പറേറ്റിംഗ് സിസ്റ്റം/ബ്രൌസര്‍/സേര്‍ച്ച് എഞ്ചിന്‍ കോംബിനേഷനുകളിലും ഇതുണ്ടാവണമെന്നു നിര്‍ബന്ധമില്ല. ചിലതില്‍ ഉണ്ടെന്നേ ഞാന്‍ പറയുന്നുള്ളൂ.)

ഇതെങ്ങനെ സംഭവിച്ചു?

ചില്ലക്ഷരമായ ന്‍ എന്നതിനെ ഇപ്പോള്‍ സൂചിപ്പിക്കുന്നതു് (ഫോണ്ടുകള്‍, ഇന്‍‌പുട്ട് മെതേഡുകള്‍ തുടങ്ങിയവ. യൂണിക്കോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് ഇതിനെപ്പറ്റി ഒന്നും പറയുന്നില്ല) ന + വിരാമം + ZWJ എന്നാണു്. എവിടെയോ വെച്ചു് ആ ZWJ (സീറോ വിഡ്ത്ത് ജോയിനര്‍) നഷ്ടപ്പെട്ടു പോയിട്ടു നമുക്കു കിട്ടിയതു് ന + വിരാമം എന്നു മാത്രമാണു്. അതാണു് ന് എന്നു കാണുന്നതു്.

ദേ പിന്നെയും വന്നു കോണ്ടസാ. എന്താ‍ ഈ ജോയിനര്‍, വിരാമം എന്നൊക്കെ പറയുന്നതു്?

ഓ, സോറി. അതു പറയാം.

ആസ്കി ഫോണ്ടുകളില്‍ (ഉദാ: ദീപിക പത്രത്തിലെ ഫോണ്ടു്) എന്നതും ല്ല എന്നതും രണ്ടു കാര്യങ്ങളാണു്. തമ്മില്‍ യാതൊരു ബന്ധവുമില്ലാത്ത രണ്ടു് അക്ഷരങ്ങള്‍. അവയെ സൂചിപ്പിക്കാന്‍ രണ്ടു വ്യത്യസ്ത ആസ്കി കോഡുകള്‍ ഉപയോഗിക്കുന്നു.

യൂണിക്കോഡില്‍ സംഗതി വ്യത്യസ്തമാണു്. അവിടെ എന്നതും ല്ല എന്നതും ഒരു ബന്ധവുമില്ലാത്ത രണ്ടു കാര്യങ്ങളല്ല. അവിടെ ല്ല എന്നൊരു അക്ഷരമില്ല. അതു് ല + വിരാമം + ല എന്നു മൂന്നു സംഗതികള്‍ ചേര്‍ന്നതാണു്. വിരാമം എന്നതു് അതിനു തൊട്ടു മുമ്പുള്ള അക്ഷരത്തെ ചില രീതിയില്‍ വ്യത്യാസപ്പെടുത്തുന്ന ഒരു സ്പെഷ്യല്‍ കാരക്ടര്‍ ആണു്. ഇവിടെ അതു് എന്നതിലെ അകാ‍രത്തെ കളഞ്ഞിട്ടു് ല് എന്ന ശുദ്ധവ്യഞ്ജനമാക്കുന്നു. സാധാരണയായി അതു ചെയ്യുന്നതു് ഒരു ചന്ദ്രക്കല ഇട്ടു് ആയതു കൊണ്ടു് ചിലര്‍ അതിനെ “ചന്ദ്രക്കല” എന്നു പറയാറുണ്ടു്. പക്ഷേ വിരാമം ഉള്ളിടത്തൊക്കെ ചന്ദ്രക്കല ഉണ്ടാവണമെന്നില്ല. ഉദാഹരണം ല്ല എന്നതു തന്നെ.

അല്പം കൂടി വലിയ ഒരു കൂട്ടക്ഷരം നോക്കാം. ഗ്ദ്ധ എന്ന അക്ഷരം യൂണിക്കോഡില്‍ എപ്പോഴും ഗ + വിരാമം + ദ + വിരാമം + ധ ആണു്. അതു കാണിക്കുന്ന ഫോണ്ടുകള്‍ അതിനെ ഒറ്റ അക്ഷരമായോ ഗ + ചന്ദ്രക്കല + ദ്ധ എന്നോ ഗ്ദ + ചന്ദ്രക്കല + ധ എന്നോ ഗ + ചന്ദ്രക്കല + ദ + ചന്ദ്രക്കല + ധ എന്നോ കാണിച്ചെന്നിരിക്കും. (ഫോണ്ടിലോ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിലെ ലേ ഔട്ട് എഞ്ചിനോ ബഗ്ഗുണ്ടെങ്കില്‍ വേറേ രീതിയിലും കണ്ടെന്നിരിക്കാം.) എങ്കിലും ആ യൂണിക്കോഡ് ടെക്സ്റ്റ് സൂക്ഷിച്ചിരിക്കുന്ന ഒരു ഫയലില്‍ എപ്പോഴും 0D17(ഗ), 0D4D(വിരാമം), 0D26(ദ) 0D4D (വിരാമം), 0D27 (ധ) എന്നു് അഞ്ചു യൂണിക്കോഡ് കോഡുകളേ ഉണ്ടായിരിക്കുകയുള്ളൂ. യൂണിക്കോഡിലെ (പതിപ്പു് 5.0) മലയാളം കോഡുകള്‍ ഏതൊക്കെയാണെന്നു് ഇവിടെ വായിക്കാം.

ഏതു തരം എന്‍‌കോഡിംഗ് ആ‍ണുപയോഗിക്കുന്നതു് എന്നതിനെ ആശ്രയിച്ചു് ഫയലിലുള്ള ബൈറ്റുകള്‍ക്കു് വ്യത്യാസമുണ്ടായിരിക്കും. ഉദാഹരണമായി മലയാളത്തിലെ ഓരോ കോഡിനും മൂന്നു ബൈറ്റു് ഉപയോഗിക്കുന്ന utf-8 എന്ന രീതിയില്‍ (ഇതാണു് ഭൂരിഭാഗം വെബ്‌പേജുകളില്‍ ഉപയോഗിക്കുന്നതു്) ഗ്ദ്ധ എന്നതിലെ അഞ്ചു യൂണിക്കോഡ് കോഡുകളെ E0 B4 97 E0 B5 8D E0 B4 A6 E0 B5 8D E0 B4 A7 എന്നു പതിനഞ്ചു ബൈറ്റുകള്‍ കൊണ്ടു സൂചിപ്പിക്കുമ്പോള്‍ മലയാളം കോഡുകള്‍ക്കു രണ്ടു ബൈറ്റു വീതം ഉപയോഗിക്കുന്ന utf-16 രീതിയില്‍ അതിനെ 0D 17 0D 4D 0D 26 0D 4D 0D 27 എന്നു പത്തു ബൈറ്റുകളില്‍ സൂചിപ്പിക്കുന്നു.

ഇനി വിദഗ്ദ്ധന്‍ എന്നെഴുതുന്ന ഒരാള്‍ക്കു് അതു് ഗ + ചന്ദ്രക്കല + ദ്ധ എന്നു തന്നെ കാണണം എന്നു നിര്‍ബന്ധമുണ്ടെന്നിരിക്കട്ടേ. അതിനുള്ള വഴിയാണു് ZWNJ. Zero Width Non-Joiner എന്നതിന്റെ ചുരുക്കം. ഇവിടെ ഗ്ദ്ധ എന്നതിനെ ഗ, വിരാമം, ZWNJ, ദ, വിരാമം, ധ എന്നു സൂചിപ്പിക്കുന്നു-ഗ്‌ദ്ധ എന്നു കാണുവാന്‍ വേണ്ടി.

മിക്കവാറും ടെക്സ്റ്റ് എഡിറ്ററുകളും ബ്രൌസറുകളും യെയും ദ്ധയെയും വേര്‍തിരിച്ചു തന്നെ കാണിക്കും. പക്ഷേ, ഈ ടെക്സ്റ്റ് നെറ്റ്‌വര്‍ക്കിലൂടെ യാത്ര ചെയ്യുമ്പോഴോ ഡാറ്റാബേസുകളില്‍ ശേഖരിച്ചിട്ടു തിരിച്ചെടുക്കുമ്പോഴോ ഈ-മെയില്‍, ഫീഡ് റീഡറുകള്‍ തുടങ്ങിയ സ്ഥലങ്ങളില്‍ പരിവര്‍ത്തനം ചെയ്യുമ്പോഴോ ഈ ZWNJ നഷ്ടപ്പെട്ടു പോയേക്കാം. കാരണം യൂണിക്കോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് അനുസരിച്ചു് അതൊരു ഡീഫോള്‍ട്ട് ഇഗ്നോരബിള്‍ കാരക്ടര്‍ ആണു്. അങ്ങനെ സംഭവിച്ചാലും ഗ്‌ദ്ധ (ഗ + ചന്ദ്രക്കല + ദ്ധ) എന്നതു് ഗ്ദ്ധ (ഒറ്റ ഗ്ലിഫ്) ആയിപ്പോകുമെന്നേ ഉള്ളൂ. ഇതൊരു വലിയ പ്രശ്നമല്ല-കാണാന്‍ അല്പം അലോസരം ഉണ്ടാക്കിയാലും.

ഇതു പോലെയുള്ള മറ്റൊരു ഡീഫോള്‍ട്ട് ഇഗ്നോറബിള്‍ കാരക്ടര്‍ ആണു് ZWJ (Zero Width Joiner). രണ്ടു കാരക്ടരുകളെ ഒന്നിച്ചേ കാണിക്കാവൂ എന്നാണു് ഇതിന്റെ അര്‍ത്ഥം. ഒരു ഉദാഹരണം ഇംഗ്ലീഷില്‍ fi എന്നെഴുതുമ്പോള്‍ അവ രണ്ടും ചേര്‍ത്തെഴുതി എന്നു കാണിക്കാന്‍ f, ZWJ, i എന്നെഴുതുന്നതാണു്. ഇതു് fi എന്നു കാണിക്കും. ഇതിലെ ZWJ നഷ്ടപ്പെട്ടു fi എന്നായാലും വലിയ കുഴപ്പമൊന്നുമില്ലാത്തതിനാല്‍ ഇവിടെ ZWJ ഉപയോഗിച്ചതില്‍ തെറ്റില്ല. (ചേര്‍ന്നു നില്‍ക്കുന്ന fi-യ്ക്കും ഒരു പ്രത്യേക കോഡ് പോയിന്റുണ്ടെന്നതു മറ്റൊരു കാര്യം.)

മിക്കവാറും എല്ലാ സ്ക്രിപ്റ്റുകള്‍ക്കും ഈ ജോയിനറുകള്‍ ഫോര്‍മാറ്റ് കാരക്ടറുകള്‍ (അക്ഷരങ്ങള്‍ക്കു bold, italics തുടങ്ങിയ സ്വഭാവങ്ങള്‍ കൊടുക്കുന്ന മാര്‍ക്കറുകള്‍) പോലെയാണു്. നഷ്ടപ്പെട്ടാലും അര്‍ത്ഥവ്യത്യാസമുണ്ടാവുന്നില്ല.

ചുരുക്കം ചില സ്ക്രിപ്റ്റുകളില്‍ ജോയിനറുകള്‍ ഫോര്‍മാറ്റ് വ്യത്യാസത്തില്‍ അല്പം കൂടി കൂടിയ സെമാന്റിക് വ്യത്യാസമുണ്ടാക്കുന്നുണ്ടു്. കൂട്ടക്ഷരങ്ങള്‍ (conjuncts) ഉള്ള ഇന്ത്യന്‍ ഭാഷകളും അറബിയുമാണു് ഇവയില്‍ പ്രധാനം. കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാക്കുമ്പോള്‍ കര്‍ത്താവിന്റെ അഭിരുചിക്കനുസരിച്ചുള്ള രൂപം വരാ‍ന്‍ ജോയിനറുകള്‍ ഉപയോഗിക്കാതെ നിവൃത്തിയില്ല. പക്ഷേ ഇവിടെയും ജോയിനറുകള്‍ അര്‍ത്ഥവ്യത്യാസമുണ്ടാക്കാതിരിക്കേണ്ടതു് ആവശ്യമാണു്.

അപ്പോള്‍ സദ്വാരം, ഉമേശ്വരന്‍, വന്യവനിക, കണ്വലയം,…?

സദ്വാരം (സ + ദ്വാരം, സദ് + വാരം), ഉമേശ്വരന്‍ (ഉമാ + ഈശ്വരന്‍, ഉമേശ് + വരന്‍) തുടങ്ങിയവയ്ക്കു രണ്ടര്‍ത്ഥം പറയാമെങ്കിലും അതു ഭാഷയുടെ പ്രത്യേകതയും പലപ്പോഴും സൌന്ദര്യവുമാണു്. (ഇതു സുറുമയും എവിടെയോ പറഞ്ഞിട്ടുണ്ടെന്നാണു് ഓര്‍‍മ്മ.) “പരമസുഖം ഗുരുനിന്ദ കൊണ്ടുമുണ്ടാം” എന്ന വരിയിലെ “പരമസുഖം” എന്ന വാക്കിനു ജോയിനറുകള്‍ ഇല്ലാതെ തന്നെ രണ്ടു പിരിവുകള്‍ (പരമ + സുഖം, പരം + അസുഖം) ഉണ്ടാകുന്നതു പോലെയാണിതു്. “സഭംഗശ്ലേഷം” എന്നാണു് ഇതിനെ കാവ്യശാസ്ത്രത്തില്‍ പറയുന്നതു്. അര്‍ത്ഥശങ്ക ഉണ്ടാകരുതു് എന്നു നിര്‍ബന്ധമാണെങ്കില്‍ പിരിച്ചു തന്നെ എഴുതുകയോ (സദ്-വാരം) ബ്രായ്ക്കറ്റിലോ ഫുട്ട്നോട്ടിലോ‍ കൊടുക്കുകയോ ചെയ്യുക. വന്യവനിക (വന്യ-വനിക, വന്‍-യവനിക), കണ്വലയം (കണ്വ-ലയം, കണ്‍-വലയം) തുടങ്ങിയവയുടെയും സ്ഥിതി ഇതു തന്നെ. ഇതു ചില്ലുവാദത്തിനു് അനുകൂലമോ പ്രതികൂലമോ ആയ വസ്തുതയാണെന്നു് എനിക്കു തോന്നുന്നില്ല.

എന്തുട്ടാ ഈ ഐഡിയെന്നും സ്പൂഫിംഗും?

അറ്റോമിക് ചില്ലിനെ അനുകൂലിച്ചും എതിര്‍ത്തും ആളുകള്‍ വാദിച്ചപ്പോള്‍ IDN-നെപ്പറ്റിയും സ്പൂഫിങ്ങിനെപ്പറ്റിയും വളരെ പറഞ്ഞിരുന്നു. തികച്ചും ബാലിശമായ വാദങ്ങളാണു് അവ. ഒരു വെബ്‌പേജിന്റെ അഡ്രസ്സു പോലെ കാഴ്ചയ്ക്കു തോന്നുന്ന മറ്റൊരു അഡ്രസ് ഉപയോഗിച്ചു് ഉപഭോക്താക്കളെ വഴി തെറ്റിക്കുന്നതാ‍ണു് ഇവിടെ ഉദ്ദേശിക്കുന്നതു്. ഇതു് ഇന്റര്‍നെറ്റ് സെക്യൂരിറ്റി ഇഷ്യൂ ആണു്; യൂണിക്കോഡുമായി ബന്ധപ്പെട്ടതല്ല. ഉദാഹരണമായി, a എന്ന ആകൃതിയുള്ള അക്ഷരം പല ഭാഷകളിലുമുണ്ടു്. ഒന്നിനു പകരം മറ്റൊന്നുപയോഗിച്ചു് സ്പൂഫിംഗ് ചെയ്യാം. (“Paypal spoofing” എന്നൊന്നു സേര്‍ച്ചു ചെയ്തു നോക്കൂ. കൂടുതല്‍ വിവരങ്ങള്‍ കിട്ടും.)

മലയാളത്തിലും സ്പൂഫിംഗ് ഉണ്ടാക്കാന്‍ ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യുകയോ ചെയ്യാതിരിക്കുകയോ വേണ്ട. (രണ്ടു പക്ഷക്കാരുടെയും വാദങ്ങള്‍ കേട്ടു മടുത്തു!) ഥ എന്ന മലയാള അക്ഷരത്തിനു പകരം മ (ம) എന്ന തമിഴ് അക്ഷരം ഉപയോഗിക്കാം. ട എന്ന മലയാള അക്ഷരത്തിനു പകരം എസ് (s) എന്ന ഇംഗ്ലീഷ് അക്ഷരം ഉപയോഗിക്കാം. മലയാളത്തില്‍ത്തന്നെ ന്‍ എന്ന ചില്ലിനു പകരം 9 (൯) എന്ന അക്കവും ര്‍ എന്ന ചില്ലിനു പകരം 4 (൪) എന്ന അക്കവും ഉപയോഗിക്കാം. അനുസ്വാരവും ഠ എന്ന അക്ഷരവും ഒ (o) എന്ന ഇംഗ്ലീഷ് അക്ഷരവും 0 എന്ന അക്കവും ൦ എന്ന മലയാള അക്കവും ഉപയോഗിച്ചും സ്പൂഫിംഗ് നടത്താം.

സ്പൂഫിംഗ് തടയുന്നതു് കൂടുതല്‍ സങ്കീര്‍ണ്ണമായ വിഷയമാ‍ണു്. അറ്റോമിക് ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യുന്നതും അതുമായി കൂട്ടിക്കുഴയ്ക്കുന്നതു് വിഷയത്തില്‍ നിന്നു വ്യതിചലിക്കലാണു്.

അപ്പോള്‍പ്പിന്നെ എന്തിനാണു് അറ്റോമിക് ചില്ലുകള്‍? പാല്‍ എന്നും പാല് എന്നും എഴുതിയാല്‍ അര്‍ത്ഥം മാറുന്നില്ലല്ലോ?

മുകളില്‍ പറഞ്ഞതു പോലെ, ജോയിനറുകള്‍ നഷ്ടപ്പെടുന്നതു കൊണ്ടു വരുന്ന വിഷ്വല്‍ ഡിസ്റ്റോര്‍ഷന്‍ അറ്റോമിക് ചില്ലുകളെ അനുകൂലിക്കാനോ എതിര്‍ക്കാനോ ഉള്ള മതിയായ കാരണമല്ല. കാരണമാവണമെങ്കില്‍ ജോയിനര്‍ നഷ്ടപ്പെടുന്നതിനു മുമ്പും പിമ്പുമുള്ള രൂപങ്ങള്‍ തികച്ചും വ്യത്യസ്തങ്ങളാവണം. അവയ്ക്കു് അങ്ങോട്ടുമിങ്ങോട്ടും മാറ്റാന്‍ പറ്റാത്ത വിധം വ്യത്യസ്തങ്ങളായ അര്‍ത്ഥം ഉണ്ടാവണം.

ഇതു് ഒരു കാര്യത്തിലേ ഉണ്ടാകുന്നുള്ളൂ. അതാണു് അറ്റോമിക് ചില്ലു വാദികള്‍ തങ്ങളുടെ തുറുപ്പുചീട്ടായി മുന്നില്‍ വെയ്ക്കുന്നതു്. ആ കാരണമാ‍കട്ടേ, മതിയായ കാരണമാണു താനും.

സംവൃതോകാരത്തെ ചില്ലില്‍ നിന്നു വ്യവച്ഛേദിക്കുന്നതാണു് ആ‍ കാ‍രണം.

ദാ, അടുത്ത സാധനം. എന്താ ഈ സംവൃതോകാരം?

പണ്ടു് എന്നു പറയുമ്പോള്‍ അവസാനം വരുന്ന ശബ്ദമാണു സംവൃതോകാരം. അതു് അ അല്ല, ഉ അല്ല, സംവൃതവുമല്ല. ഭാഷാശാസ്ത്രജ്ഞര്‍ അതിനെ Schwa എന്നു വിളിക്കുന്നു. പല ഭാ‍ഷകളിലുമുള്ള ഒരു ശബ്ദമാണതു്. ഇതിനെ പ്രത്യേകമായി എഴുതിക്കാണിക്കാറുണ്ടു് എന്നതാണു് മലയാളത്തിന്റെ ഒരു പ്രത്യേകത.

പണ്ടു് എന്ന വാക്കിനെ പല തരത്തില്‍ എഴുതിപ്പോന്നിരുന്നു. വളരെ പഴയ മലയാളത്തില്‍ പണ്ട എന്നായിരുന്നു എഴുതിയിരുന്നതു്‌. ഗുണ്ടര്‍ട്ടു മുതലായ പാതിരിമാര്‍ അതിനെ പണ്ടു എന്നെഴുതി. (“സ്ത്രീയേ, നിനക്കു എന്തു?” എന്നു പഴയ ബൈബിളില്‍.) അതേ സമയത്തു തന്നെ വളരെപ്പേര്‍ (പ്രധാ‍നമായും വടക്കന്‍ കേരളത്തിലുള്ളവര്‍) അതിനെ പണ്ട് എന്നെഴുതി. (പണ്ടു എന്നതിനെ ‘പാതിരിമലയാളം’ എന്നു കളിയാക്കുകയും ചെയ്തു.) ഈ കാര്യങ്ങളൊക്കെ ഏ. ആര്‍. രാജരാജവര്‍മ്മ “കേരളപാണിനീയ”ത്തിന്റെ പീഠികയില്‍ വിശദമായി പറഞ്ഞിട്ടുണ്ടു്. ഏ. ആറിന്റെ കാലത്താണു സംവൃതോകാരത്തിന്റെ പല രൂപങ്ങളെ ചേര്‍ത്തു പണ്ടു് എന്ന രൂപം സാര്‍വ്വത്രികമായതു്. ഇതു വളരെയധികം ആളുകള്‍ ഉപയോഗിച്ചെങ്കിലും ഒരു നല്ല ശതമാനം ആളുകളും സംവൃതോകാരാത്തിനു ചന്ദ്രക്കല മാത്രം ഉപയോഗിക്കുന്ന രീതി തുടര്‍ന്നു വന്നു. 1970-കളില്‍ പുതിയ ലിപി വ്യാപകമായപ്പോള്‍ അതുപയോഗിക്കുന്ന എല്ലാവരും തന്നെ ഉകാരത്തിന്റെ ചിഹ്നമിടാതെ സംവൃതോകാരം എഴുതിത്തുടങ്ങി. ഇപ്പോള്‍ അതാണു ബഹുഭൂരിപക്ഷം ആളുകളും ഉപയോഗിക്കുന്നതു് എന്നതാണു വാസ്തവം.

(ഇതിനെപ്പറ്റി ഉദാഹരണങ്ങളുള്ള പേജുകളുടെ പടങ്ങള്‍ ചേര്‍ത്തു് സിബു പണ്ടു പ്രസിദ്ധീകരിച്ചതു് ഇവിടെ.)

എഴുത്തു തുടങ്ങിയപ്പോള്‍ മുതല്‍ ഉകാരത്തിന്റെ ചിഹ്നത്തോടു കൂടി മാത്രമേ ഞാന്‍ സംവൃതോകാരം എഴുതിയിട്ടുള്ളൂ. ഇപ്പോഴും അതു തുടരുന്നു. ഒരു കാലത്തു് അതു മാത്രമാണു ശരി എന്നു ഞാന്‍ ഘോരഘോരം വാദിച്ചിട്ടുണ്ടു്. (ഞാന്‍ രണ്ടു കൊല്ലത്തിനു മുമ്പെഴുതിയ സംവൃതോകാരം, സംവൃതോകാരവും ലിപിപരിഷ്കരണങ്ങളും, സംവൃതോകാരത്തെപ്പറ്റി വീണ്ടും എന്നീ ലേഖനങ്ങള്‍ കാണുക.) സംവൃതോകാരത്തെ ഉകാരത്തിന്റെ ചിഹ്നത്തോടൊപ്പം ചന്ദ്രക്കലയിട്ടെഴുതുന്നതു തെറ്റല്ല എന്നാണു് ഇപ്പോഴും എന്റെ വിശ്വാസം. എങ്കിലും അതു മാത്രമാണു ശരി എന്ന കടും‌പിടുത്തത്തില്‍ നിന്നു വളരെയധികം പിറകോട്ടു പോയിരിക്കുന്നു. പുതിയ ലിപി പ്രാവര്‍ത്തികമാകുന്നതിനു മുമ്പു തന്നെ (സത്യം പറഞ്ഞാല്‍, സംവൃതോകാരത്തെ പണ്ടു് എന്നു് എഴുതുന്നതിനു മുമ്പു തന്നെ) ചന്ദ്രക്കല മാത്രം ഉപയോഗിച്ചു സംവൃതോകാരം എഴുതിയിരുന്നു എന്ന അറിവും, ഇന്നുള്ള മലയാളപുസ്തകങ്ങളില്‍ ഭൂരിപക്ഷവും ഉകാരത്തിന്റെ ചിഹ്നമില്ലാതെ ചന്ദ്രക്കല മാത്രമായാണു സംവൃതോകാരത്തെ എഴുതുന്നതു് എന്ന കണ്ടെത്തലുമാണു് ഇതിനു കാരണം.

ചുരുക്കം പറഞ്ഞാല്‍ സംവൃതോകാരത്തെ ഉകാരത്തിന്റെ ചിഹ്നമില്ലാതെ ചന്ദ്രക്കല മാത്രം ഇട്ടു് (ഇട്ട് എന്ന്) എഴുതിത്തുടങ്ങിയതു പലരും പറയുന്നതു പോലെ പുതിയ ലിപി എഴുപതുകളില്‍ പ്രാബല്യത്തില്‍ വന്നപ്പോഴല്ല. അതൊരു തെറ്റാണെങ്കില്‍‍ അതു തിരുത്താന്‍ നാം വൈകിയതു മുപ്പത്തെട്ടു വര്‍ഷമല്ല, നൂറില്‍ ചില്വാനം വര്‍ഷമാണു്.

മലയാളഭാഷ ഉപയോഗിക്കുന്ന ഭൂരിപക്ഷം എഴുത്തുകാരും അവലംബിക്കുന്ന ഒരു രീതി തെറ്റും പ്രാചീനവും നവീനവുമല്ലാത്ത ഇടയ്ക്കൊരു ചെറിയ കാ‍ലഘട്ടത്തില്‍ മാ‍ത്രം (ഏകദേശം 70 വര്‍ഷം) കൂടുതല്‍ പ്രാവര്‍ത്തികമായിരുന്നതുമായ ഒരു രീതി മാത്രം ശരിയും ആണു് എന്നു് ഈ അടുത്ത കാലത്തു വരെ ഞാനും ഇപ്പോഴും രചന, സ്വതന്ത്ര മലയാ‍ളം കമ്പ്യൂട്ടിംഗ് തുടങ്ങിയവരും ഉന്നയിക്കുന്ന വാദം വളരെ ബാലിശമാണു്. കഥകളുടെയും കവിതകളുടെയും മറ്റു പുസ്തകങ്ങളുടെയും കാര്യം അവിടെ നില്‍ക്കട്ടേ. മലയാളഭാഷയിലെ തെറ്റുകള്‍ തിരുത്താനായി വളരെയധികം പുസ്തകങ്ങള്‍ എഴുതിയിട്ടുള്ള പന്മന രാമചന്ദ്രന്‍ നായരുടെ പുസ്തകങ്ങളിലും സംവൃതോകാരം ചന്ദ്രക്കല മാത്രമായാണു് അച്ചടിച്ചിരിക്കുന്നതു്. അതു തെറ്റാണെന്ന തോന്നല്‍ അദ്ദേഹത്തിനുണ്ടായിരുന്നെങ്കില്‍ അങ്ങനെ അച്ചടിച്ച ഒരു പുസ്തകം വെളിച്ചം കാണാന്‍ അദ്ദേഹം സമ്മതിക്കില്ലായിരുന്നു.

ഇതും ആറ്റോമിക് ചില്ലുവാദവും തമ്മില്‍ എന്തു ബന്ധം?

പണ്ടു്, വാക്കു്, തൈരു് തുടങ്ങിയ വാക്കുകളെ പണ്ട്, വാക്ക്, തൈര് എന്നിങ്ങനെയും എഴുതുന്നതു തെറ്റല്ല എന്ന വസ്തുതയാണു് അറ്റോമിക് ചില്ലുവാദികള്‍ക്കു് അനുകൂലമായ വസ്തുത.

ഇതനുസരിച്ചു്, അവനു് എന്ന വാക്കിനെ അവന് എന്നും എഴുതാം. നു് എന്നതു് ന + ഉ (ചിഹ്നം) + വിരാമം ആണു്. (യൂണിക്കോഡില്‍ വിരാമം ഒരു വ്യഞ്ജനത്തിനു ശേഷം അതിലുള്ള സ്വരം കളയാന്‍ മാത്രമാണുള്ളതു് എന്നൊരു വാദം വേറെ ഒരിടത്തു നടക്കുന്നുണ്ടു്. അവരാരും സംവൃതോകാരം എഴുതുന്ന രീതി കണ്ടിട്ടില്ലെന്നു തോന്നുന്നു.) ന് എന്നതു ന + വിരാമം എന്നും. ഇപ്പോള്‍ ന്‍ എന്ന ചില്ലക്ഷരം യൂണിക്കോഡില്‍ എഴുതുന്നതു് ന + വിരാമം + ZWJ എന്നാണു്. മുന്‍‌പറഞ്ഞ പ്രകാരം ഇതിലെ ZWJ നഷ്ടപ്പെട്ടാല്‍ ന്‍ എന്ന ചില്ലക്ഷരം ന് എന്നാകും. അതായതു്, അവന്‍ എന്നതിനും അവന് എന്നതിനും വ്യത്യാസമില്ലാതെ പോകും. ഇതു് അനുവദിക്കാന്‍ സാദ്ധ്യമല്ല. ഇതു മുകളില്‍പ്പറഞ്ഞ സഭംഗശ്ലേഷമല്ല.

അവന്‍/അവനു് എന്നതു് ഒരുദാഹരണം മാത്രം. ഇതുപോലെ ചിന്താക്കുഴപ്പത്തിനു വഴി തെളിക്കുന്ന അനേകം വാക്കുകള്‍ മലയാളത്തിലുണ്ടു്. ഈ ചിന്താക്കുഴപ്പം ഒഴിവാക്കേണ്ടതുണ്ടു്.

എന്താണു അറ്റോമിക് ചില്ലുവാദികള്‍ പറയുന്നതു്?

ചില്ലക്ഷരങ്ങളെ മൂലവ്യഞ്ജനം + വിരാമം + ZWJ എന്നല്ലാതെ ഒരു പ്രത്യേക കോഡു കൊണ്ടു സൂചിപ്പിക്കുക. അപ്പോള്‍ ഒരിക്കലും ഒന്നു മറ്റേതാകുന്ന പ്രശ്നം ഉണ്ടാവില്ല. ഏതു ബ്രൌസറിലും ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിലും ചില്ലക്ഷരങ്ങള്‍ കാണാന്‍ കഴിയും.

എന്റെ അഭിപ്രായം:

മുകളില്‍പ്പറഞ്ഞ കാരണങ്ങള്‍ കൊണ്ടു് എനിക്കു് ഇപ്പോള്‍ അറ്റോമിക് ചില്ലുകള്‍ വേണം എന്ന വാദത്തിനോടാണു യോജിപ്പു്. അതിനെ എതിര്‍ക്കുന്ന യുക്തിയുക്തമായ വാദം കേട്ടാല്‍ ഈ അഭിപ്രായം തിരുത്താന്‍ ഞാന്‍ തയ്യാറാണു്. പക്ഷേ, ആ വാദം “അവനു് എന്നതിനെ അവന് എന്നെഴുതുന്നതു തെറ്റാണു്” എന്നതാവരുതു് എന്നു മാത്രം.

വാല്‍ക്കഷണം

ഇതു ഫയര്‍ ഫോക്സ് 2-വില്‍ വായിക്കുന്നവര്‍ ചില്ലായ ന്‍, ചില്ലല്ലാത്ത ന് എന്നിവ ഒരുപോലെ കണ്ടു് അന്തം വിട്ടിരിക്കുന്നുണ്ടാവാം. അവര്‍ ഈ പോസ്റ്റിന്റെ ആ‍ദിയിലുള്ള മൈക്ക് ടെസ്റ്റിംഗ് ഒന്നു കൂടി വായിക്കുക.

അറ്റോമിക് ചില്ലുണ്ടായിരുന്നെങ്കില്‍ ഈ കുഴപ്പമൊന്നുമുണ്ടാവില്ലായിരുന്നു. ഭാവിയിലെങ്കിലും ബ്ലോഗ് വായനക്കാര്‍ക്കു് ഈ പ്രശ്നമുണ്ടാവില്ല എന്നു പ്രത്യാശിക്കാം.


ഇതിന്റെ ചില കമന്റുകള്‍ക്കു മറുപടി:

[2008-02-05]

സുരേഷ് (സുറുമ?) ഈ കമന്റില്‍ ഇങ്ങനെ പറയുന്നു:

പ്രചാരം കൂടുതലാണു് എന്നതുകൊണ്ടുമാത്രമായിരിക്കും ഉദാഹരിക്കാന്‍ ഉമേഷ് ഗൂഗ്ള്‍ തെരെഞ്ഞെടുത്തതു് എന്നു കരുതുന്നു 🙂 .സ്വതന്ത്രസോഫ്റ്റ്‌വെയന്‍ ആയ ബീഗ്ള്‍ GNU/Linux സിസ്റ്റങ്ങളില്‍ ഡെസ്ക്‌ടോപ് സെര്‍ച്ചിനു് ഉപയോഗിച്ചുപോരുന്നുണ്ടു്.അതുപയോഗിച്ചു് നടത്തിയ തെരച്ചിലിന്റെ പടം കൂടി ഒന്നിടണമെന്നു് അഭ്യര്‍ത്ഥിക്കുന്നു.ഒന്നും വേണ്ട, യാഹൂ,msn എന്നിയും ഇതുപോലുള്ള ഫലമാണോ തരുന്നതു് എന്നുകൂടി വ്യക്തമാക്കൂ.

അതായതു്, ഇതു് ഗൂഗിളിലെ ഒരു ബഗ്ഗാണെന്നു്, അല്ലേ? ഇനി, ഈ പോസ്റ്റെഴുതാന്‍ വേണ്ടി ഞാന്‍ ഗൂഗിള്‍ കോഡില്‍ കയറി ഈ ബഗ് അവിടെ ഉണ്ടാക്കി എന്നു പറയില്ലല്ലോ, അല്ലേ? (തമാശയല്ല, ജീമെയിലില്‍ ജോയിനര്‍ കളയുന്നതു സിബു മനഃപൂര്‍വ്വം ഉണ്ടാക്കിയ ഒരു ബഗ് ആണെന്നു് അനിവറാണെന്നു തോന്നുന്നു ഒരിക്കല്‍ പറഞ്ഞിരുന്നു :))

ഇനി, യാഹൂ, എം. എസ്. എന്‍. എന്നിവയ്ക്കു് ഈ കുഴപ്പമില്ല എന്ന വാദത്തെപ്പറ്റി, ദാ അവ താഴെ. മറ്റുള്ള കാര്യങ്ങള്‍ക്കു വ്യത്യാസമില്ല. വിന്‍ഡോസ് എക്സ്. പി., ഇന്റര്‍നെറ്റ് എക്സ്പ്ലോറര്‍, കാര്‍ത്തിക ഫോണ്ട്.

ആദ്യമായി, അതേ സേര്‍ച്ച് യാഹൂ ഉപയോഗിച്ചു്:

അവനെയും അവനെയും കണ്ടല്ലോ? യാഹുവിന്റെ അവന്‍ ഗൂഗിളിന്റെ അവനുമായി വ്യത്യാസമൊന്നുമില്ല എന്നും കണ്ടല്ലോ?

ഇനി, അതു തന്നെ എം. എസ്. എന്‍. ലൈവ് സേര്‍ച്ച് ഉപയോഗിച്ചു്:

ക്ഷമിക്കണം, ബീഗിള്‍ ഇപ്പോള്‍ കൈവശമില്ല. ഇനി അതില്‍ ജോയിനര്‍ കളയുന്നില്ല എന്നതു കൊണ്ടു് ഞാന്‍ പറഞ്ഞതു കൊണ്ടു വ്യത്യാസമൊന്നും വരാനില്ല. ജോയിനറുകള്‍ എപ്പോഴും നഷ്ടപ്പെടും എന്നു ഞാന്‍ പറഞ്ഞില്ല, നഷ്ടപ്പെട്ടേയ്ക്കാം എന്നേ പറഞ്ഞുള്ളൂ.

ഇനി മുതല്‍, ദയവായി ആരോപണം ഉന്നയിക്കുന്നതിനു മുമ്പു് അതൊന്നു പരീക്ഷിച്ചു നോക്കുന്നതു നന്നായിരിക്കും. ഓരോന്നും പരീക്ഷിച്ചു നോക്കി സ്ക്രീന്‍‌ഷോട്ടെടുത്തു് അപ്‌ലോഡു ചെയ്തു പോസ്റ്റു തിരുത്താന്‍ അല്പം ബുദ്ധിമുട്ടാണേ, അതുകൊണ്ടാണു് 🙂

[2008-02-13]

ഗൂഗിള്‍, യാഹൂ, ലൈവ് സേര്‍ച്ച്, വെബ് ദുനിയാ എന്നീ സേര്‍ച്ച് എഞ്ചിനുകള്‍ ജോയിനറുകളെ കൈകാര്യം ചെയ്യുന്നതിനെപ്പറ്റി കമന്റുകള്‍ ഉണ്ടായിരുന്നു. ഞാന്‍ കണ്ടെത്തിയതു താഴെ:

Xഅവന്‍Y എന്നതു് (X, Y എന്നിവ ഏതെങ്കിലും ഫോര്‍മാറ്റ് സ്ട്രിംഗുകള്‍) ചില്ലോടെ കാണണമെങ്കില്‍ X-അ-വ-ന-വിരാമം-ZWJ-Y എന്നിവ ഉണ്ടാവണം. അതായതു്, U+0D05 U+0D35 U+0D28 U+0D4D U+200D എന്നീ കോഡ്‌പോയിന്റുകള്‍ ഫോര്‍മാറ്റിംഗ് കാരക്ടേഴ്സ് ആയ X, Y എന്നിവയ്ക്കു് ഇടയില്‍ വരണം.

ഗൂഗിള്‍ സേര്‍ച്ച് റിസല്‍റ്റുകള്‍ കാണിക്കുന്ന പേജില്‍ ZWJ-യെ ഒഴിവാക്കുന്നു. <b->-അ-വ-ന-വിരാമം-<-/-b-> (U+003C U+0062 U+003E U+0D05 U+0D35 U+0D28 U+0D4D U+003C U+002F U+0062 U+003E) എന്നേ ഉള്ളൂ. ZWJ (U+200D)-യെ ഒഴിവാക്കി.

യാഹൂ ZWJ കളയുന്നില്ല. പക്ഷേ, അവന്‍ എന്നതു കാണിക്കുമ്പോള്‍ <b->-അ-വ-ന-വിരാമം-ZWJ-<-/-b-> (U+003C U+0062 U+003E U+0D05 U+0D35 U+0D28 U+0D4D U+200D U+003C U+002F U+0062 U+003E) എന്നതിനു പകരം <b->-അ-വ-ന-വിരാമം-<-/-b->-ZWJ (U+003C U+0062 U+003E U+0D05 U+0D35 U+0D28 U+0D4D U+003C U+002F U+0062 U+003E U+200D) എന്നു കാണിക്കുന്നു. (അതായതു്, </b>-നെ ZWJ-നു ശേഷം ചേര്‍ക്കുന്നതിനു പകരം മുമ്പു ചേര്‍ക്കുന്നു.) അതു കൊണ്ടാണു് ബ്രൌസറില്‍ ചില്ലക്ഷരം കാണാത്തതു്.

മൈക്രോസോഫ്റ്റ് ലൈവ് സേര്‍ച്ച് ചിലയിടത്തു യാഹൂ ചെയ്തതു പോലെ ചെയ്യുന്നു. മറ്റു ചിലടത്തു് ZWJ-യെ ZWNJ ആക്കുന്നുമുണ്ടു്. എന്തായാലും ജോയിനര്‍ കളയുന്നില്ല എന്നു തോന്നുന്നു.

വെബ്‌ദുനിയാ ഒരു കുഴപ്പവും ഇല്ലാതെ ഇതു കൈകാര്യം ചെയ്യുന്നു. ZWJ-യെ കളയുന്നുമില്ല, അ-വ-ന-വിരാമം-ZWJ- എന്നു തന്നെ കാണിക്കുകയും ചെയ്യുന്നു. അതുകൊണ്ടു ചില്ലക്ഷരങ്ങള്‍ ഹൈലൈറ്റു ചെയ്തു കാണാം. (എന്നു് എനിക്കു തോന്നി. കൂടുതല്‍ താഴെ വായിക്കുക.)

ഇതില്‍ നിന്നു് മലയാളത്തോടു് ഏറ്റവും നീതി പുലര്‍ത്തുന്നതു വെബ് ദുനിയാ ആണെന്നും, ഏറ്റവും മോശമായി മലയാളം സേര്‍ച്ചു ചെയ്യുന്നതു ഗൂഗിള്‍ ആണെന്നും പറയാമോ?

വരട്ടേ. സ്വപ്നം (U+0D38 U+0D4D U+0D35 U+0D2A U+0D4D U+0D28 U+0D02) എന്നും സ്വപ്‌നം (U+0D38 U+0D4D U+0D35 U+0D2A U+0D4D U+200C U+0D28 U+0D02) എന്നും ഒന്നു സേര്‍ച്ചു ചെയ്തു നോക്കൂ. ഇവ തമ്മിലുള്ള വ്യത്യാസം പ, ന എന്നിവയെ വേര്‍തിരിച്ചു കാണിക്കാന്‍ ഒരു ZWNJ ഇട്ടിട്ടുണ്ടു് എന്നു മാത്രമാണു്.

സേര്‍ച്ച് എഞ്ചിന്‍ സ്വപ്നം ഫലങ്ങള്‍ സ്വപ്‌നം ഫലങ്ങള്‍
ഗൂഗിള്‍ 13200 13200
യാഹൂ 3270 445
ലൈവ് സേര്‍ച്ച് 221 65
വെബ് ദുനിയാ 104 104

യാഹൂവും ലൈവ് സേര്‍ച്ചും ജോയിനര്‍ ഉള്ളതും ഇല്ലാത്തതും രണ്ടായി കണ്ടിട്ടു് രണ്ടു ഫലങ്ങള്‍ തരുന്നു. ഗൂഗിളും വെബ്‌ദുനിയയും ഒരേ ഫലങ്ങളും. (ഗൂഗിള്‍ കൂടുതല്‍ ഫലങ്ങള്‍ തരുന്നു എന്നതു് ഇവിടെ പ്രസക്തമല്ല.)

വെബ് ദുനിയയെപ്പറ്റിയുള്ള എന്റെ അഭിപ്രായം പിന്നെയും കൂടി. കൊള്ളാമല്ലോ, മലയാളത്തിനു പറ്റിയ സേര്‍ച്ച് എഞ്ചിന്‍ തന്നെ!

പിന്നെ, നമ്മുടെ പഴയ അവനവന്‍ കടമ്പ (പ്രയൊഗത്തിനു കടപ്പാടു് സുറുമയ്ക്കു്) തന്നെ ഒന്നു സേര്‍ച്ചു ചെയ്തു നോക്കി.

അവന്‍ എന്നതു് വെബ്‌ദുനിയായില്‍ സേര്‍ച്ചു ചെയ്തതു് ഇവിടെ:

അവന് എന്നതു വെബ്‌ദുനിയായില്‍ സേര്‍ച്ചു ചെയ്തതു് ഇവിടെ.

ഇവ രണ്ടിലും വന്നിട്ടുള്ള സൂര്യഗായത്രി പോസ്റ്റിന്റെ ഫലം ശ്രദ്ധിക്കുക. (ചുവന്ന ചതുരത്തില്‍ കാണിച്ചിട്ടുണ്ടു്) ഒരേ പോസ്റ്റിനെ രണ്ടു വാക്കുകള്‍ കൊണ്ടു സേര്‍ച്ചു ചെയ്തപ്പോള്‍ കാണിക്കുന്നതു വ്യത്യസ്തമായാണു് എന്നു കാണാം. ഇതെങ്ങനെ സംഭവിച്ചു? സൂര്യഗായത്രിയുടെ പോസ്റ്റില്‍ പോയി നോക്കിയാല്‍ “അവന്‍” എന്നാണെന്നു കാണാം. പിന്നെങ്ങനെ വെബ് ദുനിയാ “അവന്” എന്നു കാണിച്ചു?

ആകെ സംശയമായി. വെബ് ദുനിയാ നമ്മള്‍ സേര്‍ച്ചു ചെയ്ത പദം ഈ പേജില്‍ മാറ്റി വെയ്ക്കുന്നുണ്ടോ?

കൂടുതല്‍ നോക്കിയപ്പോള്‍ കാരണം വ്യക്തമായി. വെബ് ദുനിയാ ചെയ്യുന്നതു Partial search ആണു്. അവന്‍ എന്നതു് അവന് + ZWJ ആയതിനാല്‍ അതും ഫലത്തില്‍ വന്നു എന്നു മാത്രം.

എങ്കിലും ജോയിനറുകളെ ഒഴിവാക്കിയാണു വെബ് ദുനിയായും സേര്‍ച്ചു ചെയ്യുന്നതു് എന്നു കാണാന്‍ കഴിയും. കണ്മണി, കണ്‌മണി, കണ്‍‌മണി എന്നിവ ഒരേ എണ്ണം ഫലങ്ങളാണു തരുന്നതു്. അതു പോലെ വെണ്മ, വെണ്‍‌മ, വെണ്‌മ എന്നിവയും. യാഹുവും ലൈവ് സേര്‍ച്ചും ഇവയ്ക്കു് വ്യത്യസ്ത എണ്ണം ഫലങ്ങളാണു തരുന്നതു്.

ഇതു പൂര്‍ണ്ണമായും ശരിയാണോ എന്നു പറയാന്‍ കഴിയില്ല. വെബ് ദുനിയായുടെ സേര്‍ച്ച് അല്പം കൂടി intelligent ആയതിനാലാവാം. ഒന്നിനെ സേര്‍ച്ചു ചെയ്യുമ്പോള്‍ മറ്റു പലതും കൂടി ഉള്‍ക്കൊള്ളിക്കുന്ന രീതി ഒരു പക്ഷേ മലയാളത്തിനു വേണ്ടി വളരെ നന്നാക്കിയതാവാം. എങ്കിലും കണ്മണി, കണ്‍‌മണി എന്നിവ തിരഞ്ഞപ്പോള്‍ എനിക്കു് ഈ പേജു കിട്ടി. ഇതില്‍ കണ്മണി ഇല്ല. കണ്ണും വെണ്മണിയും ഉണ്ടു്.

വെബ് ദുനിയാ തികച്ചും ഒരു വ്യത്യസ്ത സേര്‍ച്ച് എഞ്ചിന്‍ ആണെന്നേ എനിക്കു പറയാന്‍ പറ്റുന്നുള്ളൂ 🙂

യാഹുവും ലൈവ് സേര്‍ച്ചും ജോയിനര്‍ കളയാതെ സേര്‍ച്ചു ചെയ്യുന്നു. അവന്‍/അവന് എന്ന കാര്യത്തില്‍ ചില്ലിന്റെ ഇപ്പോഴത്തെ വികലമായ എന്‍‌കോഡിംഗ് മൂലം അതു നന്നായി ഭവിക്കുന്നു. എന്നാല്‍ സ്വപ്നം/സ്വപ്‌നം തുടങ്ങിയവയില്‍ അതു് ആവശ്യത്തിനു ഫലങ്ങള്‍ തരുന്നുമില്ല.

ഗൂഗിളിനെ ന്യായീകരിക്കാനോ അവരുടെ പരസ്യത്തിനു വേണ്ടിയോ അല്ല ഇതെഴുതിയതു്. ജോയിനറുകള്‍ കളഞ്ഞു സേര്‍ച്ചു ചെയ്തതിനു് അവര്‍ക്കു് അതിന്റേതായ കാരണങ്ങള്‍ ഉണ്ടാവും എന്നു കാണിക്കാന്‍ ആണു്. ഇങ്ങനെ ജോയിനര്‍ വേണ്ടെന്നു വെയ്ക്കാന്‍ യൂണിക്കോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് എതിരുമല്ല.

പിന്നെ, ചില ആപ്ലിക്കേഷനുകള്‍ ജോയിനറുകളെ കണക്കാക്കാതെ ഇരുന്നേക്കാം എന്നു കാണിക്കാനായി മാത്രമായിരുന്നു ആ ഉദാഹരണം. ഗൂഗിളും വെബ് ദുനിയായും ജോയിനറുകളെ കണക്കാക്കുന്നില്ല എന്നും നാം കണ്ടു. യാഹുവും ലൈവ് സേര്‍ച്ചും ജോയിനര്‍ കളയുന്നില്ല. അവ കളയുന്നുണ്ടെന്നു ഞാന്‍ തെറ്റായി പറഞ്ഞതു് അവര്‍ അതു ഹൈലൈറ്റു ചെയ്യുന്നതിലെ അപാകത കൊണ്ടായിരുന്നു. (ചൂണ്ടിക്കാട്ടിയ റാല്‍‌മിനോവിനു നന്ദി.) ഈ പോസ്റ്റിന്റെ ഉദ്ദേശ്യം ഏതൊക്കെ ആപ്ലിക്കേഷനുകള്‍ എന്തൊക്കെ ചെയ്യുന്നു, ഏതിലൊക്കെ ബഗ്ഗുകളുണ്ടു് എന്നുള്ളതല്ല, മറിച്ചു് ജോയിനറുകളില്‍ മാത്രമുള്ള വ്യത്യാസം ഗണ്യമാകത്തക്ക വിധത്തില്‍ അവയെ ഉപയോഗിക്കാമോ എന്നതാണു്. നമുക്കു വിഷയത്തിലേക്കു വരാം.

വ്യാകരണം (Grammar)
സാങ്കേതികം (Technical)

Comments (100)

Permalink