സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും: Difference between revisions

From SMC Wiki
(താളിലെ എല്ലാവിവരങ്ങളും നീക്കം ചെയ്യുന്നു)
 
Line 1: Line 1:
==സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും==


സുറുമയ്ക്ക് മലയാളം എന്‍കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്‍കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്‍ഡേര്‍ഡില്‍ '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള്‍  കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന്‍ യൂണികോഡ് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്‍കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള്‍ (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില്‍ ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില്‍ വരുമ്പോള്‍ അവരും ഇത് പോലെ ചെയ്യാന്‍ നോക്കി പക്ഷേ പൂര്‍ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള്‍ പറ്റുന്നതെന്താണെന്ന് നോക്കാം.
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന്‍ പറ്റാതെ പോയ ഭാഗങ്ങള്‍. അവ എന്‍കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന്‍ ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള്‍ അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്‍ക്കുകയും ചെയ്യും. അപ്പോള്‍ ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള്‍ ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള്‍ യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള്‍ ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില്‍ ചെയ്തതെന്താണെന്ന് നോക്കാം.
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില്‍ വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്‍ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില്‍ ശരിയായി കാണണമെങ്കില്‍ ഈ മാറ്റങ്ങള്‍ അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില്‍ ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം [http://suruma.sarovar.org suruma.sarovar.org] ല്‍ വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്‍ത്തിയ്ക്കുന്ന രീതിയില്‍ അതേ സൈറ്റില്‍ ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില്‍ എളുപ്പത്തില്‍ മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള്‍ എല്ലാ ലിനക്സ് ചേര്‍ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്‍പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്‍കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്‍ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്‍ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്‍ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില്‍ ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്‍ക്കും ഇത് ശരിയാക്കാന്‍ മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്‍ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്‍ക്കുത്കണ്ഠയുള്ളൂ.
ക്യൂട്ടിയില്‍ ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില്‍ രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള്‍ ചേര്‍ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.

Latest revision as of 12:21, 1 February 2009

സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും

സുറുമയ്ക്ക് മലയാളം എന്‍കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്‍കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്‍ഡേര്‍ഡില്‍ '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള്‍ കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന്‍ യൂണികോഡ് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ

ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്‍കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള്‍ (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്‍കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില്‍ ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില്‍ വരുമ്പോള്‍ അവരും ഇത് പോലെ ചെയ്യാന്‍ നോക്കി പക്ഷേ പൂര്‍ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള്‍ പറ്റുന്നതെന്താണെന്ന് നോക്കാം.

ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന്‍ പറ്റാതെ പോയ ഭാഗങ്ങള്‍. അവ എന്‍കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന്‍ ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള്‍ അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്‍ക്കുകയും ചെയ്യും. അപ്പോള്‍ ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള്‍ ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള്‍ യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള്‍ ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില്‍ ചെയ്തതെന്താണെന്ന് നോക്കാം.

്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില്‍ വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്‍ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില്‍ ശരിയായി കാണണമെങ്കില്‍ ഈ മാറ്റങ്ങള്‍ അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില്‍ ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം suruma.sarovar.org ല്‍ വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്‍ത്തിയ്ക്കുന്ന രീതിയില്‍ അതേ സൈറ്റില്‍ ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില്‍ എളുപ്പത്തില്‍ മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള്‍ എല്ലാ ലിനക്സ് ചേര്‍ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്‍പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്‍കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്‍ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്‍ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്‍ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില്‍ ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്‍ക്കും ഇത് ശരിയാക്കാന്‍ മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്‍ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്‍ക്കുത്കണ്ഠയുള്ളൂ.

ക്യൂട്ടിയില്‍ ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില്‍ രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള്‍ ചേര്‍ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.