സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും: Difference between revisions
(താളിലെ എല്ലാവിവരങ്ങളും നീക്കം ചെയ്യുന്നു) |
|||
Line 1: | Line 1: | ||
==സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും== | |||
സുറുമയ്ക്ക് മലയാളം എന്കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്ഡേര്ഡില് '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള് കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന് യൂണികോഡ് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ | |||
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള് (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില് ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില് വരുമ്പോള് അവരും ഇത് പോലെ ചെയ്യാന് നോക്കി പക്ഷേ പൂര്ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള് പറ്റുന്നതെന്താണെന്ന് നോക്കാം. | |||
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന് പറ്റാതെ പോയ ഭാഗങ്ങള്. അവ എന്കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന് ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള് അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യും. അപ്പോള് ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള് ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള് യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള് ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില് ചെയ്തതെന്താണെന്ന് നോക്കാം. | |||
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില് വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില് ശരിയായി കാണണമെങ്കില് ഈ മാറ്റങ്ങള് അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില് ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം [http://suruma.sarovar.org suruma.sarovar.org] ല് വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്ത്തിയ്ക്കുന്ന രീതിയില് അതേ സൈറ്റില് ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില് എളുപ്പത്തില് മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള് എല്ലാ ലിനക്സ് ചേര്ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില് ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്ക്കും ഇത് ശരിയാക്കാന് മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്ക്കുത്കണ്ഠയുള്ളൂ. | |||
ക്യൂട്ടിയില് ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില് രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്. |
Latest revision as of 12:21, 1 February 2009
സുറുമയിട്ട പാംഗോയും ചില സംശയങ്ങളും
സുറുമയ്ക്ക് മലയാളം എന്കോഡിങ്ങുമായി യാതൊരു ബന്ധവുമില്ല. സുറുമ പാംഗോ ചിത്രീകരണ എഞ്ചിനിലാണ് മാറ്റം വരുത്തുന്നത്. നേരത്തെ എന്കോഡ് ചെയ്ത ടെക്സ്റ്റ് ചിത്രീകരിയ്ക്കുക എന്നത് മാത്രമാണ് പാംഗോ ചെയ്യുന്നത്. സുറുമയിട്ടാലും ഇല്ലെങ്കിലും ടെക്സ്റ്റ് എന്കോഡിങ്ങിലൊരു മാറ്റവുമുണ്ടാകില്ല. മൈക്രോസോഫ്റ്റിന്റെ അക്ഷരരൂപ സ്റ്റാന്ഡേര്ഡില് '്യ, ്ര, ്വ' എന്നിവ വ്യഞ്ജനാക്ഷരങ്ങളോട് ചേരുമ്പോള് കിട്ടുന്ന കൂട്ടക്ഷരങ്ങളെ അക്ഷരരൂപത്തിനകത്ത് തെറ്റായി സൂക്ഷിയ്ക്കുകയും, ചിത്രീകരണ എഞ്ചിന് യൂണികോഡ് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരൂപത്തിനനുസൃതമായി മാറ്റുകയും ചെയ്യുമ്പോഴാണ് ശരിയായ ചിത്രീകരണം കിട്ടുന്നത്. ഇത് മനസ്സിലാക്കാനായി ലളിതമായ ഒരു ഉദാഹരണം എടുക്കാം - ക്യ
ക്യ എന്നത് ടൈപ് ചെയ്യുന്നതും സൂക്ഷിയ്ക്കുന്നതും ക+്+യ എന്നായിട്ടാണ്. ഇനി മൈക്രോസോഫ്റ്റ് പിന്തുടരുന്ന രീതി നോക്കാം. അക്ഷരരൂപത്തിനകത്ത് ഇത് ക+യ+് (ചന്ദ്രക്കലയുടെ സ്ഥാനം മാറ്റിയത് ശ്രദ്ധിയ്ക്കുക) എന്നായിട്ടാണ് സൂക്ഷിയ്ക്കുന്നത് (ശരിയ്ക്കും യ+് എന്നത് ്യ എന്ന ചിഹ്നമാണെന്ന് മാത്രമാണ് അക്ഷരരൂപത്തിനകത്ത് നല്കുന്ന വിവരം). ഇനി ചിത്രീകരണ എഞ്ചിനുകള് (മൈക്രോസോഫ്റ്റ് ചിത്രീകരണ എഞ്ചിനായ യൂണിസ്ക്രൈബ് തുടങ്ങി വച്ച ഈ രീതി മറ്റുള്ളവയും പിന്തുടരുന്നു) ക+്+യ എന്ന് എന്കോഡ് ചെയ്ത ടെക്സ്റ്റിനെ അക്ഷരരൂപത്തിനനുസൃതമായി ക+യ+് എന്നായി മാറ്റുന്നു. ഇത് യൂണിസ്ക്രൈബില് ശരിയ്ക്കും ചെയ്തിട്ടുണ്ട്. ഇനി പാംഗോയില് വരുമ്പോള് അവരും ഇത് പോലെ ചെയ്യാന് നോക്കി പക്ഷേ പൂര്ണ്ണമായും ശരിയായില്ല. പാംഗോയ്ക്ക് പിഴച്ചതെവിടെയാണെന്ന് നോക്കാം. മുഖ്യമന്ത്രി, ഉപയോഗശൂന്യമാണ് (കോമ ശ്രദ്ധിയ്ക്കുക :-) ) എന്നിവ ചിത്രീകരിയ്ക്കുമ്പോള് പറ്റുന്നതെന്താണെന്ന് നോക്കാം.
ഖ്യമ, ന്യമ എന്നിവയാണതിലെ പാഗോയ്ക്ക് ശരിയാക്കാന് പറ്റാതെ പോയ ഭാഗങ്ങള്. അവ എന്കോഡ് ചെയ്യുന്നത് ഖ+്+യ+മ ന+്+യ+മ എന്നായിട്ടാണ്. ഖ+യ+് ന+യ+് എന്നിങ്ങനെയാണ്. ഇനി അക്ഷരരൂപത്തിനനുസൃതമാക്കുന്നത് പാംഗോയുടെ ജോലിയാണ്, അവന് ആ ചന്ദ്രക്കല വലത്താട്ടൊന്ന് നീക്കും. ഇപ്പോള് അത് ഖ+യ+്+മ ന+യ+്+മ എന്നാകുകയും അക്ഷരരൂപത്തിനകത്ത് നിന്നും യ+് എന്നതിന് പകരം ്യ എന്ന് കൂട്ടിച്ചേര്ക്കുകയും ചെയ്യും. അപ്പോള് ഖ്യമ ന്യമ എന്നിവ കിട്ടിയില്ലേ എന്ന് നിങ്ങള് ചോദിയ്ക്കും. പാഗോ ഒന്നുകൂടി നോക്കുമ്പോള് യ+്+മ എന്നതിന് യ്മ എന്ന കൂട്ടക്ഷരമുള്ളതായി കാണുന്നു. അപ്പോള് ഇതിന്റെ അവസാന ഫലം മുഖയ്മന്ത്രി, ഉപയോഗശൂനയ്മാണ് എന്നിങ്ങനെയാകും. ഇനി സുരേഷ് സുറുമയില് ചെയ്തതെന്താണെന്ന് നോക്കാം.
്യ എന്നത് ്+യ എന്ന് തന്നെ അക്ഷരരൂപത്തില് വയ്ക്കുകയും ചന്ദ്രക്കല നീക്കുന്ന സര്ക്കസ് ഒഴിവാക്കുകയും ചെയ്തു. സുറുമയിട്ട പാംഗോയില് ശരിയായി കാണണമെങ്കില് ഈ മാറ്റങ്ങള് അക്ഷരരൂപങ്ങളിലും വരുത്തണമെന്നാണ്. സുരേഷ് തന്നെ സുറുമ എന്ന പേരില് ഈ രീതിയിലുള്ള ഒരു അക്ഷരരൂപം suruma.sarovar.org ല് വച്ചിട്ടുണ്ട് രചന, ഫ്രീസെരിഫ് തുടങ്ങിയ അക്ഷരരൂപങ്ങളും സുറുമയിട്ട പാംഗോയോടൊത്ത് പ്രവര്ത്തിയ്ക്കുന്ന രീതിയില് അതേ സൈറ്റില് ലഭ്യമാണ്. എല്ലാ സ്വതന്ത്ര അക്ഷരരൂപങ്ങളും ഈ രീതിയില് എളുപ്പത്തില് മാറ്റാവുന്നതാണ് (ഇങ്ങനെ മാറ്റം വരുത്തുന്ന അക്ഷരങ്ങള് എല്ലാ ലിനക്സ് ചേര്ത്ത ഗ്നു വിതരണങ്ങളിലും ഉള്പ്പെടുത്താവുന്നതും സഹജമായ വിലയായി നല്കാവുന്നതുമാണ്). ഇതിനെതിരായുയര്ത്തുന്നൊരു വാദം സ്വതന്ത്രമല്ലാത്ത അക്ഷരരൂപങ്ങളെങ്ങനെ പ്രവര്ത്തിയ്ക്കുമെന്നതാണ്. ഇങ്ങനെ തന്നെയേ ഇത് ശരിയാക്കാവൂ എന്ന് ഞങ്ങള്ക്ക് വാശിയൊന്നുമില്ല. ഈ രീതിയില് ശരിയാക്കണമെന്ന് താത്പര്യമുള്ള ആര്ക്കും ഇത് ശരിയാക്കാന് മുന്നോട്ട് വരാം. മലയാളത്തിലെ ചിത്രീകരണ പ്രശ്നങ്ങളെങ്ങനെ പൂര്ണ്ണമായും പരിഹരിയ്ക്കാമെന്നു മാത്രമേ ഞങ്ങള്ക്കുത്കണ്ഠയുള്ളൂ.
ക്യൂട്ടിയില് ഈ പ്രശ്നമില്ലാത്തതിന് കാരണം അതില് രണ്ടിലധികം അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന കൂട്ടക്ഷരങ്ങളെ പിന്തുണയ്ക്കുന്നില്ല എന്നതിനാലാണ്.