diff options
author | Praveen Arimbrathodiyil <pravi.a@gmail.com> | 2013-06-15 21:58:04 +0530 |
---|---|---|
committer | Praveen Arimbrathodiyil <pravi.a@gmail.com> | 2013-06-15 21:58:04 +0530 |
commit | 6c994e42a2d8df2bff68e19e745121e3af620ac5 (patch) | |
tree | f5cef05bf403918ba2785a0b8e34e6e694732839 | |
parent | 1299d96d34e02d176a2c4b15067a06d6a5be4526 (diff) | |
download | logbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.tar.gz logbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.tar.xz logbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.zip |
some formatting fixes
-rw-r--r-- | jinesh-anivar.tex | 15 |
1 files changed, 10 insertions, 5 deletions
diff --git a/jinesh-anivar.tex b/jinesh-anivar.tex index acbf9f2..e56a324 100644 --- a/jinesh-anivar.tex +++ b/jinesh-anivar.tex @@ -63,9 +63,10 @@ since ministry said, they dont take any money from our account, they are like we 2008 ല് തന്നെയാണു് ഡെബായന് ബാനര്ജി എന്ന വിദ്യാര്ത്ഥി ടെസറാക്റ്റില് ഇന്ത്യന് ഭാഷകള്ക്കുള്ള പിന്തുണ കൊണ്ടുവരാനുള്ള ശ്രമങ്ങള് തുടങ്ങിവച്ചതു്. മലയാളം അടക്കമുള്ള സങ്കീര്ണ്ണ ലിപിവ്യവസ്ഥയുള്ള (complex script languages) ഇന്ത്യന് ഭാഷകള്ക്കുള്ള പിന്തുണയ്ക്കായി ടെസറാക്റ്റ്ഇന്ഡിക് എന്ന പ്രൊജക്റ്റ് ഡെബായന് ഡല്ഹിയിലെ 'സരൈ' എന്ന സംഘടനയുടെ ഫെല്ലോഷിപ്പോടെ നിര്മ്മിക്കുന്ന സമയമായിരുന്നു അതു്. IIITയിലെ മലയാളം ഒസിആര് പ്രൊജക്റ്റിന്റെ പ്രവര്ത്തിപരിചയം ഉപയോഗിച്ചു് ലഭ്യമായ സമയത്തു് ടെസറാക്റ്റിലെ മലയാള പിന്തുണ മെച്ചപ്പെടുത്താന് ശ്രമിച്ചുകൂടേ എന്നു് ഞാനാക്കാലയളവില് ജിനേഷിനോടു് തിരക്കുകയും അങ്ങനെ സ്വതന്ത്രമായ മലയാളം ഒസിആര് എന്ന സ്വപ്നം സാധിതപ്രായമാക്കാനുള്ള ശ്രമത്തില് പങ്കാളിയാകാമെന്നു് ജിനേഷ് ഏല്ക്കുകയും ചെയ്തു. 2009 മാര്ച്ച് ആദ്യവാരത്തില് ജിനേഷ് അതിലെ പുരോഗതിയെപ്പറ്റി സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ലിസ്റ്റില് എഴുതിയ കുറിപ്പ് ജിനേഷിന്റെ ബ്ലോഗ് പോസ്റ്റുകളില് My experiments with Tesseract എന്ന പേരില് കാണാം. -അതിനു പിന്നാലെ സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് വിക്കിയില് [http://wiki.smc.org.in/OCR] ടെസറാക്റ്റില് ഇനി ചെയ്യേണ്ട പ്രവര്ത്തനങ്ങളെപ്പറ്റി ജിനേഷ് ഇങ്ങനെ എഴുതി: - --- +അതിനു പിന്നാലെ സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് വിക്കിയില്\footnote{\url{http://wiki.smc.org.in/OCR}} ടെസറാക്റ്റില് ഇനി ചെയ്യേണ്ട പ്രവര്ത്തനങ്ങളെപ്പറ്റി ജിനേഷ് ഇങ്ങനെ എഴുതി: +\begin{center} +\line(1,0){20} +\end{center} ഇന്ന് ലഭ്യമായ സ്വതന്ത്ര ഓസിആര് സംവിധാനങ്ങളില്, എറ്റവും മികച്ചതാണ് ടെസ്സറാക്റ്റ്. ഇംഗ്ലീഷീനും മറ്റു ലാറ്റിന് ഭാഷകളിലും സുഗമമായി പ്രവര്ത്തിക്കുന്ന ടെസ്സറാക്റ്റ് യുണികോഡ് വളരെ നല്ല രീതിയില് പിന്തുണയ്ക്കുകയും ചെയ്യുന്നുണ്ട്. ടെസ്സറാക്റ്റിനു മുകളിലുള്ള പരീക്ഷണങ്ങളില് നമ്മള് പ്രധാനമായി ഉന്നം വയ്ക്കുന്നതിവയാണ്, @@ -83,8 +84,10 @@ since ministry said, they dont take any money from our account, they are like we \item എറര് സോഴ്സുകള് മനസ്സിലാക്കാന് വിവിധതരം പരീക്ഷണങ്ങള് തയ്യാറാക്കുകയും നടത്തുകയും ചെയ്യുക. \item ആവശ്യമെങ്കില് പുതിയ വര്ക്ക്ഫ്ലോയും മെത്തേഡുകളും ഉണ്ടാക്കുക. \end{itemize} ---- +\begin{center} +\line(1,0){20} +\end{center} ഇതോടൊപ്പം മലയാളം ടെക്സ്റ്റ് സ്കാന് ചെയ്യുമ്പോള് കിട്ടുന്ന മലയാളത്തിലെ പ്രീബേസ് പോസ്റ്റ്ബേസ് അക്ഷരങ്ങളുടെയും സ്വരചിഹ്നങ്ങളുടെയും പുനഃക്രമീകരണത്തിനായി ഒരു ചെറിയ പൈത്തണ് പ്രോഗ്രാമും ജിനേഷ് എഴുതി\footnote{\url{https://code.google.com/p/tesseractindic/downloads/detail?name=vowel_reordering.tar.gz&can=2&q=}}. ഇക്കാലത്തു് CVIT യിലെ ഡോക്യുമെന്റ് അനാലിസിസ് പ്രൊജക്റ്റില് വന്ന ഒഴിവില് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിലെ ആഷിക്കിനെ ജിനേഷ് വിളിക്കുകയും ആഷിക് അതില് ചേരുകയും ചെയ്തു. ഒപ്പം ഹൈദരാബാദില് നടക്കാറുള്ള \url{mukth.in} എന്ന സ്വതന്ത്രസോഫ്റ്റ്വെയര് കോണ്ഫറന്സിനു് IIIT വേദിയാക്കുന്നതിനുള്ള ആലോചനകളും പരിശ്രമങ്ങളും ഈ സമയത്തു് ജിനേഷ് സുഹൃത്തുക്കളോടൊപ്പം നടത്തിയിരുന്നു. സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങില് ജിനേഷ് ഒരു ഇടവേളയ്ക്കു ശേഷം വളരെ സജീവമായ സമയമായിരുന്നു അതു്. അക്കാദമിക് കോണ്ഫറന്സുകളില് സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങ് പങ്കെടുക്കേണ്ടതിന്റെ അനിവാര്യതയെപ്പറ്റിയും പേപ്പറുകള് ജേര്ണലുകളില് പ്രസിദ്ധപ്പെടുത്തേണ്ടതിനെപ്പറ്റിയും സാങ്കേതികപ്രവര്ത്തനങ്ങള്ക്കപ്പുറം അങ്ങനെ ഒരു അക്കാദമിക് മുഖം കൂടി സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിനുണ്ടാക്കേണ്ടതിനെപ്പറ്റിയും ജിനേഷ് ഓര്മ്മിപ്പിക്കുമായിരുന്നു. നിരവധി തിരക്കുകളുള്ള വ്യക്തികള് ജോലിക്കു ശേഷമുള്ള സമയം മലയാളം കമ്പ്യൂട്ടിങ്ങിനുപയോഗിക്കുന്നതു് സോഫ്റ്റ്വെയര് കോണ്ട്രിബ്യൂഷനുകള്ക്കുപയോഗിക്കണോ അതോ പേപ്പറെഴുതാന് ഉപയോഗിക്കണോ എന്ന ചര്ച്ച എവിടെയും എത്താറും ഉണ്ടായിരുന്നില്ല. വ്യക്തമായ സംഘടനാരൂപമുണ്ടായതിനുശേഷം മതി ആ ആലോചന എന്ന അഭിപ്രായമായിരുന്നു അതില് എന്റേതു്. അന്നുമുതലേ സംഘടനാ രജിസ്ട്രേഷന് എന്നതു് ജിനേഷ് ഇടയ്ക്കിടെ ഓര്മ്മപ്പെടുത്താനും തുടങ്ങി. Natural Language Processing (NLP) രംഗത്ത് സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങിന്റെ ശില്പ പ്രൊജക്റ്റിന്റെ നേട്ടങ്ങള് ഒരു പേപ്പറാക്കണമെന്നു് അവന് സ്ഥിരം പറയാറുണ്ടായിരുന്നു. @@ -223,5 +226,7 @@ bigger standing ground for anyone who is for software patenting. Regards\\ Jinesh K J \end{english} ---- +\begin{center} +\line(1,0){20} +\end{center} പിന്നീട് 2010 ഒക്റ്റോബറില് ജിനേഷ് എന്നെ വെല്ലൂര് അഡ്മിറ്റ് ചെയ്ത വിവരം പറയാനാണു് വിളിച്ചതു് . അതുകഴിഞ്ഞുള്ള പരിചയ ചരിത്രം സെബിന്റെ കുറിപ്പിലും മെയിലിങ്ങ് ലിസ്റ്റിലയച്ച എന്റെ കുറിപ്പിലും ഉണ്ടു്. ആ കാലത്തേക്കു കടക്കാന് മനസ്സ് സമ്മതിക്കുന്നില്ല. പക്ഷേ ഒരുകാര്യം പറയാതെ വയ്യ. ജിനേഷിന്റെ ഏറ്റവും അധികം സംഭാവനകള് കണ്ട കാലമായിരുന്നു അതു്. അതുവരെ ചെയ്തതിന്റെ എത്രയോ മടങ്ങ് സംഭാവനകളാണു് ഹോസ്പിറ്റല് ദിനങ്ങളില് ജിനേഷില് നിന്നുണ്ടായിരുന്നതു്. ഇതിനുമപ്പുറം ഫോര്ത്ത് എസ്റ്റേറ്റ് ക്രിട്ടിക് എന്ന മെയില് ഗ്രൂപിലെ ചര്ച്ചകളിലും ഹോസ്പിറ്റലിനുമുമ്പും ഹോസ്പിറ്റലിലുള്ളപ്പോഴും ജിനേഷ് വളരെ സജീവമായി പങ്കെടുത്തിരുന്നു. ആ കുറിപ്പുകളും ഈ പുസ്തകത്തിലുണ്ടു്. ഈ കുറിപ്പ് ഒരു അവസാനമില്ലാതെ ഒരു തുടര്ച്ചയും കാത്തു് ഇവിടെ ഇങ്ങനെ നിര്ത്തുകയാണു്. |