summaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
authorPraveen Arimbrathodiyil <pravi.a@gmail.com>2013-06-15 21:58:04 +0530
committerPraveen Arimbrathodiyil <pravi.a@gmail.com>2013-06-15 21:58:04 +0530
commit6c994e42a2d8df2bff68e19e745121e3af620ac5 (patch)
treef5cef05bf403918ba2785a0b8e34e6e694732839
parent1299d96d34e02d176a2c4b15067a06d6a5be4526 (diff)
downloadlogbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.tar.gz
logbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.tar.xz
logbook-of-an-observer-6c994e42a2d8df2bff68e19e745121e3af620ac5.zip
some formatting fixes
-rw-r--r--jinesh-anivar.tex15
1 files changed, 10 insertions, 5 deletions
diff --git a/jinesh-anivar.tex b/jinesh-anivar.tex
index acbf9f2..e56a324 100644
--- a/jinesh-anivar.tex
+++ b/jinesh-anivar.tex
@@ -63,9 +63,10 @@ since ministry said, they dont take any money from our account, they are like we
2008 ല്‍ തന്നെയാണു് ഡെബായന്‍ ബാനര്‍ജി എന്ന വിദ്യാര്‍ത്ഥി ടെസറാക്റ്റില്‍ ഇന്ത്യന്‍ ഭാഷകള്‍ക്കുള്ള പിന്തുണ കൊണ്ടുവരാനുള്ള ശ്രമങ്ങള്‍ തുടങ്ങിവച്ചതു്. മലയാളം അടക്കമുള്ള സങ്കീര്‍ണ്ണ ലിപിവ്യവസ്ഥയുള്ള (complex script languages) ഇന്ത്യന്‍ ഭാഷകള്‍ക്കുള്ള പിന്തുണയ്ക്കായി ടെസറാക്റ്റ്ഇന്‍ഡിക് എന്ന പ്രൊജക്റ്റ് ഡെബായന്‍ ഡല്‍ഹിയിലെ 'സരൈ' എന്ന സംഘടനയുടെ ഫെല്ലോഷിപ്പോടെ നിര്‍മ്മിക്കുന്ന സമയമായിരുന്നു അതു്. IIITയിലെ മലയാളം ഒസിആര്‍ പ്രൊജക്റ്റിന്റെ പ്രവര്‍ത്തിപരിചയം ഉപയോഗിച്ചു് ലഭ്യമായ സമയത്തു് ടെസറാക്റ്റിലെ മലയാള പിന്തുണ മെച്ചപ്പെടുത്താന്‍ ശ്രമിച്ചുകൂടേ എന്നു് ഞാനാക്കാലയളവില്‍ ജിനേഷിനോടു് തിരക്കുകയും അങ്ങനെ സ്വതന്ത്രമായ മലയാളം ഒസിആര്‍ എന്ന സ്വപ്നം സാധിതപ്രായമാക്കാനുള്ള ശ്രമത്തില്‍ പങ്കാളിയാകാമെന്നു് ജിനേഷ് ഏല്‍ക്കുകയും ചെയ്തു.
2009 മാര്‍ച്ച് ആദ്യവാരത്തില്‍ ജിനേഷ് അതിലെ പുരോഗതിയെപ്പറ്റി സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് ലിസ്റ്റില്‍ എഴുതിയ കുറിപ്പ് ജിനേഷിന്റെ ബ്ലോഗ് പോസ്റ്റുകളില്‍ My experiments with Tesseract എന്ന പേരില്‍ കാണാം.
-അതിനു പിന്നാലെ സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് വിക്കിയില്‍ [http://wiki.smc.org.in/OCR] ടെസറാക്റ്റില്‍ ഇനി ചെയ്യേണ്ട പ്രവര്‍ത്തനങ്ങളെപ്പറ്റി ജിനേഷ് ഇങ്ങനെ എഴുതി:
-
---
+അതിനു പിന്നാലെ സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങ് വിക്കിയില്‍\footnote{\url{http://wiki.smc.org.in/OCR}} ടെസറാക്റ്റില്‍ ഇനി ചെയ്യേണ്ട പ്രവര്‍ത്തനങ്ങളെപ്പറ്റി ജിനേഷ് ഇങ്ങനെ എഴുതി:
+\begin{center}
+\line(1,0){20}
+\end{center}
ഇന്ന് ലഭ്യമായ സ്വതന്ത്ര ഓസിആര്‍ സംവിധാനങ്ങളില്‍, എറ്റവും മികച്ചതാണ് ടെസ്സറാക്റ്റ്. ഇംഗ്ലീഷീനും മറ്റു ലാറ്റിന്‍ ഭാഷകളിലും സുഗമമായി പ്രവര്‍ത്തിക്കുന്ന ടെസ്സറാക്റ്റ് യുണികോഡ് വളരെ നല്ല രീതിയില്‍ പിന്തുണയ്ക്കുകയും ചെയ്യുന്നുണ്ട്.
ടെസ്സറാക്റ്റിനു മുകളിലുള്ള പരീക്ഷണങ്ങളില്‍ നമ്മള്‍ പ്രധാനമായി ഉന്നം വയ്ക്കുന്നതിവയാണ്,
@@ -83,8 +84,10 @@ since ministry said, they dont take any money from our account, they are like we
\item എറര്‍ സോഴ്സുകള്‍ മനസ്സിലാക്കാന്‍ വിവിധതരം പരീക്ഷണങ്ങള്‍ തയ്യാറാക്കുകയും നടത്തുകയും ചെയ്യുക.
\item ആവശ്യമെങ്കില്‍ പുതിയ വര്‍ക്ക്ഫ്ലോയും മെത്തേഡുകളും ഉണ്ടാക്കുക.
\end{itemize}
----
+\begin{center}
+\line(1,0){20}
+\end{center}
ഇതോടൊപ്പം മലയാളം ടെക്സ്റ്റ് സ്കാന്‍ ചെയ്യുമ്പോള്‍ കിട്ടുന്ന മലയാളത്തിലെ പ്രീബേസ് പോസ്റ്റ്ബേസ് അക്ഷരങ്ങളുടെയും സ്വരചിഹ്നങ്ങളുടെയും പുനഃക്രമീകരണത്തിനായി ഒരു ചെറിയ പൈത്തണ്‍ പ്രോഗ്രാമും ജിനേഷ് എഴുതി\footnote{\url{https://code.google.com/p/tesseractindic/downloads/detail?name=vowel_reordering.tar.gz&can=2&q=}}. ഇക്കാലത്തു് CVIT യിലെ ഡോക്യുമെന്റ് അനാലിസിസ് പ്രൊജക്റ്റില്‍ വന്ന ഒഴിവില്‍ സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിലെ ആഷിക്കിനെ ജിനേഷ് വിളിക്കുകയും ആഷിക്‍ അതില്‍ ചേരുകയും ചെയ്തു. ഒപ്പം ഹൈദരാബാദില്‍ നടക്കാറുള്ള \url{mukth.in} എന്ന സ്വതന്ത്രസോഫ്റ്റ്‌വെയര്‍‍ കോണ്‍ഫറന്‍സിനു് IIIT വേദിയാക്കുന്നതിനുള്ള ആലോചനകളും പരിശ്രമങ്ങളും ഈ സമയത്തു് ജിനേഷ് സുഹൃത്തുക്കളോടൊപ്പം നടത്തിയിരുന്നു.
സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങില്‍ ജിനേഷ് ഒരു ഇടവേളയ്ക്കു ശേഷം വളരെ സജീവമായ സമയമായിരുന്നു അതു്. അക്കാദമിക്‍ കോണ്‍ഫറന്‍സുകളില്‍ സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങ് പങ്കെടുക്കേണ്ടതിന്റെ അനിവാര്യതയെപ്പറ്റിയും പേപ്പറുകള്‍ ജേര്‍ണലുകളില്‍ പ്രസിദ്ധപ്പെടുത്തേണ്ടതിനെപ്പറ്റിയും സാങ്കേതികപ്രവര്‍ത്തനങ്ങള്‍ക്കപ്പുറം അങ്ങനെ ഒരു അക്കാദമിക് മുഖം കൂടി സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിനുണ്ടാക്കേണ്ടതിനെപ്പറ്റിയും ജിനേഷ് ഓര്‍മ്മിപ്പിക്കുമായിരുന്നു. നിരവധി തിരക്കുകളുള്ള വ്യക്തികള്‍ ജോലിക്കു ശേഷമുള്ള സമയം മലയാളം കമ്പ്യൂട്ടിങ്ങിനുപയോഗിക്കുന്നതു് സോഫ്റ്റ്‌വെയര്‍ കോണ്ട്രിബ്യൂഷനുകള്‍ക്കുപയോഗിക്കണോ അതോ പേപ്പറെഴുതാന്‍ ഉപയോഗിക്കണോ എന്ന ചര്‍ച്ച എവിടെയും എത്താറും ഉണ്ടായിരുന്നില്ല. വ്യക്തമായ സംഘടനാരൂപമുണ്ടായതിനുശേഷം മതി ആ ആലോചന എന്ന അഭിപ്രായമായിരുന്നു അതില്‍ എന്റേതു്. അന്നുമുതലേ സംഘടനാ രജിസ്ട്രേഷന്‍ എന്നതു് ജിനേഷ് ഇടയ്ക്കിടെ ഓര്‍മ്മപ്പെടുത്താനും തുടങ്ങി. Natural Language Processing (NLP) രംഗത്ത് സ്വതന്ത്രമലയാളംകമ്പ്യൂട്ടിങ്ങിന്റെ ശില്പ പ്രൊജക്റ്റിന്റെ നേട്ടങ്ങള്‍ ഒരു പേപ്പറാക്കണമെന്നു് അവന്‍ സ്ഥിരം പറയാറുണ്ടായിരുന്നു.
@@ -223,5 +226,7 @@ bigger standing ground for anyone who is for software patenting.
Regards\\
Jinesh K J
\end{english}
----
+\begin{center}
+\line(1,0){20}
+\end{center}
പിന്നീട് 2010 ഒക്റ്റോബറില്‍ ജിനേഷ് എന്നെ വെല്ലൂര് അഡ്മിറ്റ് ചെയ്ത വിവരം പറയാനാണു് വിളിച്ചതു് . അതുകഴിഞ്ഞുള്ള പരിചയ ചരിത്രം സെബിന്റെ കുറിപ്പിലും മെയിലിങ്ങ് ലിസ്റ്റിലയച്ച എന്റെ കുറിപ്പിലും ഉണ്ടു്. ആ കാലത്തേക്കു കടക്കാന്‍ മനസ്സ് സമ്മതിക്കുന്നില്ല. പക്ഷേ ഒരുകാര്യം പറയാതെ വയ്യ. ജിനേഷിന്റെ ഏറ്റവും അധികം സംഭാവനകള്‍ കണ്ട കാലമായിരുന്നു അതു്. അതുവരെ ചെയ്തതിന്റെ എത്രയോ മടങ്ങ് സംഭാവനകളാണു് ഹോസ്പിറ്റല്‍ ദിനങ്ങളില്‍ ജിനേഷില്‍ നിന്നുണ്ടായിരുന്നതു്. ഇതിനുമപ്പുറം ഫോര്‍ത്ത് എസ്റ്റേറ്റ് ക്രിട്ടിക്‍ എന്ന മെയില്‍ ഗ്രൂപിലെ ചര്‍ച്ചകളിലും ഹോസ്പിറ്റലിനുമുമ്പും ഹോസ്പിറ്റലിലുള്ളപ്പോഴും ജിനേഷ് വളരെ സജീവമായി പങ്കെടുത്തിരുന്നു. ആ കുറിപ്പുകളും ഈ പുസ്തകത്തിലുണ്ടു്. ഈ കുറിപ്പ് ഒരു അവസാനമില്ലാതെ ഒരു തുടര്‍ച്ചയും കാത്തു് ഇവിടെ ഇങ്ങനെ നിര്‍ത്തുകയാണു്.