1 files changed, 8 insertions, 183 deletions
diff --git a/payyans/payyans/payyans b/payyans/payyans/payyans
index 378ceab..5b7d00d 100755
--- a/payyans/payyans/payyans
+++ b/payyans/payyans/payyans
@@ -21,18 +21,10 @@
 # If you find any bugs or have any suggestions email: santhosh.thottingal@gmail.com
 # URL: http://www.smc.org.in
 
-'''
-പയ്യന്‍ ആളു തരികിടയാകുന്നു. ആസ്കി വേറൊരു തരികിടയും.
-തരികിടയെ തരികിടകൊണ്ടു നേരിടുന്നതാണു് ബുദ്ധി.
-അമേരിക്കാ-ഇറാഖ് യുദ്ധം താഴെപ്പറയും വിധമാകുന്നു.
-'''
-
-'''ആവശ്യത്തിനുള്ള കോപ്പുകള്‍ കൂട്ടുക '''
-import sys #കുന്തം
-import codecs #കൊടച്ചക്രം
-import os #ശീലക്കുട
-from optparse import OptionParser #മുറുക്കാന്‍ചെല്ലം
 
+from payyans import Payyans
+from optparse import OptionParser
+import sys,os
 def error_exit():
 	print '''
 	Payyans Malayalam Ascii <--> Unicode Converter Version 0.3
@@ -50,7 +42,6 @@ class Payyan:
 		parser.add_option("-o", "--output-file", dest="output_filename",   help="the output file name")
 		parser.add_option("-d", "--direction", dest="direction", help="'a2u': Ascii to Unicode, 'u2a': Unicode to Ascii")		
 		parser.add_option("-m", "--mapping-file", dest="mapping_filename", help="the ascii to unicode mapping file name")
-		parser.add_option("-p", "--pdf-file", action="store_true",  dest="pdf", help="use this option if the input is a pdf file")
 		parser.add_option("-v", "--version", action="store_true",  dest="version", help="print the version of this program")
 		(options, args) = parser.parse_args()
 		'''നീ ആരാകുന്നു?'''
@@ -70,179 +61,13 @@ class Payyan:
 			'''വഴി പറയൂ സഖാവേ'''
 			print "\tInvalid direction"
 			error_exit()
-		self.options = options
-		self.rulesDict = self.LoadRules()
-		if self.options.direction == 'a2u':		
-			self.Ascii2Uni()
+		p=Payyans(options.input_filename ,options.output_filename, options.mapping_filename)
+		p.ascii2unicode()
+		if options.direction == 'a2u':		
+			p.ascii2unicode()
 		else:
-			self.Uni2Ascii()
-		
-	def Uni2Ascii(self):
-		'''പണിതുടങ്ങട്ടെ'''
-		if self.options.input_filename :
-			uni_file = codecs.open(self.options.input_filename, encoding = 'utf-8', errors = 'ignore')
-		else :
-			uni_file = codecs.open(sys.stdin, encoding = 'utf-8', errors = 'ignore')			
-		text = ""
-		if self.options.output_filename :
-			output_file = codecs.open(self.options.output_filename, encoding = 'utf-8', errors = 'ignore',  mode='w+')			
-		while 1:
-   			text =uni_file.readline()
-			if text == "":
-				break
-			index = 0
-			ascii_text = ""
-			prebase_letter=""
-			while index < len(text):
-				'''കൂട്ടക്ഷരങ്ങള്‍ക്കൊരു കുറുക്കുവഴി'''
-				for charNo in [3,2,1]:
-					letter = text[index:index+charNo]
-					if letter in self.rulesDict:
-						ascii_letter = self.rulesDict[letter]
-						letter = letter.encode('utf8')
-						'''കിട്ടിയ അക്ഷരങ്ങളുടെ അപ്പുറത്തും ഇപ്പുറത്തും സ്വരചിഹ്നങ്ങള്‍ ഫിറ്റ് ചെയ്യാനുള്ള ബദ്ധപ്പാട്'''
-						if letter == 'ൈ':	# പിറകില്‍ രണ്ടു സാധനം പിടിപ്പിക്കുക
-							ascii_text = ascii_text[:-1] + ascii_letter*2 + ascii_text[-1:]
-						elif (letter == 'ോ') | (letter == 'ൊ') | (letter == 'ൌ'):		#മുമ്പിലൊന്നും പിറകിലൊന്നും
-							ascii_text = ascii_text[:-1] + ascii_letter[0] + ascii_text[-1:] + ascii_letter[1]
-						elif (letter == 'െ') | (letter == 'േ') |(letter == '്ര'):		#പിറകിലൊന്നുമാത്രം
-							ascii_text = ascii_text[:-1] + ascii_letter + ascii_text[-1:]
-						else:
-							ascii_text = ascii_text + ascii_letter						
-						index = index+charNo
-						break
-				else:
-					'''നോക്കിയിട്ടു കിട്ടുന്നില്ല ബായി'''				
-					ascii_letter = letter
-					ascii_text = ascii_text + ascii_letter
-					index = index + 1
-									
-			if self.options.output_filename :
-				output_file.write(ascii_text)
-			else:
-				print ascii_text.encode('utf-8')
-		return "പയ്യന്‍ നല്ലോരു യൂണിക്കോട് ഫയലില്‍ കേറി നെരങ്ങി ആസ്ക്കിയാക്കി. ദൈവമേ, ഈ പയ്യനു നല്ലബുദ്ധി തോന്നിക്കണേ..."
-	
-	def Ascii2Uni(self):	
-		if self.options.pdf :
-			command = "pdftotext '" + self.options.input_filename +"'"
-			process = os.popen(command, 'r')
-			status = process.close()
-			if status:
-				print "The input file is a PDF file. To convert this the  pdftotext  utility is required. "
-				print "This feature is available only for GNU/Linux Operating system."
-				'''ഊഹും. കൊന്നാലും ഇനി മുന്നോട്ടില്ല. മുന്നില്‍ മറ്റവനാകുന്നു. ഏതു്? '''
-				sys.exit(1)
-			else:
-				self.options.input_filename =  self.options.input_filename.split(".") [0]+ ".txt"
-		if self.options.input_filename :
-			ascii_file = codecs.open(self.options.input_filename, encoding = 'utf-8', errors = 'ignore')
-		else :
-			ascii_file = codecs.open(sys.stdin, encoding = 'utf-8', errors = 'ignore')			
-		
-		text = ""
-		if self.options.output_filename :
-			output_file = codecs.open(self.options.output_filename, encoding = 'utf-8', errors = 'ignore',  mode='w+')			
-	
-		'''സത്യമുള്ളടത്തോളം... അതുകൊണ്ടു തന്നെ ടെര്‍മിനേഷന്‍ ഉറപ്പു്'''	
-		while 1:
-   			text =ascii_file.readline()
-			if text == "":
-				break
-			index = 0
-			unicode_text = ""
-			prebase_letter=""
-			while index < len(text):
-				letter = text[index]
-				if letter in self.rulesDict:
-					unicode_letter = self.rulesDict[letter]
-				else:
-					unicode_letter = letter	
-				if(self.isPrebase(unicode_letter))	:
-					prebase_letter = unicode_letter 
-				else:
-					if  ((unicode_letter.encode('utf-8') == "എ") | ( unicode_letter.encode('utf-8') == "ഒ" )):
-						unicode_text = unicode_text +  self.getVowelSign(prebase_letter , unicode_letter)
-					else:
-						unicode_text = unicode_text + unicode_letter+ prebase_letter
-					prebase_letter=""	
-
-				index = index + 1 
-			if self.options.output_filename :
-				output_file.write(unicode_text)
-			else:
-				print unicode_text.encode('utf-8')
-
-		return "പയ്യന്റെ അവതാരോദ്ദേശ്യം പൂര്‍ണ്ണമായിരിക്കുന്നു. ഇനി മടക്കം. റിട്ടേണ്‍...!"
-
-	def getVowelSign(self, vowel_letter, vowel_sign_letter):
-		vowel=  vowel_letter.encode('utf-8')
-		vowel_sign=  vowel_sign_letter.encode('utf-8')
-		if vowel == "എ":
-			if vowel_sign == "െ":
-				return "ഐ"
-		if vowel == "ഒ":
-			if vowel_sign == "ാ":
-				return "ഓ"
-			if vowel_sign =="ൗ":
-				return "ഔ"
-		return (vowel_letter+ vowel_sign_letter)
-
-	def isPrebase(self, letter):
-		 '''
-		 ഇതെന്തിനാന്നു ചോദിച്ചാ, ഈ അക്ഷരങ്ങളുടെ ഇടതു വശത്തെഴുതുന്ന സ്വര ചിഹ്നങ്ങളുണ്ടല്ലോ?
-		 അവ ആസ്കി തരികിടയില്‍ എഴുതുന്നതു് ഇടതു വശത്തു തന്നെയാ. യൂണിക്കോഡില്‍ അക്ഷരത്തിനു ശേഷവും
-		 അപ്പൊ ആ വക സംഭവങ്ങളെ തിരിച്ചറിയാനാണു് ഈ സംഭവം.
-		 "തരികിട തരികിടോ ധീംതരികിട" (തരികിട തരികിടയാല്‍)  എന്നു പയ്യന്റെ ഗുരു പയ്യഗുരു പയ്യെ മൊഴിഞ്ഞിട്ടുണ്ടു്. 
-		 '''
-		 unicode_letter = letter.encode('utf-8')
-		 if(   ( unicode_letter == "േ"  ) | (   unicode_letter ==  "ൈ" ) |   ( unicode_letter ==  "ൊ" ) 	| ( unicode_letter ==  "ോ"  ) |  ( unicode_letter == "ൌ"  )
-		 			|  ( unicode_letter == "്ര"  )  |  ( unicode_letter == "െ"  ) 
-		 			 ):
-			return "ഇതു സത്യം... അ...സത്യം.... അസത്യം...!"
-						
-					
-	def LoadRules(self):	
-		'''
-		ഈ സംഭവമാണു് മാപ്പിങ്ങ് ഫയല്‍ എടുത്തു് വായിച്ചു പഠിക്കുന്നതു്.
-		'''
-		rules_dict = dict()
-		line = []
-		line_number = 0
-		rules_file = codecs. open(self.options.mapping_filename,encoding='utf-8', errors='ignore')
-		while 1:
-			''' ലൈന്‍ നമ്പര്‍ , മാപ്പിങ്ങ് ഫയലില്‍ തെറ്റുണ്ടെങ്കില്‍ പറയാന്‍ ആവശ്യാണു് '''
-			line_number = line_number +1 
-   			text = unicode( rules_file.readline())
-			if text == "":
-			      break
-			'''കമന്റടിച്ചേ മത്യാവൂന്നു വെച്ചാ ആവാം. ഒട്ടും മുഷിയില്ല്യ'''      
-			if text[0] == '#': 
-			      continue 
-			      ''' കമന്റടി പതിവുപോലെ മൈന്റ് ചെയ്യണ്ട ഒന്നും കണ്ടില്യാ കേട്ടില്യാന്നു വെച്ചു നടന്നോളൂ(മനസ്സില്‍ ചിരിച്ചോളൂ) ''' 
-			line = text.strip()
-			if(line == ""):
-				  continue 
-				  '''ലൈനൊന്നും ല്യാ, മോശം.. ങും പോട്ടെ. വേറെ ലൈന്‍ പിടിക്കാം'''
-			if(len(line.split("=")) != 2):
-					'''എന്തോ പ്രശ്നണ്ടു്. ന്നാ അതങ്ങടു തുറന്നു പറഞ്ഞേക്കാം'''
-					print "Error: Syntax Error in the Ascii to Unicode Map in line number ",  line_number
-				  	print "Line: "+ text
-				  	'''പരിപാടി നിര്‍ത്താം '''
-				  	sys.exit(2) 
-			'''ഇടതന്‍'''				  	
-	 		lhs = line.split("=") [ 0 ]  
-	 		'''വലതന്‍'''
-	 		rhs = line.split("=") [ 1 ]  
-	 		'''ഇതിനിടക്കിനി മൂന്നാമനു സ്കോപ്പിണ്ടോ? '''
-	 		'''മറക്കാതെ ഇരിക്കട്ടെ. ആവശ്യം വരും '''
-			if self.options.direction == 'a2u':
-				rules_dict[lhs]=rhs
-			else:
-				rules_dict[rhs]=lhs
-		return rules_dict
+			p.unicode2ascii()
 	
-
 if __name__ == "__main__":
 	'''ഒരു പയ്യന്‍ അവതരിക്കുന്നു. '''
 	rule= Payyan()