# Follows the Latin-Script Uyghur alphabet 2001-todate rules defined at ←http://ukij.org/html/ , https://en.wikipedia.org/wiki/Uyghur_Latin_alphabet, http://www.uyghurdictionary.org/excerpts/An%20Introduction%20to%20LSU.pdf # Rules are predicated on running NFD first, and NFC afterwards :: NFD (NFC) ; $lsuVowels = [aAeEoOuUöÖüÜéÉiI’'] ; $disambig = ̱ ; [:Separator:]* → ' '; $space = [:Separator:]*; ٫ ↔ ',' $disambig ; # ARABIC DECIMAL SEPARATOR ، ↔ ',' ; # ARABIC COMMA ؛ ↔ ';' ; # ARABIC SEMICOLON ؟ ↔ '?' ; # ARABIC QUESTION MARK › ↔ ‘ ; ‹ ↔ ’ ; ئ → ; # Uyghur Hamza ـ → ; # ARABIC/UYGHUR TATWEEL # special treatment for Uyghur hamza ئا ← $space { [aA] ; ئە ← $space { [eE] ; ئو ← $space { [oO] ; ئۇ ← $space { [uU] ; ئۆ ← $space { [öÖ] ; ئۈ ← $space { [üÜ] ; ئې ← $space { [éÉ] ; ئى ← $space { [iI] ; ئا ← $lsuVowels { [aA] ; ئە ← $lsuVowels { [eE] ; ئو ← $lsuVowels { [oO] ; ئۇ ← $lsuVowels { [uU] ; ئۆ ← $lsuVowels { [öÖ] ; ئۈ ← $lsuVowels { [üÜ] ; ئې ← $lsuVowels { [éÉ] ; ئى ← $lsuVowels { [iI] ; # special treatment for apostrof سھ ← s [’'] { h ; نغ ← n [’'] { gh ; نگ ← n [’'] { g ; ڭھ ← ng [’'] { h ; سھ ← S [’'] { H ; نغ ← N [’'] { GH ; نگ ← N [’'] { G ; ڭھ ← NG [’'] { H ; # special treatment for apostrof سھ → s''h ; نغ → n''gh ; نگ → n''g ; ڭھ → ng''h ; # disambiguation for ژ by covering the most common words with ژ دىرىژور ← dirijor ; رېژىسسور ← réjissor ; ژۇرنىلى ← jurnili ; چېرتيوژ ← chértyoj ; پۇرژىن ← purjin ; پېرسوناژ ← pérsonaj ; ماروژ ← maroj ; پارىژ ← parij ; ژۇرنال ← jurnal ; بۇژغۇن ← bujghun ; ۋولتاژ ← woltaj ; ئورانژې ← oranjé ; تاموژنا ← tamojna ; گاراژ ← garaj ; غۇژمەك ← ghujmek ; تىراژ ← tiraj ; ستاژ ← staj ; پروژېكتور ← projéktor ; 'گاژ-گۇژ' ← 'gaj-guj' ; 'پاژ-پۇژ' ← 'paj-puj' ; 'ۋاژ-ۋۇژ' ← 'waj-wuj' ; 'پىژ-پىژ' ← 'pij-pij' ; 'گىژ-گىژ' ← 'gij-gij' ; 'مىژ-مىژ' ← 'mij-mij' ; ژاندارم ← jandarm ; دىرىژور ← DIRIJOR ; رېژىسسور ← RÉJISSOR ; ژۇرنىلى ← JURNILI ; چېرتيوژ ← CHÉRTYOJ ; پۇرژىن ← PURJIN ; پېرسوناژ ← PÉRSONAJ ; ماروژ ← MAROJ ; پارىژ ← PARIJ ; ژۇرنال ← JURNAL ; بۇژغۇن ← BUJGHUN ; ۋولتاژ ← WOLTAJ ; ئورانژې ← ORANJÉ ; تاموژنا ← TAMOJNA ; گاراژ ← GARAJ ; غۇژمەك ← GHUJMEK ; تىراژ ← TIRAJ ; ستاژ ← STAJ ; پروژېكتور ← PROJÉKTOR ; 'گاژ-گۇژ' ← 'GAJ-GUJ' ; 'پاژ-پۇژ' ← 'PAJ-PUJ' ; 'ۋاژ-ۋۇژ' ← 'WAJ-WUJ' ; 'پىژ-پىژ' ← 'PIJ-PIJ' ; 'گىژ-گىژ' ← 'GIJ-GIJ' ; 'مىژ-مىژ' ← 'MIJ-MIJ' ; ژاندارم ← JANDARM ; # letters ا ↔ a ; ە ↔ e ; ب ↔ b ; پ ↔ p ; ت ↔ t ; ج ↔ j ; چ ↔ ch ; خ ↔ x ; د ↔ d ; ر ↔ r ; ز ↔ z ; ژ → j ; ش ↔ sh ; س ↔ s ; غ ↔ gh ; ف ↔ f ; ق ↔ q ; ك ↔ k ; ڭ ↔ ng ; گ ↔ g ; ل ↔ l ; م ↔ m ; ن ↔ n ; ھ ↔ h ; و ↔ o ; ۇ ↔ u ; ۆ ↔ ö ; ۈ ↔ ü ; ۋ ↔ w ; ې ↔ é ; ى ↔ i ; ي ↔ y ; ا ← A ; ە ← E ; ب ← B ; پ ← P ; ت ← T ; ج ← J ; چ ← CH ; چ ← Ch ; خ ← X ; د ← D ; ر ← R ; ز ← Z ; ش ← SH ; ش ← Sh ; س ← S ; غ ← GH ; غ ← Gh ; ف ← F ; ق ← Q ; ك ← K ; ڭ ← NG ; ڭ ← Ng ; گ ← G ; ل ← L ; م ← M ; ن ← N ; ھ ← H ; و ← O ; ۇ ← U ; ۆ ← Ö ; ۈ ← Ü ; ۋ ← W ; ې ← É ; ى ← I ; ي ← Y ; ::NFC (NFD) ;