# Follows the Latin-Script Uyghur alphabet 2001-todate rules defined at ←http://ukij.org/html/ , https://en.wikipedia.org/wiki/Uyghur_Latin_alphabet, http://www.uyghurdictionary.org/excerpts/An%20Introduction%20to%20LSU.pdf
# Rules are predicated on running NFD first, and NFC afterwards
:: NFD (NFC) ;
$lsuVowels = [aAeEoOuUöÖüÜéÉiI’'] ;
$disambig = ̱ ;
[:Separator:]* → ' ';
$space = [:Separator:]*;
٫ ↔ ',' $disambig ; # ARABIC DECIMAL SEPARATOR
، ↔ ',' ; # ARABIC COMMA
؛ ↔ ';' ; # ARABIC SEMICOLON
؟ ↔ '?' ; # ARABIC QUESTION MARK
› ↔ ‘ ;
‹ ↔ ’ ;
ئ → ; # Uyghur Hamza
ـ → ; # ARABIC/UYGHUR TATWEEL
# special treatment for Uyghur hamza
ئا ← $space { [aA] ;
ئە ← $space { [eE] ;
ئو ← $space { [oO] ;
ئۇ ← $space { [uU] ;
ئۆ ← $space { [öÖ] ;
ئۈ ← $space { [üÜ] ;
ئې ← $space { [éÉ] ;
ئى ← $space { [iI] ;
ئا ← $lsuVowels { [aA] ;
ئە ← $lsuVowels { [eE] ;
ئو ← $lsuVowels { [oO] ;
ئۇ ← $lsuVowels { [uU] ;
ئۆ ← $lsuVowels { [öÖ] ;
ئۈ ← $lsuVowels { [üÜ] ;
ئې ← $lsuVowels { [éÉ] ;
ئى ← $lsuVowels { [iI] ;
# special treatment for apostrof
سھ ← s [’'] { h ;
نغ ← n [’'] { gh ;
نگ ← n [’'] { g ;
ڭھ ← ng [’'] { h ;
سھ ← S [’'] { H ;
نغ ← N [’'] { GH ;
نگ ← N [’'] { G ;
ڭھ ← NG [’'] { H ;
# special treatment for apostrof
سھ → s''h ;
نغ → n''gh ;
نگ → n''g ;
ڭھ → ng''h ;
# disambiguation for ژ by covering the most common words with ژ
دىرىژور ← dirijor ;
رېژىسسور ← réjissor ;
ژۇرنىلى ← jurnili ;
چېرتيوژ ← chértyoj ;
پۇرژىن ← purjin ;
پېرسوناژ ← pérsonaj ;
ماروژ ← maroj ;
پارىژ ← parij ;
ژۇرنال ← jurnal ;
بۇژغۇن ← bujghun ;
ۋولتاژ ← woltaj ;
ئورانژې ← oranjé ;
تاموژنا ← tamojna ;
گاراژ ← garaj ;
غۇژمەك ← ghujmek ;
تىراژ ← tiraj ;
ستاژ ← staj ;
پروژېكتور ← projéktor ;
'گاژ-گۇژ' ← 'gaj-guj' ;
'پاژ-پۇژ' ← 'paj-puj' ;
'ۋاژ-ۋۇژ' ← 'waj-wuj' ;
'پىژ-پىژ' ← 'pij-pij' ;
'گىژ-گىژ' ← 'gij-gij' ;
'مىژ-مىژ' ← 'mij-mij' ;
ژاندارم ← jandarm ;
دىرىژور ← DIRIJOR ;
رېژىسسور ← RÉJISSOR ;
ژۇرنىلى ← JURNILI ;
چېرتيوژ ← CHÉRTYOJ ;
پۇرژىن ← PURJIN ;
پېرسوناژ ← PÉRSONAJ ;
ماروژ ← MAROJ ;
پارىژ ← PARIJ ;
ژۇرنال ← JURNAL ;
بۇژغۇن ← BUJGHUN ;
ۋولتاژ ← WOLTAJ ;
ئورانژې ← ORANJÉ ;
تاموژنا ← TAMOJNA ;
گاراژ ← GARAJ ;
غۇژمەك ← GHUJMEK ;
تىراژ ← TIRAJ ;
ستاژ ← STAJ ;
پروژېكتور ← PROJÉKTOR ;
'گاژ-گۇژ' ← 'GAJ-GUJ' ;
'پاژ-پۇژ' ← 'PAJ-PUJ' ;
'ۋاژ-ۋۇژ' ← 'WAJ-WUJ' ;
'پىژ-پىژ' ← 'PIJ-PIJ' ;
'گىژ-گىژ' ← 'GIJ-GIJ' ;
'مىژ-مىژ' ← 'MIJ-MIJ' ;
ژاندارم ← JANDARM ;
# letters
ا ↔ a ;
ە ↔ e ;
ب ↔ b ;
پ ↔ p ;
ت ↔ t ;
ج ↔ j ;
چ ↔ ch ;
خ ↔ x ;
د ↔ d ;
ر ↔ r ;
ز ↔ z ;
ژ → j ;
ش ↔ sh ;
س ↔ s ;
غ ↔ gh ;
ف ↔ f ;
ق ↔ q ;
ك ↔ k ;
ڭ ↔ ng ;
گ ↔ g ;
ل ↔ l ;
م ↔ m ;
ن ↔ n ;
ھ ↔ h ;
و ↔ o ;
ۇ ↔ u ;
ۆ ↔ ö ;
ۈ ↔ ü ;
ۋ ↔ w ;
ې ↔ é ;
ى ↔ i ;
ي ↔ y ;
ا ← A ;
ە ← E ;
ب ← B ;
پ ← P ;
ت ← T ;
ج ← J ;
چ ← CH ;
چ ← Ch ;
خ ← X ;
د ← D ;
ر ← R ;
ز ← Z ;
ش ← SH ;
ش ← Sh ;
س ← S ;
غ ← GH ;
غ ← Gh ;
ف ← F ;
ق ← Q ;
ك ← K ;
ڭ ← NG ;
ڭ ← Ng ;
گ ← G ;
ل ← L ;
م ← M ;
ن ← N ;
ھ ← H ;
و ← O ;
ۇ ← U ;
ۆ ← Ö ;
ۈ ← Ü ;
ۋ ← W ;
ې ← É ;
ى ← I ;
ي ← Y ;
::NFC (NFD) ;