diff options
author | Mike FABIAN <mfabian@redhat.com> | 2023-06-01 17:02:44 +0200 |
---|---|---|
committer | Mike FABIAN <mfabian@redhat.com> | 2023-09-21 10:34:35 +0200 |
commit | aceda10bd5131cf716830827d66da9c671dec649 (patch) | |
tree | 85fce5090f9abd310d3a9e0f0e9748d729f98ac8 /localedata/th_TH.UTF-8.in | |
parent | 672b91ba1060887aa8897d0b98af83b96d4a52b0 (diff) | |
download | glibc-aceda10bd5131cf716830827d66da9c671dec649.tar glibc-aceda10bd5131cf716830827d66da9c671dec649.tar.gz glibc-aceda10bd5131cf716830827d66da9c671dec649.tar.bz2 glibc-aceda10bd5131cf716830827d66da9c671dec649.zip |
Adapt collation in th_TH locale to use the iso14651_t1_common file and sync the collation with CLDR
I made it to agree as much as possible with the rules from CLDR (see:
https://github.com/unicode-org/cldr/blob/main/common/collation/th.xml).
It seems to be impossible to follow the CLDR rules
&[before 1]๚<ฯ # should be "variable"
and
&๛<ๆ # should be "variable"
exactly though. These ask for a primary difference in punctuation
characters whose primary weight should be "IGNORE". But using a
secondary differnence instead still sorts the test data correctly and
the previously used collation in th_TH used tertiary differences for
these characters.
There was old localedata/th_TH.in test data in TIS-620 encoding which
was not used (it was not in the localedata/Makefile). I converted this
to UTF-8 and moved it to localedata/th_TH.UTF-8.in and added it to
localedata/Makefile.
Using the existing collation rules in the th_TH locale did not sort that
test file completely correct, I think my new collation rules based on
iso14651_t1 are better.
Diffstat (limited to 'localedata/th_TH.UTF-8.in')
-rw-r--r-- | localedata/th_TH.UTF-8.in | 163 |
1 files changed, 163 insertions, 0 deletions
diff --git a/localedata/th_TH.UTF-8.in b/localedata/th_TH.UTF-8.in new file mode 100644 index 0000000000..06263dda34 --- /dev/null +++ b/localedata/th_TH.UTF-8.in @@ -0,0 +1,163 @@ +* +. +๎ +์ +ฯ +๚ +๛ +ๆ +0 +๐ +0000 +๐๐๐๐ +10 +๑๐ +9 +๙ +9999 +๙๙๙๙ +a +A +๎A +์a +ฯä +๚a +๛ä +ๆa +b +B +กก +กรรม +กรรม์ +กราบ +กะเกณฑ์ +กัก +ก้าว +กำ +กิน +กี่ +กึ๋น +กุน +กูด +เก้ง +เกล้า +เกลียว +เก้า +เกาะ +เกี่ยว +เกี๊ยะ +เกือก +แกง +แกะ +โกน +โกร๋น +ใกล้ +ไก่ +ไกล +ข้น +ขนาบ +ขาง +ข่าง +ข้าง +ข้างๆ +ข้างกระดาน +ข้างขึ้น +ข้างควาย +ข้างๆ คูๆ +ข้างเงิน +ข้างแรม +ข้างออก +เข็ด +เขน +เข็น +เข่น +แข็ง +แข่ง +แข้ง +แข้งขวา +แข็งขัน +แข่งขัน +แขน +แขวะ +ฃวด +ครรภ- +ครรภ์ +ฅอ +งาม +จุมพล +จุํพล +ฉาก +ชาย +ซาบ +ญาณ +ฎีกา +ฐาน +ฑาหะ +เฒ่า +เณร +ดนตรี +ตลาด +ถนน +ทูลเกล้า +ทูลเกล้าฯ +ทูลเกล้าทูลกระหม่อม +ธนาคาร +น้า +น้ำ +นี้ +บุญญา +บุญหลง +ปา +ป่า +ป้า +ป๊า +ป๋า +ปาน +ป่าน +ป้าน +แป้ง +ผัด +ฝา +ฯพณฯ +พณิชย์ +ฟาง +ภาษี +ม้า +ย่อง +รอง +ฤทธิ์ +ฤษี +ฤๅษี +ลลิตา +ฦๅชา +วก +ศาล +ษมา +สกุล +หริภุญชัย +หฤทัย +หลง +แหง่ +แห่ง +แหนม +แหนหวง +แหบ +แหม +อาน +ฮา +ไฮโล +ํ +ํä +ะ +ะa +า +ๅ +ๅํ +ํๅ +ๅa +าä +าํ +ํา +ำ +ไ +ฺ |