You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

2093 lines
52 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

/*
* Copyright (C) 2013 The Android Open Source Project
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
// The 512 most frequently occuring characters for the zhCN language in a sample of the Internet.
// Ordered by codepoint, comment shows character and ranking by frequency
const uint16_t frequent_zhCN[] = {
0x4E00, // 一, #2
0x4E07, // 万, #306
0x4E09, // 三, #138
0x4E0A, // 上, #16
0x4E0B, // 下, #25
0x4E0D, // 不, #7
0x4E0E, // 与, #133
0x4E13, // 专, #151
0x4E16, // 世, #346
0x4E1A, // 业, #39
0x4E1C, // 东, #197
0x4E24, // 两, #376
0x4E2A, // 个, #23
0x4E2D, // 中, #4
0x4E3A, // 为, #31
0x4E3B, // 主, #95
0x4E3E, // 举, #418
0x4E48, // 么, #93
0x4E4B, // 之, #131
0x4E50, // 乐, #130
0x4E5F, // 也, #145
0x4E66, // 书, #283
0x4E70, // 买, #483
0x4E86, // 了, #13
0x4E8B, // 事, #168
0x4E8C, // 二, #218
0x4E8E, // 于, #64
0x4E94, // 五, #430
0x4E9A, // 亚, #468
0x4E9B, // 些, #366
0x4EA4, // 交, #243
0x4EA7, // 产, #86
0x4EAB, // 享, #345
0x4EAC, // 京, #206
0x4EBA, // 人, #3
0x4EC0, // 什, #287
0x4ECB, // 介, #478
0x4ECE, // 从, #381
0x4ED6, // 他, #129
0x4EE3, // 代, #241
0x4EE5, // 以, #51
0x4EEC, // 们, #83
0x4EF6, // 件, #141
0x4EF7, // 价, #140
0x4EFB, // 任, #383
0x4F01, // 企, #439
0x4F18, // 优, #374
0x4F1A, // 会, #29
0x4F20, // 传, #222
0x4F46, // 但, #451
0x4F4D, // 位, #208
0x4F53, // 体, #98
0x4F55, // 何, #339
0x4F5C, // 作, #44
0x4F60, // 你, #76
0x4F7F, // 使, #272
0x4F9B, // 供, #375
0x4FDD, // 保, #180
0x4FE1, // 信, #84
0x4FEE, // 修, #437
0x503C, // 值, #450
0x505A, // 做, #368
0x5065, // 健, #484
0x50CF, // 像, #487
0x513F, // 儿, #326
0x5143, // 元, #202
0x5148, // 先, #485
0x5149, // 光, #254
0x514B, // 克, #503
0x514D, // 免, #349
0x5165, // 入, #156
0x5168, // 全, #47
0x516C, // 公, #35
0x5171, // 共, #448
0x5173, // 关, #49
0x5176, // 其, #195
0x5177, // 具, #329
0x5185, // 内, #109
0x518C, // 册, #225
0x519B, // 军, #466
0x51FA, // 出, #53
0x51FB, // 击, #359
0x5206, // 分, #22
0x5217, // 列, #410
0x521B, // 创, #399
0x5229, // 利, #296
0x522B, // 别, #372
0x5230, // 到, #33
0x5236, // 制, #192
0x524D, // 前, #117
0x529B, // 力, #173
0x529E, // 办, #436
0x529F, // 功, #455
0x52A0, // 加, #97
0x52A1, // 务, #100
0x52A8, // 动, #46
0x52A9, // 助, #365
0x5305, // 包, #331
0x5316, // 化, #155
0x5317, // 北, #194
0x533A, // 区, #105
0x533B, // 医, #234
0x5341, // 十, #294
0x534E, // 华, #205
0x5355, // 单, #259
0x5357, // 南, #182
0x535A, // 博, #153
0x5361, // 卡, #332
0x539F, // 原, #271
0x53BB, // 去, #282
0x53C2, // 参, #500
0x53CA, // 及, #255
0x53CB, // 友, #186
0x53CD, // 反, #422
0x53D1, // 发, #15
0x53D7, // 受, #507
0x53D8, // 变, #395
0x53E3, // 口, #293
0x53EA, // 只, #340
0x53EF, // 可, #45
0x53F0, // 台, #267
0x53F7, // 号, #121
0x53F8, // 司, #150
0x5404, // 各, #491
0x5408, // 合, #115
0x540C, // 同, #189
0x540D, // 名, #127
0x540E, // 后, #75
0x5411, // 向, #459
0x5427, // 吧, #353
0x544A, // 告, #318
0x5458, // 员, #232
0x5468, // 周, #347
0x548C, // 和, #43
0x54C1, // 品, #36
0x5546, // 商, #148
0x5668, // 器, #228
0x56DB, // 四, #352
0x56DE, // 回, #38
0x56E0, // 因, #355
0x56E2, // 团, #412
0x56ED, // 园, #470
0x56FD, // 国, #12
0x56FE, // 图, #32
0x5728, // 在, #10
0x5730, // 地, #30
0x573A, // 场, #177
0x575B, // 坛, #364
0x578B, // 型, #274
0x57CE, // 城, #172
0x57FA, // 基, #315
0x58EB, // 士, #434
0x58F0, // 声, #397
0x5904, // 处, #416
0x5907, // 备, #270
0x590D, // 复, #122
0x5916, // 外, #190
0x591A, // 多, #40
0x5927, // 大, #8
0x5929, // 天, #52
0x592A, // 太, #456
0x5934, // 头, #258
0x5973, // 女, #65
0x597D, // 好, #62
0x5982, // 如, #135
0x5A31, // 娱, #452
0x5B50, // 子, #37
0x5B57, // 字, #285
0x5B66, // 学, #19
0x5B89, // 安, #144
0x5B8C, // 完, #469
0x5B9A, // 定, #179
0x5B9D, // 宝, #188
0x5B9E, // 实, #154
0x5BA2, // 客, #174
0x5BB6, // 家, #26
0x5BB9, // 容, #307
0x5BC6, // 密, #471
0x5BF9, // 对, #90
0x5BFC, // 导, #348
0x5C06, // 将, #265
0x5C0F, // 小, #28
0x5C11, // 少, #379
0x5C14, // 尔, #490
0x5C31, // 就, #101
0x5C55, // 展, #291
0x5C71, // 山, #239
0x5DDE, // 州, #227
0x5DE5, // 工, #73
0x5DF1, // 己, #480
0x5DF2, // 已, #310
0x5E02, // 市, #78
0x5E03, // 布, #350
0x5E08, // 师, #277
0x5E16, // 帖, #396
0x5E26, // 带, #449
0x5E2E, // 帮, #461
0x5E38, // 常, #319
0x5E73, // 平, #217
0x5E74, // 年, #20
0x5E76, // 并, #440
0x5E7F, // 广, #166
0x5E93, // 库, #446
0x5E94, // 应, #187
0x5E97, // 店, #320
0x5EA6, // 度, #114
0x5EB7, // 康, #499
0x5EFA, // 建, #211
0x5F00, // 开, #72
0x5F0F, // 式, #207
0x5F15, // 引, #495
0x5F20, // 张, #385
0x5F3A, // 强, #404
0x5F53, // 当, #233
0x5F55, // 录, #146
0x5F62, // 形, #494
0x5F69, // 彩, #356
0x5F71, // 影, #214
0x5F88, // 很, #300
0x5F97, // 得, #193
0x5FAE, // 微, #245
0x5FC3, // 心, #70
0x5FEB, // 快, #324
0x6001, // 态, #508
0x600E, // 怎, #370
0x6027, // 性, #99
0x603B, // 总, #398
0x606F, // 息, #176
0x60A8, // 您, #251
0x60C5, // 情, #87
0x60F3, // 想, #290
0x610F, // 意, #184
0x611F, // 感, #253
0x620F, // 戏, #237
0x6210, // 成, #71
0x6211, // 我, #11
0x6216, // 或, #321
0x6218, // 战, #369
0x6237, // 户, #215
0x623F, // 房, #236
0x6240, // 所, #147
0x624B, // 手, #55
0x624D, // 才, #407
0x6253, // 打, #281
0x6280, // 技, #203
0x6295, // 投, #408
0x62A4, // 护, #502
0x62A5, // 报, #113
0x62DB, // 招, #363
0x6301, // 持, #403
0x6307, // 指, #414
0x636E, // 据, #409
0x6392, // 排, #377
0x63A5, // 接, #266
0x63A8, // 推, #244
0x63D0, // 提, #181
0x641C, // 搜, #301
0x64AD, // 播, #401
0x652F, // 支, #400
0x6536, // 收, #158
0x653E, // 放, #317
0x653F, // 政, #380
0x6548, // 效, #496
0x6559, // 教, #170
0x6570, // 数, #136
0x6587, // 文, #21
0x6599, // 料, #295
0x65AF, // 斯, #473
0x65B0, // 新, #14
0x65B9, // 方, #68
0x65C5, // 旅, #457
0x65E0, // 无, #164
0x65E5, // 日, #50
0x65F6, // 时, #18
0x660E, // 明, #132
0x6613, // 易, #428
0x661F, // 星, #240
0x662F, // 是, #6
0x663E, // 显, #486
0x66F4, // 更, #103
0x6700, // 最, #61
0x6708, // 月, #80
0x6709, // 有, #5
0x670D, // 服, #94
0x671F, // 期, #139
0x672C, // 本, #56
0x672F, // 术, #216
0x673A, // 机, #27
0x6743, // 权, #250
0x6761, // 条, #309
0x6765, // 来, #42
0x677F, // 板, #505
0x6797, // 林, #475
0x679C, // 果, #212
0x67E5, // 查, #165
0x6807, // 标, #269
0x6821, // 校, #462
0x6837, // 样, #314
0x683C, // 格, #238
0x6848, // 案, #378
0x697C, // 楼, #342
0x6A21, // 模, #413
0x6B21, // 次, #263
0x6B22, // 欢, #443
0x6B3E, // 款, #358
0x6B63, // 正, #219
0x6B64, // 此, #362
0x6BD4, // 比, #298
0x6C11, // 民, #279
0x6C14, // 气, #303
0x6C34, // 水, #163
0x6C42, // 求, #373
0x6C5F, // 江, #336
0x6CA1, // 没, #229
0x6CBB, // 治, #425
0x6CD5, // 法, #85
0x6CE8, // 注, #119
0x6D3B, // 活, #231
0x6D41, // 流, #280
0x6D4B, // 测, #460
0x6D77, // 海, #124
0x6D88, // 消, #415
0x6DF1, // 深, #477
0x6E05, // 清, #311
0x6E38, // 游, #81
0x6E90, // 源, #325
0x706B, // 火, #498
0x70B9, // 点, #58
0x70ED, // 热, #183
0x7136, // 然, #308
0x7167, // 照, #431
0x7231, // 爱, #223
0x7247, // 片, #128
0x7248, // 版, #91
0x724C, // 牌, #429
0x7269, // 物, #169
0x7279, // 特, #224
0x738B, // 王, #351
0x73A9, // 玩, #476
0x73B0, // 现, #125
0x7403, // 球, #367
0x7406, // 理, #69
0x751F, // 生, #24
0x7528, // 用, #17
0x7531, // 由, #441
0x7535, // 电, #34
0x7537, // 男, #275
0x754C, // 界, #419
0x75C5, // 病, #371
0x767B, // 登, #204
0x767D, // 白, #338
0x767E, // 百, #157
0x7684, // 的, #1
0x76D8, // 盘, #493
0x76EE, // 目, #261
0x76F4, // 直, #391
0x76F8, // 相, #143
0x7701, // 省, #464
0x770B, // 看, #54
0x771F, // 真, #249
0x7740, // 着, #302
0x77E5, // 知, #142
0x7801, // 码, #257
0x7814, // 研, #387
0x793A, // 示, #334
0x793E, // 社, #343
0x795E, // 神, #330
0x798F, // 福, #509
0x79BB, // 离, #454
0x79CD, // 种, #278
0x79D1, // 科, #126
0x79EF, // 积, #390
0x7A0B, // 程, #209
0x7A76, // 究, #504
0x7A7A, // 空, #312
0x7ACB, // 立, #393
0x7AD9, // 站, #107
0x7AE0, // 章, #304
0x7B2C, // 第, #96
0x7B49, // 等, #210
0x7B54, // 答, #256
0x7B80, // 简, #474
0x7BA1, // 管, #221
0x7C7B, // 类, #246
0x7CBE, // 精, #226
0x7CFB, // 系, #89
0x7D22, // 索, #354
0x7EA2, // 红, #417
0x7EA7, // 级, #178
0x7EBF, // 线, #108
0x7EC4, // 组, #389
0x7EC6, // 细, #442
0x7ECF, // 经, #74
0x7ED3, // 结, #333
0x7ED9, // 给, #384
0x7EDC, // 络, #472
0x7EDF, // 统, #344
0x7F16, // 编, #424
0x7F51, // 网, #9
0x7F6E, // 置, #411
0x7F8E, // 美, #60
0x8001, // 老, #292
0x8003, // 考, #288
0x8005, // 者, #106
0x800C, // 而, #297
0x8054, // 联, #159
0x80B2, // 育, #327
0x80FD, // 能, #59
0x81EA, // 自, #77
0x8272, // 色, #198
0x8282, // 节, #361
0x82B1, // 花, #299
0x82F1, // 英, #316
0x8350, // 荐, #402
0x836F, // 药, #481
0x8425, // 营, #394
0x85CF, // 藏, #337
0x884C, // 行, #41
0x8868, // 表, #104
0x88AB, // 被, #289
0x88C5, // 装, #161
0x897F, // 西, #199
0x8981, // 要, #48
0x89C1, // 见, #360
0x89C2, // 观, #423
0x89C4, // 规, #453
0x89C6, // 视, #120
0x89E3, // 解, #264
0x8A00, // 言, #433
0x8BA1, // 计, #191
0x8BA4, // 认, #482
0x8BA9, // 让, #421
0x8BAE, // 议, #427
0x8BAF, // 讯, #388
0x8BB0, // 记, #273
0x8BBA, // 论, #66
0x8BBE, // 设, #162
0x8BC1, // 证, #201
0x8BC4, // 评, #111
0x8BC6, // 识, #463
0x8BD5, // 试, #323
0x8BDD, // 话, #247
0x8BE2, // 询, #432
0x8BE5, // 该, #447
0x8BE6, // 详, #497
0x8BED, // 语, #268
0x8BF4, // 说, #112
0x8BF7, // 请, #213
0x8BFB, // 读, #341
0x8C03, // 调, #438
0x8D22, // 财, #488
0x8D28, // 质, #386
0x8D2D, // 购, #260
0x8D34, // 贴, #510
0x8D39, // 费, #242
0x8D44, // 资, #116
0x8D77, // 起, #220
0x8D85, // 超, #406
0x8DEF, // 路, #235
0x8EAB, // 身, #262
0x8F66, // 车, #82
0x8F6C, // 转, #322
0x8F7D, // 载, #175
0x8FBE, // 达, #435
0x8FC7, // 过, #118
0x8FD0, // 运, #357
0x8FD1, // 近, #492
0x8FD8, // 还, #171
0x8FD9, // 这, #57
0x8FDB, // 进, #160
0x8FDE, // 连, #489
0x9009, // 选, #328
0x901A, // 通, #137
0x901F, // 速, #458
0x9020, // 造, #511
0x9053, // 道, #79
0x90A3, // 那, #305
0x90E8, // 部, #102
0x90FD, // 都, #167
0x914D, // 配, #479
0x9152, // 酒, #444
0x91CC, // 里, #196
0x91CD, // 重, #230
0x91CF, // 量, #248
0x91D1, // 金, #134
0x9500, // 销, #465
0x957F, // 长, #152
0x95E8, // 门, #185
0x95EE, // 问, #92
0x95F4, // 间, #88
0x95FB, // 闻, #313
0x9605, // 阅, #467
0x9633, // 阳, #420
0x9645, // 际, #501
0x9650, // 限, #286
0x9662, // 院, #276
0x96C6, // 集, #284
0x9700, // 需, #405
0x9762, // 面, #123
0x97F3, // 音, #335
0x9875, // 页, #63
0x9879, // 项, #506
0x9891, // 频, #200
0x9898, // 题, #110
0x98CE, // 风, #252
0x98DF, // 食, #445
0x9996, // 首, #149
0x9999, // 香, #512
0x9A6C, // 马, #392
0x9A8C, // 验, #382
0x9AD8, // 高, #67
0x9F99, // 龙, #426
};
// the percentage of the sample covered by the above characters
static const float frequent_zhCN_coverage=0.718950369339973;
// The 512 most frequently occuring characters for the zhTW language in a sample of the Internet.
// Ordered by codepoint, comment shows character and ranking by frequency
const uint16_t frequent_zhTW[] = {
0x4E00, // 一, #2
0x4E09, // 三, #131
0x4E0A, // 上, #12
0x4E0B, // 下, #37
0x4E0D, // 不, #6
0x4E16, // 世, #312
0x4E26, // 並, #434
0x4E2D, // 中, #9
0x4E3B, // 主, #97
0x4E4B, // 之, #55
0x4E5F, // 也, #95
0x4E86, // 了, #19
0x4E8B, // 事, #128
0x4E8C, // 二, #187
0x4E94, // 五, #339
0x4E9B, // 些, #435
0x4E9E, // 亞, #432
0x4EA4, // 交, #264
0x4EAB, // 享, #160
0x4EBA, // 人, #3
0x4EC0, // 什, #483
0x4ECA, // 今, #380
0x4ECB, // 介, #468
0x4ED6, // 他, #65
0x4EE3, // 代, #284
0x4EE5, // 以, #26
0x4EF6, // 件, #234
0x4EFB, // 任, #381
0x4EFD, // 份, #447
0x4F46, // 但, #281
0x4F4D, // 位, #202
0x4F4F, // 住, #471
0x4F55, // 何, #334
0x4F5C, // 作, #56
0x4F60, // 你, #64
0x4F7F, // 使, #236
0x4F86, // 來, #38
0x4F9B, // 供, #397
0x4FBF, // 便, #440
0x4FC2, // 係, #506
0x4FDD, // 保, #161
0x4FE1, // 信, #268
0x4FEE, // 修, #473
0x500B, // 個, #27
0x5011, // 們, #109
0x505A, // 做, #383
0x5065, // 健, #415
0x5099, // 備, #461
0x50B3, // 傳, #277
0x50CF, // 像, #403
0x50F9, // 價, #93
0x512A, // 優, #396
0x5143, // 元, #158
0x5148, // 先, #382
0x5149, // 光, #216
0x514D, // 免, #321
0x5152, // 兒, #374
0x5165, // 入, #58
0x5167, // 內, #106
0x5168, // 全, #67
0x5169, // 兩, #322
0x516C, // 公, #53
0x516D, // 六, #493
0x5171, // 共, #456
0x5176, // 其, #148
0x5177, // 具, #328
0x518A, // 冊, #360
0x518D, // 再, #311
0x51FA, // 出, #44
0x5206, // 分, #15
0x5217, // 列, #259
0x5225, // 別, #361
0x5229, // 利, #251
0x5230, // 到, #29
0x5247, // 則, #511
0x524D, // 前, #82
0x5275, // 創, #409
0x529B, // 力, #176
0x529F, // 功, #430
0x52A0, // 加, #87
0x52A9, // 助, #465
0x52D5, // 動, #48
0x52D9, // 務, #102
0x5305, // 包, #248
0x5316, // 化, #223
0x5317, // 北, #145
0x5340, // 區, #60
0x5341, // 十, #242
0x5357, // 南, #261
0x535A, // 博, #484
0x5361, // 卡, #327
0x5370, // 印, #498
0x5373, // 即, #351
0x539F, // 原, #237
0x53BB, // 去, #190
0x53C3, // 參, #444
0x53C8, // 又, #426
0x53CA, // 及, #136
0x53CB, // 友, #142
0x53D6, // 取, #422
0x53D7, // 受, #410
0x53E3, // 口, #357
0x53EA, // 只, #250
0x53EF, // 可, #35
0x53F0, // 台, #34
0x53F8, // 司, #226
0x5403, // 吃, #362
0x5404, // 各, #454
0x5408, // 合, #147
0x540C, // 同, #173
0x540D, // 名, #108
0x544A, // 告, #186
0x548C, // 和, #130
0x54C1, // 品, #23
0x54E1, // 員, #150
0x5546, // 商, #75
0x554F, // 問, #120
0x559C, // 喜, #502
0x55AE, // 單, #210
0x55CE, // 嗎, #443
0x5668, // 器, #305
0x56DB, // 四, #318
0x56DE, // 回, #59
0x56E0, // 因, #253
0x570B, // 國, #21
0x5712, // 園, #345
0x5716, // 圖, #73
0x5718, // 團, #338
0x5728, // 在, #11
0x5730, // 地, #50
0x578B, // 型, #270
0x57CE, // 城, #466
0x57FA, // 基, #349
0x5831, // 報, #127
0x5834, // 場, #165
0x58EB, // 士, #372
0x5916, // 外, #152
0x591A, // 多, #54
0x5927, // 大, #8
0x5929, // 天, #43
0x592A, // 太, #343
0x5947, // 奇, #325
0x5973, // 女, #85
0x5979, // 她, #420
0x597D, // 好, #22
0x5982, // 如, #144
0x5B50, // 子, #46
0x5B57, // 字, #275
0x5B78, // 學, #49
0x5B89, // 安, #239
0x5B8C, // 完, #320
0x5B9A, // 定, #159
0x5BA2, // 客, #188
0x5BB6, // 家, #31
0x5BB9, // 容, #244
0x5BE6, // 實, #198
0x5BF6, // 寶, #367
0x5C07, // 將, #232
0x5C08, // 專, #133
0x5C0B, // 尋, #352
0x5C0D, // 對, #126
0x5C0E, // 導, #418
0x5C0F, // 小, #20
0x5C11, // 少, #368
0x5C31, // 就, #63
0x5C55, // 展, #341
0x5C71, // 山, #273
0x5DE5, // 工, #121
0x5DF1, // 己, #402
0x5DF2, // 已, #299
0x5E02, // 市, #81
0x5E2B, // 師, #262
0x5E36, // 帶, #470
0x5E38, // 常, #303
0x5E73, // 平, #297
0x5E74, // 年, #30
0x5E97, // 店, #171
0x5EA6, // 度, #220
0x5EB7, // 康, #441
0x5EE3, // 廣, #279
0x5EFA, // 建, #254
0x5F0F, // 式, #155
0x5F15, // 引, #346
0x5F35, // 張, #366
0x5F37, // 強, #437
0x5F71, // 影, #94
0x5F88, // 很, #177
0x5F8C, // 後, #66
0x5F97, // 得, #113
0x5F9E, // 從, #436
0x5FC3, // 心, #57
0x5FEB, // 快, #292
0x6027, // 性, #175
0x606F, // 息, #378
0x60A8, // 您, #252
0x60C5, // 情, #123
0x60F3, // 想, #178
0x610F, // 意, #168
0x611B, // 愛, #125
0x611F, // 感, #211
0x61C9, // 應, #164
0x6210, // 成, #86
0x6211, // 我, #7
0x6216, // 或, #199
0x6230, // 戰, #438
0x6232, // 戲, #309
0x6236, // 戶, #497
0x623F, // 房, #274
0x6240, // 所, #79
0x624B, // 手, #68
0x624D, // 才, #400
0x6253, // 打, #278
0x627E, // 找, #449
0x6280, // 技, #332
0x6295, // 投, #425
0x62C9, // 拉, #500
0x62CD, // 拍, #398
0x6307, // 指, #407
0x6392, // 排, #458
0x63A5, // 接, #326
0x63A8, // 推, #153
0x63D0, // 提, #235
0x641C, // 搜, #314
0x6469, // 摩, #472
0x6536, // 收, #249
0x6539, // 改, #508
0x653E, // 放, #331
0x653F, // 政, #295
0x6559, // 教, #184
0x6574, // 整, #394
0x6578, // 數, #134
0x6587, // 文, #16
0x6599, // 料, #167
0x65AF, // 斯, #476
0x65B0, // 新, #10
0x65B9, // 方, #96
0x65BC, // 於, #70
0x65C5, // 旅, #289
0x65E5, // 日, #18
0x660E, // 明, #118
0x6613, // 易, #482
0x661F, // 星, #205
0x662F, // 是, #5
0x6642, // 時, #13
0x66F4, // 更, #149
0x66F8, // 書, #209
0x6700, // 最, #51
0x6703, // 會, #14
0x6708, // 月, #25
0x6709, // 有, #4
0x670D, // 服, #99
0x671F, // 期, #139
0x672A, // 未, #404
0x672C, // 本, #45
0x6771, // 東, #221
0x677F, // 板, #364
0x6797, // 林, #330
0x679C, // 果, #179
0x67E5, // 查, #283
0x683C, // 格, #157
0x6848, // 案, #392
0x689D, // 條, #406
0x696D, // 業, #103
0x6A02, // 樂, #116
0x6A13, // 樓, #411
0x6A19, // 標, #384
0x6A23, // 樣, #306
0x6A5F, // 機, #40
0x6AA2, // 檢, #359
0x6B0A, // 權, #228
0x6B21, // 次, #227
0x6B3E, // 款, #276
0x6B4C, // 歌, #496
0x6B61, // 歡, #427
0x6B63, // 正, #206
0x6B64, // 此, #247
0x6BCF, // 每, #391
0x6BD4, // 比, #257
0x6C11, // 民, #230
0x6C23, // 氣, #200
0x6C34, // 水, #140
0x6C42, // 求, #501
0x6C92, // 沒, #162
0x6CD5, // 法, #89
0x6D3B, // 活, #124
0x6D41, // 流, #315
0x6D77, // 海, #258
0x6D88, // 消, #342
0x6E05, // 清, #329
0x6E2F, // 港, #293
0x6F14, // 演, #491
0x7063, // 灣, #195
0x70BA, // 為, #39
0x7121, // 無, #107
0x7136, // 然, #215
0x7167, // 照, #376
0x71B1, // 熱, #245
0x7247, // 片, #90
0x7248, // 版, #112
0x724C, // 牌, #467
0x7269, // 物, #110
0x7279, // 特, #183
0x738B, // 王, #287
0x73A9, // 玩, #354
0x73FE, // 現, #143
0x7403, // 球, #350
0x7406, // 理, #105
0x751F, // 生, #24
0x7522, // 產, #201
0x7528, // 用, #17
0x7531, // 由, #288
0x7537, // 男, #298
0x754C, // 界, #399
0x7559, // 留, #218
0x756B, // 畫, #412
0x7576, // 當, #185
0x767B, // 登, #138
0x767C, // 發, #28
0x767D, // 白, #377
0x767E, // 百, #393
0x7684, // 的, #1
0x76EE, // 目, #271
0x76F4, // 直, #379
0x76F8, // 相, #98
0x770B, // 看, #52
0x771F, // 真, #180
0x773C, // 眼, #433
0x77E5, // 知, #170
0x78BC, // 碼, #481
0x793A, // 示, #353
0x793E, // 社, #333
0x795E, // 神, #304
0x7968, // 票, #477
0x798F, // 福, #494
0x79C1, // 私, #507
0x79D1, // 科, #280
0x7A0B, // 程, #272
0x7A2E, // 種, #337
0x7A4D, // 積, #385
0x7A7A, // 空, #324
0x7ACB, // 立, #286
0x7AD9, // 站, #117
0x7AE0, // 章, #141
0x7B2C, // 第, #135
0x7B49, // 等, #240
0x7BA1, // 管, #340
0x7BC0, // 節, #431
0x7BC7, // 篇, #479
0x7C21, // 簡, #499
0x7CBE, // 精, #213
0x7CFB, // 系, #212
0x7D04, // 約, #462
0x7D05, // 紅, #452
0x7D1A, // 級, #267
0x7D30, // 細, #486
0x7D44, // 組, #335
0x7D50, // 結, #243
0x7D66, // 給, #355
0x7D71, // 統, #375
0x7D93, // 經, #111
0x7DB2, // 網, #32
0x7DDA, // 線, #151
0x7E23, // 縣, #439
0x7E3D, // 總, #370
0x7F8E, // 美, #41
0x7FA9, // 義, #504
0x8001, // 老, #290
0x8003, // 考, #428
0x8005, // 者, #92
0x800C, // 而, #217
0x805E, // 聞, #181
0x806F, // 聯, #310
0x8072, // 聲, #413
0x80A1, // 股, #390
0x80B2, // 育, #453
0x80FD, // 能, #71
0x8166, // 腦, #408
0x81EA, // 自, #61
0x81F3, // 至, #344
0x8207, // 與, #84
0x8209, // 舉, #463
0x8272, // 色, #192
0x82B1, // 花, #255
0x82F1, // 英, #348
0x83EF, // 華, #196
0x842C, // 萬, #316
0x843D, // 落, #308
0x8457, // 著, #233
0x85A6, // 薦, #401
0x85CF, // 藏, #503
0x85DD, // 藝, #488
0x8655, // 處, #419
0x865F, // 號, #191
0x884C, // 行, #47
0x8853, // 術, #395
0x8868, // 表, #77
0x88AB, // 被, #291
0x88DD, // 裝, #256
0x88E1, // 裡, #369
0x88FD, // 製, #510
0x897F, // 西, #300
0x8981, // 要, #36
0x898B, // 見, #307
0x8996, // 視, #204
0x89BA, // 覺, #450
0x89BD, // 覽, #387
0x89C0, // 觀, #365
0x89E3, // 解, #323
0x8A00, // 言, #169
0x8A02, // 訂, #423
0x8A08, // 計, #225
0x8A0A, // 訊, #156
0x8A0E, // 討, #373
0x8A18, // 記, #222
0x8A2D, // 設, #174
0x8A3B, // 註, #356
0x8A55, // 評, #246
0x8A66, // 試, #448
0x8A71, // 話, #229
0x8A72, // 該, #446
0x8A8D, // 認, #464
0x8A9E, // 語, #371
0x8AAA, // 說, #91
0x8ABF, // 調, #509
0x8ACB, // 請, #119
0x8AD6, // 論, #114
0x8B1D, // 謝, #389
0x8B49, // 證, #429
0x8B58, // 識, #416
0x8B70, // 議, #485
0x8B77, // 護, #475
0x8B80, // 讀, #386
0x8B8A, // 變, #388
0x8B93, // 讓, #336
0x8CA8, // 貨, #313
0x8CB7, // 買, #260
0x8CBB, // 費, #203
0x8CC7, // 資, #62
0x8CE3, // 賣, #294
0x8CEA, // 質, #457
0x8CFC, // 購, #189
0x8D77, // 起, #214
0x8D85, // 超, #296
0x8DDF, // 跟, #489
0x8DEF, // 路, #137
0x8EAB, // 身, #197
0x8ECA, // 車, #76
0x8F09, // 載, #301
0x8F49, // 轉, #282
0x8FD1, // 近, #414
0x9001, // 送, #363
0x9019, // 這, #42
0x901A, // 通, #207
0x901F, // 速, #495
0x9020, // 造, #455
0x9023, // 連, #285
0x9032, // 進, #231
0x904A, // 遊, #132
0x904B, // 運, #219
0x904E, // 過, #101
0x9053, // 道, #146
0x9054, // 達, #417
0x9078, // 選, #182
0x9084, // 還, #154
0x908A, // 邊, #487
0x90A3, // 那, #269
0x90E8, // 部, #78
0x90FD, // 都, #104
0x914D, // 配, #421
0x9152, // 酒, #512
0x91AB, // 醫, #358
0x91CD, // 重, #224
0x91CF, // 量, #319
0x91D1, // 金, #115
0x9304, // 錄, #302
0x9577, // 長, #172
0x9580, // 門, #193
0x958B, // 開, #72
0x9593, // 間, #80
0x95B1, // 閱, #405
0x95DC, // 關, #74
0x963F, // 阿, #460
0x9650, // 限, #265
0x9662, // 院, #474
0x9664, // 除, #478
0x969B, // 際, #459
0x96C6, // 集, #347
0x96E2, // 離, #442
0x96FB, // 電, #33
0x9700, // 需, #445
0x975E, // 非, #451
0x9762, // 面, #129
0x97F3, // 音, #194
0x9801, // 頁, #83
0x982D, // 頭, #238
0x984C, // 題, #122
0x985E, // 類, #163
0x98A8, // 風, #266
0x98DF, // 食, #208
0x9910, // 餐, #469
0x9928, // 館, #424
0x9996, // 首, #166
0x9999, // 香, #263
0x99AC, // 馬, #317
0x9A57, // 驗, #492
0x9AD4, // 體, #100
0x9AD8, // 高, #88
0x9EBC, // 麼, #241
0x9EC3, // 黃, #480
0x9ED1, // 黑, #490
0x9EDE, // 點, #69
0x9F8D, // 龍, #505
};
// the percentage of the sample covered by the above characters
static const float frequent_zhTW_coverage=0.704841200026877;
// The 512 most frequently occuring characters for the ja language in a sample of the Internet.
// Ordered by codepoint, comment shows character and ranking by frequency
const uint16_t frequent_ja[] = {
0x3005, // 々, #352
0x3041, // ぁ, #486
0x3042, // あ, #50
0x3044, // い, #2
0x3046, // う, #33
0x3048, // え, #83
0x304A, // お, #37
0x304B, // か, #21
0x304C, // が, #17
0x304D, // き, #51
0x304E, // ぎ, #324
0x304F, // く, #38
0x3050, // ぐ, #334
0x3051, // け, #60
0x3052, // げ, #296
0x3053, // こ, #34
0x3054, // ご, #100
0x3055, // さ, #31
0x3056, // ざ, #378
0x3057, // し, #4
0x3058, // じ, #121
0x3059, // す, #12
0x305A, // ず, #215
0x305B, // せ, #86
0x305D, // そ, #68
0x305F, // た, #11
0x3060, // だ, #42
0x3061, // ち, #67
0x3063, // っ, #23
0x3064, // つ, #73
0x3066, // て, #7
0x3067, // で, #6
0x3068, // と, #14
0x3069, // ど, #75
0x306A, // な, #8
0x306B, // に, #5
0x306D, // ね, #123
0x306E, // の, #1
0x306F, // は, #16
0x3070, // ば, #150
0x3071, // ぱ, #259
0x3072, // ひ, #364
0x3073, // び, #266
0x3075, // ふ, #484
0x3076, // ぶ, #330
0x3078, // へ, #146
0x3079, // べ, #207
0x307B, // ほ, #254
0x307E, // ま, #18
0x307F, // み, #74
0x3080, // む, #285
0x3081, // め, #78
0x3082, // も, #32
0x3083, // ゃ, #111
0x3084, // や, #85
0x3086, // ゆ, #392
0x3087, // ょ, #224
0x3088, // よ, #63
0x3089, // ら, #29
0x308A, // り, #28
0x308B, // る, #9
0x308C, // れ, #35
0x308D, // ろ, #127
0x308F, // わ, #88
0x3092, // を, #19
0x3093, // ん, #22
0x30A1, // ァ, #193
0x30A2, // ア, #27
0x30A3, // ィ, #70
0x30A4, // イ, #15
0x30A6, // ウ, #89
0x30A7, // ェ, #134
0x30A8, // エ, #81
0x30A9, // ォ, #225
0x30AA, // オ, #76
0x30AB, // カ, #52
0x30AC, // ガ, #147
0x30AD, // キ, #66
0x30AE, // ギ, #246
0x30AF, // ク, #25
0x30B0, // グ, #39
0x30B1, // ケ, #137
0x30B2, // ゲ, #200
0x30B3, // コ, #46
0x30B4, // ゴ, #183
0x30B5, // サ, #64
0x30B6, // ザ, #221
0x30B7, // シ, #48
0x30B8, // ジ, #55
0x30B9, // ス, #13
0x30BA, // ズ, #103
0x30BB, // セ, #109
0x30BC, // ゼ, #499
0x30BD, // ソ, #175
0x30BF, // タ, #45
0x30C0, // ダ, #104
0x30C1, // チ, #71
0x30C3, // ッ, #20
0x30C4, // ツ, #119
0x30C6, // テ, #59
0x30C7, // デ, #82
0x30C8, // ト, #10
0x30C9, // ド, #44
0x30CA, // ナ, #102
0x30CB, // ニ, #72
0x30CD, // ネ, #117
0x30CE, // , #192
0x30CF, // ハ, #164
0x30D0, // バ, #62
0x30D1, // パ, #90
0x30D2, // ヒ, #398
0x30D3, // ビ, #77
0x30D4, // ピ, #135
0x30D5, // フ, #47
0x30D6, // ブ, #56
0x30D7, // プ, #43
0x30D8, // ヘ, #268
0x30D9, // ベ, #157
0x30DA, // ペ, #125
0x30DB, // ホ, #155
0x30DC, // ボ, #168
0x30DD, // ポ, #114
0x30DE, // マ, #57
0x30DF, // ミ, #97
0x30E0, // ム, #69
0x30E1, // メ, #53
0x30E2, // モ, #142
0x30E3, // ャ, #93
0x30E4, // ヤ, #258
0x30E5, // ュ, #79
0x30E6, // ユ, #405
0x30E7, // ョ, #98
0x30E9, // ラ, #26
0x30EA, // リ, #30
0x30EB, // ル, #24
0x30EC, // レ, #41
0x30ED, // ロ, #40
0x30EF, // ワ, #144
0x30F3, // ン, #3
0x30F4, // ヴ, #483
0x30FD, // ヽ, #501
0x4E00, // 一, #84
0x4E07, // 万, #337
0x4E09, // 三, #323
0x4E0A, // 上, #133
0x4E0B, // 下, #180
0x4E0D, // 不, #277
0x4E16, // 世, #385
0x4E2D, // 中, #87
0x4E3B, // 主, #432
0x4E88, // 予, #326
0x4E8B, // 事, #95
0x4E8C, // 二, #394
0x4E95, // 井, #468
0x4EA4, // 交, #410
0x4EAC, // 京, #260
0x4EBA, // 人, #61
0x4ECA, // 今, #184
0x4ECB, // 介, #358
0x4ED5, // 仕, #391
0x4ED6, // 他, #256
0x4ED8, // 付, #243
0x4EE3, // 代, #280
0x4EE5, // 以, #216
0x4EF6, // 件, #190
0x4F1A, // 会, #105
0x4F4D, // 位, #177
0x4F4F, // 住, #376
0x4F53, // 体, #223
0x4F55, // 何, #294
0x4F5C, // 作, #154
0x4F7F, // 使, #233
0x4F9B, // 供, #503
0x4FA1, // 価, #217
0x4FBF, // 便, #511
0x4FDD, // 保, #279
0x4FE1, // 信, #271
0x500B, // 個, #415
0x50CF, // 像, #178
0x512A, // 優, #403
0x5143, // 元, #384
0x5148, // 先, #311
0x5149, // 光, #488
0x5165, // 入, #115
0x5168, // 全, #173
0x516C, // 公, #287
0x5177, // 具, #447
0x5185, // 内, #169
0x5186, // 円, #131
0x5199, // 写, #275
0x51FA, // 出, #110
0x5206, // 分, #130
0x5207, // 切, #401
0x521D, // 初, #319
0x5225, // 別, #290
0x5229, // 利, #226
0x5236, // 制, #507
0x524D, // 前, #124
0x529B, // 力, #272
0x52A0, // 加, #249
0x52D5, // 動, #120
0x52D9, // 務, #421
0x52DF, // 募, #476
0x5316, // 化, #308
0x5317, // 北, #341
0x533A, // 区, #348
0x539F, // 原, #321
0x53C2, // 参, #452
0x53CB, // 友, #451
0x53D6, // 取, #237
0x53D7, // 受, #354
0x53E3, // 口, #289
0x53E4, // 古, #339
0x53EF, // 可, #298
0x53F0, // 台, #439
0x53F7, // 号, #361
0x5408, // 合, #118
0x540C, // 同, #263
0x540D, // 名, #65
0x5411, // 向, #434
0x544A, // 告, #386
0x5468, // 周, #393
0x5473, // 味, #299
0x548C, // 和, #350
0x54C1, // 品, #96
0x54E1, // 員, #293
0x5546, // 商, #198
0x554F, // 問, #158
0x55B6, // 営, #438
0x5668, // 器, #366
0x56DE, // 回, #143
0x56F3, // 図, #444
0x56FD, // 国, #153
0x5712, // 園, #435
0x571F, // 土, #239
0x5728, // 在, #351
0x5730, // 地, #163
0x578B, // 型, #430
0x5831, // 報, #112
0x5834, // 場, #139
0x58F2, // 売, #232
0x5909, // 変, #306
0x5916, // 外, #222
0x591A, // 多, #336
0x5927, // 大, #80
0x5929, // 天, #278
0x5973, // 女, #161
0x597D, // 好, #349
0x5A5A, // 婚, #479
0x5B50, // 子, #113
0x5B57, // 字, #492
0x5B66, // 学, #132
0x5B89, // 安, #295
0x5B9A, // 定, #145
0x5B9F, // 実, #220
0x5BA4, // 室, #482
0x5BAE, // 宮, #487
0x5BB6, // 家, #211
0x5BB9, // 容, #333
0x5BFE, // 対, #252
0x5C02, // 専, #474
0x5C0F, // 小, #212
0x5C11, // 少, #377
0x5C4B, // 屋, #284
0x5C71, // 山, #206
0x5CA1, // 岡, #429
0x5CF6, // 島, #297
0x5DDD, // 川, #253
0x5DE5, // 工, #374
0x5E02, // 市, #159
0x5E2F, // 帯, #416
0x5E38, // 常, #437
0x5E73, // 平, #390
0x5E74, // 年, #54
0x5E83, // 広, #367
0x5E97, // 店, #149
0x5EA6, // 度, #269
0x5EAB, // 庫, #380
0x5F0F, // 式, #265
0x5F15, // 引, #345
0x5F37, // 強, #446
0x5F53, // 当, #240
0x5F62, // 形, #502
0x5F8C, // 後, #230
0x5F97, // 得, #490
0x5FC3, // 心, #307
0x5FC5, // 必, #422
0x5FDC, // 応, #356
0x601D, // 思, #189
0x6027, // 性, #201
0x6075, // 恵, #400
0x60C5, // 情, #140
0x60F3, // 想, #477
0x610F, // 意, #305
0x611B, // 愛, #273
0x611F, // 感, #257
0x6210, // 成, #262
0x6226, // 戦, #365
0x6240, // 所, #236
0x624B, // 手, #160
0x6295, // 投, #129
0x6301, // 持, #355
0x6307, // 指, #425
0x63A2, // 探, #369
0x63B2, // 掲, #399
0x643A, // 携, #459
0x652F, // 支, #512
0x653E, // 放, #469
0x6559, // 教, #270
0x6570, // 数, #181
0x6587, // 文, #202
0x6599, // 料, #106
0x65B0, // 新, #99
0x65B9, // 方, #126
0x65C5, // 旅, #445
0x65E5, // 日, #36
0x660E, // 明, #300
0x6620, // 映, #418
0x6642, // 時, #107
0x66F4, // 更, #359
0x66F8, // 書, #174
0x6700, // 最, #152
0x6708, // 月, #49
0x6709, // 有, #302
0x671F, // 期, #332
0x6728, // 木, #203
0x672C, // 本, #92
0x6750, // 材, #489
0x6751, // 村, #466
0x6765, // 来, #267
0x6771, // 東, #191
0x677F, // 板, #411
0x679C, // 果, #441
0x6821, // 校, #327
0x682A, // 株, #412
0x683C, // 格, #228
0x691C, // 検, #179
0x696D, // 業, #166
0x697D, // 楽, #172
0x69D8, // 様, #255
0x6A5F, // 機, #235
0x6B21, // 次, #318
0x6B62, // 止, #475
0x6B63, // 正, #312
0x6C17, // 気, #116
0x6C34, // 水, #165
0x6C42, // 求, #465
0x6C7A, // 決, #370
0x6CBB, // 治, #505
0x6CC1, // 況, #462
0x6CD5, // 法, #227
0x6CE8, // 注, #372
0x6D3B, // 活, #303
0x6D41, // 流, #480
0x6D77, // 海, #274
0x6E08, // 済, #417
0x6F14, // 演, #504
0x706B, // 火, #264
0x70B9, // 点, #331
0x7121, // 無, #58
0x7248, // 版, #409
0x7269, // 物, #170
0x7279, // 特, #242
0x72B6, // 状, #458
0x73FE, // 現, #322
0x7406, // 理, #162
0x751F, // 生, #122
0x7523, // 産, #320
0x7528, // 用, #94
0x7530, // 田, #195
0x7537, // 男, #373
0x753A, // 町, #314
0x753B, // 画, #91
0x754C, // 界, #436
0x756A, // 番, #261
0x75C5, // 病, #428
0x767A, // 発, #194
0x767B, // 登, #231
0x767D, // 白, #419
0x7684, // 的, #251
0x76EE, // 目, #197
0x76F4, // 直, #497
0x76F8, // 相, #286
0x770C, // 県, #199
0x771F, // 真, #219
0x7740, // 着, #283
0x77E5, // 知, #185
0x77F3, // 石, #500
0x78BA, // 確, #383
0x793A, // 示, #241
0x793E, // 社, #167
0x795E, // 神, #315
0x798F, // 福, #423
0x79C1, // 私, #347
0x79D1, // 科, #420
0x7A0E, // 税, #368
0x7A2E, // 種, #455
0x7A3F, // 稿, #148
0x7A7A, // 空, #427
0x7ACB, // 立, #309
0x7B11, // 笑, #454
0x7B2C, // 第, #317
0x7B49, // 等, #457
0x7B54, // 答, #426
0x7BA1, // 管, #481
0x7CFB, // 系, #408
0x7D04, // 約, #276
0x7D20, // 素, #407
0x7D22, // 索, #214
0x7D30, // 細, #381
0x7D39, // 紹, #471
0x7D42, // 終, #456
0x7D44, // 組, #424
0x7D4C, // 経, #360
0x7D50, // 結, #291
0x7D9A, // 続, #357
0x7DCF, // 総, #467
0x7DDA, // 線, #338
0x7DE8, // 編, #453
0x7F8E, // 美, #204
0x8003, // 考, #387
0x8005, // 者, #151
0x805E, // 聞, #463
0x8077, // 職, #363
0x80B2, // 育, #433
0x80FD, // 能, #250
0x8179, // 腹, #396
0x81EA, // 自, #156
0x826F, // 良, #329
0x8272, // 色, #402
0x82B1, // 花, #440
0x82B8, // 芸, #413
0x82F1, // 英, #485
0x8449, // 葉, #472
0x884C, // 行, #128
0x8853, // 術, #460
0x8868, // 表, #209
0x88FD, // 製, #431
0x897F, // 西, #406
0x8981, // 要, #313
0x898B, // 見, #101
0x898F, // 規, #375
0x89A7, // 覧, #171
0x89E3, // 解, #388
0x8A00, // 言, #210
0x8A08, // 計, #343
0x8A18, // 記, #136
0x8A2D, // 設, #292
0x8A71, // 話, #213
0x8A73, // 詳, #371
0x8A8D, // 認, #404
0x8A9E, // 語, #234
0x8AAC, // 説, #494
0x8AAD, // 読, #301
0x8ABF, // 調, #443
0x8AC7, // 談, #448
0x8B77, // 護, #509
0x8C37, // 谷, #506
0x8CA9, // 販, #362
0x8CB7, // 買, #346
0x8CC7, // 資, #473
0x8CEA, // 質, #281
0x8CFC, // 購, #495
0x8EAB, // 身, #470
0x8ECA, // 車, #205
0x8EE2, // 転, #335
0x8F09, // 載, #342
0x8FBC, // 込, #229
0x8FD1, // 近, #304
0x8FD4, // 返, #461
0x8FFD, // 追, #379
0x9001, // 送, #186
0x901A, // 通, #182
0x901F, // 速, #340
0x9023, // 連, #244
0x904B, // 運, #382
0x904E, // 過, #498
0x9053, // 道, #282
0x9054, // 達, #450
0x9055, // 違, #414
0x9078, // 選, #288
0x90E8, // 部, #208
0x90FD, // 都, #344
0x914D, // 配, #389
0x91CD, // 重, #478
0x91CE, // 野, #245
0x91D1, // 金, #138
0x9332, // 録, #238
0x9577, // 長, #247
0x9580, // 門, #508
0x958B, // 開, #248
0x9593, // 間, #141
0x95A2, // 関, #188
0x962A, // 阪, #496
0x9650, // 限, #395
0x9662, // 院, #449
0x9664, // 除, #510
0x969B, // 際, #493
0x96C6, // 集, #196
0x96D1, // 雑, #442
0x96FB, // 電, #187
0x9762, // 面, #328
0x97F3, // 音, #325
0x984C, // 題, #310
0x985E, // 類, #491
0x98A8, // 風, #353
0x98DF, // 食, #218
0x9928, // 館, #464
0x99C5, // 駅, #316
0x9A13, // 験, #397
0x9AD8, // 高, #176
0xFF57, // , #108
};
// the percentage of the sample covered by the above characters
static const float frequent_ja_coverage=0.880569589120162;
// The 512 most frequently occuring characters for the ko language in a sample of the Internet.
// Ordered by codepoint, comment shows character and ranking by frequency
const uint16_t frequent_ko[] = {
0x314B, // ㅋ, #148
0x314E, // ㅎ, #390
0x3160, // ㅠ, #354
0x318D, // ㆍ, #439
0xAC00, // 가, #6
0xAC01, // 각, #231
0xAC04, // 간, #106
0xAC08, // 갈, #362
0xAC10, // 감, #122
0xAC11, // 갑, #493
0xAC15, // 강, #155
0xAC19, // 같, #264
0xAC1C, // 개, #87
0xAC1D, // 객, #198
0xAC24, // 갤, #457
0xAC70, // 거, #91
0xAC74, // 건, #161
0xAC78, // 걸, #338
0xAC80, // 검, #184
0xAC83, // 것, #116
0xAC8C, // 게, #36
0xACA0, // 겠, #233
0xACA8, // 겨, #341
0xACA9, // 격, #245
0xACAC, // 견, #413
0xACB0, // 결, #202
0xACBD, // 경, #62
0xACC4, // 계, #142
0xACE0, // 고, #12
0xACE1, // 곡, #444
0xACE8, // 골, #379
0xACF3, // 곳, #388
0xACF5, // 공, #59
0xACFC, // 과, #69
0xAD00, // 관, #95
0xAD11, // 광, #235
0xAD50, // 교, #128
0xAD6C, // 구, #52
0xAD6D, // 국, #85
0xAD70, // 군, #293
0xAD74, // 굴, #487
0xAD81, // 궁, #441
0xAD8C, // 권, #192
0xADC0, // 귀, #386
0xADDC, // 규, #367
0xADF8, // 그, #30
0xADF9, // 극, #424
0xADFC, // 근, #241
0xAE00, // 글, #61
0xAE08, // 금, #138
0xAE09, // 급, #269
0xAE30, // 기, #3
0xAE34, // 긴, #465
0xAE38, // 길, #297
0xAE40, // 김, #205
0xAE4C, // 까, #171
0xAED8, // 께, #273
0xAF43, // 꽃, #475
0xB05D, // 끝, #505
0xB07C, // 끼, #490
0xB098, // 나, #39
0xB09C, // 난, #274
0xB0A0, // 날, #292
0xB0A8, // 남, #139
0xB0B4, // 내, #56
0xB108, // 너, #272
0xB110, // 널, #476
0xB118, // 넘, #492
0xB124, // 네, #100
0xB137, // 넷, #329
0xB140, // 녀, #288
0xB144, // 년, #151
0xB178, // 노, #149
0xB17C, // 논, #491
0xB180, // 놀, #464
0xB18D, // 농, #442
0xB204, // 누, #319
0xB208, // 눈, #383
0xB274, // 뉴, #173
0xB290, // 느, #368
0xB294, // 는, #5
0xB298, // 늘, #322
0xB2A5, // 능, #190
0xB2C8, // 니, #16
0xB2D8, // 님, #153
0xB2E4, // 다, #2
0xB2E8, // 단, #134
0xB2EB, // 닫, #195
0xB2EC, // 달, #243
0xB2F4, // 담, #254
0xB2F5, // 답, #287
0xB2F9, // 당, #159
0xB300, // 대, #33
0xB313, // 댓, #303
0xB354, // 더, #140
0xB358, // 던, #252
0xB367, // 덧, #463
0xB370, // 데, #104
0xB378, // 델, #429
0xB3C4, // 도, #25
0xB3C5, // 독, #301
0xB3CC, // 돌, #309
0xB3D9, // 동, #58
0xB418, // 되, #82
0xB41C, // 된, #189
0xB420, // 될, #408
0xB429, // 됩, #332
0xB450, // 두, #199
0xB4A4, // 뒤, #496
0xB4DC, // 드, #40
0xB4E0, // 든, #283
0xB4E4, // 들, #54
0xB4EF, // 듯, #478
0xB4F1, // 등, #90
0xB514, // 디, #133
0xB529, // 딩, #462
0xB530, // 따, #333
0xB54C, // 때, #240
0xB610, // 또, #313
0xB77C, // 라, #42
0xB77D, // 락, #355
0xB780, // 란, #290
0xB78C, // 람, #246
0xB78D, // 랍, #420
0xB791, // 랑, #270
0xB798, // 래, #174
0xB799, // 랙, #381
0xB79C, // 랜, #357
0xB7A8, // 램, #359
0xB7A9, // 랩, #402
0xB7C9, // 량, #346
0xB7EC, // 러, #130
0xB7F0, // 런, #312
0xB7FC, // 럼, #327
0xB7FD, // 럽, #447
0xB807, // 렇, #412
0xB808, // 레, #114
0xB80C, // 렌, #395
0xB824, // 려, #158
0xB825, // 력, #194
0xB828, // 련, #326
0xB839, // 령, #389
0xB85C, // 로, #4
0xB85D, // 록, #84
0xB860, // 론, #366
0xB8CC, // 료, #154
0xB8E8, // 루, #236
0xB958, // 류, #265
0xB974, // 르, #212
0xB978, // 른, #250
0xB97C, // 를, #35
0xB984, // 름, #276
0xB9AC, // 리, #19
0xB9AD, // 릭, #394
0xB9B0, // 린, #259
0xB9B4, // 릴, #485
0xB9BC, // 림, #305
0xB9BD, // 립, #217
0xB9C1, // 링, #351
0xB9C8, // 마, #67
0xB9C9, // 막, #310
0xB9CC, // 만, #65
0xB9CE, // 많, #257
0xB9D0, // 말, #188
0xB9DB, // 맛, #397
0xB9DD, // 망, #370
0xB9DE, // 맞, #399
0xB9E4, // 매, #125
0xB9E8, // 맨, #422
0xBA38, // 머, #311
0xBA39, // 먹, #377
0xBA3C, // 먼, #469
0xBA54, // 메, #147
0xBA70, // 며, #191
0xBA74, // 면, #72
0xBA85, // 명, #131
0xBAA8, // 모, #73
0xBAA9, // 목, #157
0xBAB0, // 몰, #401
0xBAB8, // 몸, #437
0xBABB, // 못, #336
0xBB34, // 무, #80
0xBB38, // 문, #57
0xBB3C, // 물, #94
0xBBA4, // 뮤, #431
0xBBF8, // 미, #76
0xBBFC, // 민, #200
0xBC00, // 밀, #308
0xBC0F, // 및, #249
0xBC14, // 바, #89
0xBC15, // 박, #226
0xBC18, // 반, #175
0xBC1B, // 받, #248
0xBC1C, // 발, #164
0xBC29, // 방, #92
0xBC30, // 배, #162
0xBC31, // 백, #256
0xBC84, // 버, #111
0xBC88, // 번, #167
0xBC8C, // 벌, #423
0xBC94, // 범, #427
0xBC95, // 법, #207
0xBCA0, // 베, #281
0xBCA4, // 벤, #378
0xBCA8, // 벨, #387
0xBCC0, // 변, #253
0xBCC4, // 별, #262
0xBCD1, // 병, #340
0xBCF4, // 보, #20
0xBCF5, // 복, #204
0xBCF8, // 본, #182
0xBCFC, // 볼, #385
0xBD09, // 봉, #405
0xBD80, // 부, #46
0xBD81, // 북, #261
0xBD84, // 분, #105
0xBD88, // 불, #225
0xBDF0, // 뷰, #350
0xBE0C, // 브, #214
0xBE14, // 블, #99
0xBE44, // 비, #55
0xBE4C, // 빌, #510
0xBE60, // 빠, #398
0xC0AC, // 사, #14
0xC0AD, // 삭, #342
0xC0B0, // 산, #121
0xC0B4, // 살, #279
0xC0BC, // 삼, #348
0xC0C1, // 상, #41
0xC0C8, // 새, #282
0xC0C9, // 색, #181
0xC0DD, // 생, #109
0xC11C, // 서, #21
0xC11D, // 석, #234
0xC120, // 선, #107
0xC124, // 설, #170
0xC131, // 성, #50
0xC138, // 세, #60
0xC139, // 섹, #456
0xC13C, // 센, #267
0xC154, // 셔, #455
0xC158, // 션, #237
0xC15C, // 셜, #448
0xC168, // 셨, #421
0xC18C, // 소, #51
0xC18D, // 속, #219
0xC190, // 손, #323
0xC1A1, // 송, #203
0xC1C4, // 쇄, #501
0xC1FC, // 쇼, #364
0xC218, // 수, #27
0xC219, // 숙, #467
0xC21C, // 순, #258
0xC220, // 술, #302
0xC26C, // 쉬, #511
0xC288, // 슈, #384
0xC2A4, // 스, #11
0xC2AC, // 슬, #438
0xC2B4, // 슴, #504
0xC2B5, // 습, #77
0xC2B9, // 승, #299
0xC2DC, // 시, #13
0xC2DD, // 식, #137
0xC2E0, // 신, #47
0xC2E4, // 실, #132
0xC2EC, // 심, #196
0xC2ED, // 십, #482
0xC2F6, // 싶, #352
0xC2F8, // 싸, #419
0xC4F0, // 쓰, #278
0xC528, // 씨, #360
0xC544, // 아, #23
0xC545, // 악, #296
0xC548, // 안, #71
0xC54A, // 않, #209
0xC54C, // 알, #222
0xC554, // 암, #460
0xC558, // 았, #349
0xC559, // 앙, #473
0xC55E, // 앞, #434
0xC560, // 애, #271
0xC561, // 액, #415
0xC571, // 앱, #477
0xC57C, // 야, #124
0xC57D, // 약, #229
0xC591, // 양, #177
0xC5B4, // 어, #24
0xC5B5, // 억, #407
0xC5B8, // 언, #294
0xC5BC, // 얼, #356
0xC5C4, // 엄, #426
0xC5C5, // 업, #118
0xC5C6, // 없, #178
0xC5C8, // 었, #165
0xC5D0, // 에, #9
0xC5D4, // 엔, #375
0xC5D8, // 엘, #506
0xC5EC, // 여, #66
0xC5ED, // 역, #186
0xC5EE, // 엮, #488
0xC5F0, // 연, #96
0xC5F4, // 열, #266
0xC5FC, // 염, #449
0xC600, // 였, #374
0xC601, // 영, #83
0xC608, // 예, #168
0xC624, // 오, #75
0xC628, // 온, #300
0xC62C, // 올, #306
0xC640, // 와, #119
0xC644, // 완, #361
0xC654, // 왔, #489
0xC655, // 왕, #418
0xC678, // 외, #218
0xC694, // 요, #43
0xC695, // 욕, #479
0xC6A9, // 용, #48
0xC6B0, // 우, #64
0xC6B1, // 욱, #503
0xC6B4, // 운, #108
0xC6B8, // 울, #223
0xC6C0, // 움, #317
0xC6C3, // 웃, #404
0xC6CC, // 워, #280
0xC6D0, // 원, #45
0xC6D4, // 월, #150
0xC6E8, // 웨, #446
0xC6F9, // 웹, #500
0xC704, // 위, #78
0xC720, // 유, #81
0xC721, // 육, #321
0xC724, // 윤, #416
0xC73C, // 으, #49
0xC740, // 은, #31
0xC744, // 을, #17
0xC74C, // 음, #112
0xC751, // 응, #461
0xC758, // 의, #8
0xC774, // 이, #1
0xC775, // 익, #403
0xC778, // 인, #18
0xC77C, // 일, #28
0xC784, // 임, #160
0xC785, // 입, #93
0xC788, // 있, #44
0xC790, // 자, #22
0xC791, // 작, #88
0xC798, // 잘, #347
0xC7A1, // 잡, #372
0xC7A5, // 장, #53
0xC7AC, // 재, #120
0xC7C1, // 쟁, #483
0xC800, // 저, #98
0xC801, // 적, #97
0xC804, // 전, #34
0xC808, // 절, #320
0xC810, // 점, #201
0xC811, // 접, #331
0xC815, // 정, #26
0xC81C, // 제, #29
0xC838, // 져, #414
0xC870, // 조, #86
0xC871, // 족, #373
0xC874, // 존, #432
0xC880, // 좀, #470
0xC885, // 종, #208
0xC88B, // 좋, #239
0xC8E0, // 죠, #451
0xC8FC, // 주, #38
0xC8FD, // 죽, #471
0xC900, // 준, #286
0xC904, // 줄, #392
0xC911, // 중, #103
0xC988, // 즈, #255
0xC98C, // 즌, #507
0xC990, // 즐, #371
0xC99D, // 증, #260
0xC9C0, // 지, #10
0xC9C1, // 직, #216
0xC9C4, // 진, #79
0xC9C8, // 질, #238
0xC9D1, // 집, #206
0xC9DC, // 짜, #411
0xC9F8, // 째, #494
0xCABD, // 쪽, #435
0xCC28, // 차, #146
0xCC29, // 착, #443
0xCC2C, // 찬, #481
0xCC30, // 찰, #440
0xCC38, // 참, #343
0xCC3D, // 창, #304
0xCC3E, // 찾, #335
0xCC44, // 채, #284
0xCC45, // 책, #298
0xCC98, // 처, #242
0xCC9C, // 천, #143
0xCCA0, // 철, #380
0xCCA8, // 첨, #452
0xCCAB, // 첫, #484
0xCCAD, // 청, #197
0xCCB4, // 체, #126
0xCCD0, // 쳐, #472
0xCD08, // 초, #220
0xCD1D, // 총, #406
0xCD5C, // 최, #179
0xCD94, // 추, #136
0xCD95, // 축, #337
0xCD9C, // 출, #166
0xCDA9, // 충, #369
0xCDE8, // 취, #210
0xCE20, // 츠, #215
0xCE21, // 측, #468
0xCE35, // 층, #512
0xCE58, // 치, #102
0xCE5C, // 친, #325
0xCE68, // 침, #263
0xCE74, // 카, #115
0xCE7C, // 칼, #466
0xCE90, // 캐, #454
0xCEE4, // 커, #285
0xCEE8, // 컨, #328
0xCEF4, // 컴, #417
0xCF00, // 케, #339
0xCF13, // 켓, #509
0xCF1C, // 켜, #508
0xCF54, // 코, #193
0xCF58, // 콘, #391
0xCFE0, // 쿠, #393
0xD035, // 퀵, #453
0xD06C, // 크, #101
0xD070, // 큰, #495
0xD074, // 클, #289
0xD0A4, // 키, #230
0xD0C0, // 타, #127
0xD0C1, // 탁, #314
0xD0C4, // 탄, #450
0xD0C8, // 탈, #436
0xD0DC, // 태, #221
0xD0DD, // 택, #275
0xD130, // 터, #70
0xD14C, // 테, #213
0xD150, // 텐, #324
0xD154, // 텔, #430
0xD15C, // 템, #382
0xD1A0, // 토, #145
0xD1B5, // 통, #156
0xD22C, // 투, #227
0xD2B8, // 트, #37
0xD2B9, // 특, #247
0xD2F0, // 티, #187
0xD305, // 팅, #410
0xD30C, // 파, #141
0xD310, // 판, #163
0xD314, // 팔, #499
0xD328, // 패, #307
0xD32C, // 팬, #459
0xD338, // 팸, #433
0xD37C, // 퍼, #344
0xD398, // 페, #172
0xD3B8, // 편, #251
0xD3C9, // 평, #291
0xD3EC, // 포, #68
0xD3ED, // 폭, #445
0xD3F0, // 폰, #318
0xD45C, // 표, #232
0xD480, // 풀, #497
0xD488, // 품, #113
0xD48D, // 풍, #425
0xD504, // 프, #110
0xD508, // 픈, #498
0xD50C, // 플, #211
0xD53C, // 피, #169
0xD544, // 필, #295
0xD551, // 핑, #376
0xD558, // 하, #7
0xD559, // 학, #129
0xD55C, // 한, #15
0xD560, // 할, #144
0xD568, // 함, #152
0xD569, // 합, #123
0xD56D, // 항, #268
0xD574, // 해, #32
0xD588, // 했, #180
0xD589, // 행, #135
0xD5A5, // 향, #345
0xD5C8, // 허, #396
0xD5D8, // 험, #316
0xD5E4, // 헤, #474
0xD604, // 현, #185
0xD611, // 협, #315
0xD615, // 형, #244
0xD61C, // 혜, #428
0xD638, // 호, #117
0xD63C, // 혼, #358
0xD648, // 홈, #330
0xD64D, // 홍, #363
0xD654, // 화, #63
0xD655, // 확, #183
0xD658, // 환, #224
0xD65C, // 활, #277
0xD669, // 황, #353
0xD68C, // 회, #74
0xD68D, // 획, #458
0xD69F, // 횟, #409
0xD6A8, // 효, #400
0xD6C4, // 후, #176
0xD6C8, // 훈, #486
0xD734, // 휴, #365
0xD754, // 흔, #480
0xD76C, // 희, #334
0xD788, // 히, #228
0xD798, // 힘, #502
};
// the percentage of the sample covered by the above characters
static const float frequent_ko_coverage=0.948157021464184;