欢迎光临散文网 会员登陆 & 注册

[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文

2023-04-01 11:28 作者:oeasy  | 我要投稿

日文假名和韩国谚文

回忆上次内容

  • 上次回顾了非ascii的拉丁字符编码的进化过程

    • 0-127 是 ascii 的领域

  • 世界各地编码分布

    • 由iso组织制定

    • 无法同时显示俄文和法文

    • 从iso-8859-1

    • 到iso-8859-16

    • 拉丁字符扩展 ascii 共 16 种

    • 此时中日韩的文字也需要进入计算机

      • 象形文字的字符集超级巨大

      • 日本、韩国也用汉字

      • 数量2万起步

    • 真能把 如此巨大的字符集

      • 编码进入计算机吗?🤔

    文字

    • 日本汉字我们可以直接看懂

    • 地铁里的 标记

    • 日文中 为什么

      • 这么多汉字呢?

    遣唐使

    • 皇子公卿僧侣

      • 都要 专门

      • 来中国 朝圣

      • 学文化

    • 日文 很多词

      • 都 能看懂

      • 管 老师 叫做 先生

      • 管 火车 叫做 机车

      • 管 学习 叫做 勉强

      • 管 辣 叫 辛

    • 特别辣

      • 叫 激辛

    • 这些汉字怎么来的呢?

    空海和尚

    • 从日本来的 留学僧

      • 不但学习 汉语佛法

      • 也学习 汉字书法

    • 并把这些文化带回日本

      • 可以 记录下来了

      • 汉字 成为 书写符号

      • 口头系统的 日语

    • 正如同

      • 将腓尼基的口语记录下来

      • 使用圣书体的一些字型

    万叶集

    • “叶” 是 “世”

      • 即时代

      • 希望能流传到万世

    • 各种各样的歌

      • 敬畏自然山神、河神 的歌

      • 男女恋爱 的歌

      • 挽歌

    • 汉字

      • 才能 都写下来

      • 数量很多

      • 记起来、写起来也比较复杂

      • 只有 最有文化的人

    • 自己 写东西 的时候

      • 来 假借

      • 有些字 忘了 怎么写

      • 就拿一个 同音字

    日语假名

    • 假借的 次数 多了

      • 就 固定了下来

    • 形成了

      • 专门的 日语拼音 字符

    • 假名

      • 不同的时代

      • 不同的地域

      • 存在着多个体系

    平假名

    • 直到明治33年

      • 发行公文才得以统一

    • 万葉仮名(假名)

      • 《枕草子》

      • 《源氏物语》

      • 草书风格的符号

      • 有女性的柔美

      • 抄文众多

    • 把写法也固定了下来

      • 成为铅字

    • 万葉仮名(假名)

      • 现代假名系统 中的 平假名

      • 形成了

    • 除了平假名之外

      • 还有片假名

    片假名

    • 片假名来自 汉字 的 一片

      • 也是一种 假名系统

      • 有 硬朗的 楷书 转化而来

    • 明治维新时期

      • 大量欧美外来语涌入日本

      • 日语只取其读音

      • 用片假名将其表示出来

    • 假名系统

      • 是 拼音文字 系统

      • 字符数量 不多

    最初的日文编码

    • 在ascii的基础上

      • 把片假名加了上去

    • 字型什么样呢?

    假名字形码

    • 可以把这些片假名输出出来吗?

    输出假名

    • 下面的代码是将a1到e0

      • 然后再将字节解码

      • 封包进入一个字节

    • 可以动手试试

      • 以后我们会详细讲解封包解包

    • 范围[0xa1, 0xe0)

    勇者斗恶龙

    • 当时的日文

      • 能显示出ascii和假名的字型

      • 就已经很厉害

    • 想显示出中文字型

      • 是不可能的

    日本汉字

    • 是中文的拼音文字

      • 只是假名都加在一起就至少 100+

      • 128 根本不够用

    • 更何况日文里面用日本汉字

      • 虽然只有2000个不到

      • 但是是文化的象征

    • 不过假名毕竟是假的

      • 日文中最厉害的还是汉字

    汉字文化

    • 日语中混有各种汉字

    • 感觉根本不用翻译

    • 也会造一些日本汉字

    汉字发音含义凪なぎ风平 浪静雫しずく水滴 如雨下躾しつけ教育榊さかき寺庙里的 树

    评选年度汉字

    • 所以日文中的字符直接超过2000+

      • 1 个字节 是不够了

      • 至少需要 2 个字节

    • 日本规格协会制定标准

      • JIS X 0212

    • 点阵字库 产生了

      • 日本汉字的黑体模式

    无衬线黑体风格

    • 无衬线

      • 注重实效

      • 注重清晰度

      • 黑体

    • 任何字帖一般都有两种风格

      • 板正规范的生硬风格

      • 圆润灵动的手写风格

    手写风格

    • 不像大写字母

      • 那么生硬

    • 就像小写字母

      • 那么圆滑

    • 韩文字符又是如何编码的呢?

    韩文

    • 韩文也是一种拼音文字

      • 从此韩文有了谚文

      • 基础字母有二十四个

      • 符号是朝鲜王朝世宗大王时创作的

    • 但是韩国士大夫会写汉字

      • 不愿意推广谚文

    拼音

    • 不过拼音文字

      • 更容易一些

    • 谚文书写 普及速度 比汉字书写 快得多

    • 拼音 是有结构的

    谚文结构

    • 谚文是由表音符号组合而成的

      • 有各种间架结构

    • 这些声旁都发什么音呢?

    声音

    • 韩文名字

      • 宋仲基(송중기)

      • 金喜善(김희선)

      • 李英爱(이영애)

      • 阿一古(아이구)

      • 圆圈不发音

    • 从此就连哎呦喂(阿一古)

      • 都有了标准发音方法

      • 用拼音文字把读音固化下来

    • 谚文有多少字符呢?

    谚文字符

    • 声母韵母拼写在一起算一个

      • 共 554 个

    • 而且这还不算朝鲜汉字

    • 这554个基础字符导致

      • 1 个字节不够

      • 2 个字节才够

    • 韩文的字符集为

      • KS X 1001

    总结

    • 日韩各有 编码格式

      • 有谚文

      • 有朝鲜汉字

      • 数量超过500

      • 一个字节 放不下

      • 字符数量超过20000+

      • 有假名

      • 有日本汉字

      • 五十音

      • 一字节 可以勉强放下

      • 字符数量超过20000+

      • 日本

      • 韩国

      • 作为 汉字源头的中国

        • 究竟应该 如何对汉字 进行编码 呢?🤔

      • 我们下次再说!*

      • 蓝桥->https://www.lanqiao.cn/courses/3584

      • github->https://github.com/overmind1980/oeasy-python-tutorial

      • gitee->https://gitee.com/overmind1980/oeasypython


      [oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文的评论 (共 条)

      分享到微博请遵守国家法律