求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

ISO 639-3查看源代码讨论查看历史

Maintenance script讨论 | 贡献2022年8月25日 (四) 09:12的版本 (rollbackEdits.php mass rollback)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索
ISO 639-3

中文名: ISO 639-3

出 版: 2007年2月5日

目标: 涵盖所有语言

类 型: 代号

ISO 639-3 是国际语种代号标准,于2007年2月5日出版。[1]

它延伸了 ISO 639-2 里的 Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是 ISO 639-1 的超集合。 ISO 639-3 是 ISO 639-2 个别语言的超集合,但是因为 ISO 639-3 没有 ISO 639-2 的语言集合,所以 ISO 639-3 不是整个 ISO 639-2 的超集合。

自2005年7月30日发布的计划草案,共有 7,602 个语言条目,这些语言的来源有三个:基本资料来自 ISO 639-2 所收录的个别语言,和取自《民族语》里的现代语言调查资料。而过去历史的各类语言及古老的语言和人工语言,则是出自 the Linguist List 的资料。

编码空间

因为这是采用 3 个字母,所以这套 3 字母编码理论上最多可代表 26×26×26 = 17,576 种语言。但是,因 ISO 639-2 定义了4个特别代码、 520个预留区域和23个 B 类代码,故此 ISO 639-3 可用的编码只有 17,576 − 547 = 17,030 个。

其中有4个代码用来代表特殊情况:

mis──“uncoded languages”(未编码语言);

mul──“multiple languages”(多语种);

und──“undetermined language”(未确定的语种);

zxx──“no linguistic content”。标准中亦有一个供私人使用的范围: qaa-qtz。

大语言

在 ISO 639-3 代码中,以下语言被视为包含某些其他语言的大语言 (macrolanguage),如汉语被分为13种方言。

  • 阿拉伯语(ara)
  • 艾马拉语(aym)
  • 阿塞拜疆语(aze)
  • 俾路支语(bal)
  • 比科尔语(bik)
  • 布里亚特语(bua)
  • 马里语(chm)
  • 克里语(cre)
  • 史拉维语(den)
  • 丁卡语(din)
  • 多格拉语(doi)
  • 爱沙尼亚语(est)自2008-043号修订,2009年1月16日生效
  • 波斯语(fas)
  • 弗里西亚语(fry)
  • 富拉语(ful)
  • 贡德语(gon)
  • 格列博语(grb)
  • 瓜拉尼语(grn)
  • 海达语(hai)
  • 塞尔维亚-克罗地亚语(hbs)
  • 苗语(hmn)
  • 因纽特语(iku)
  • 依努庇克语(ipk)
  • 犹太-阿拉伯语(jrb)
  • 卡努里语(kau)
  • Kalenjin(kln)自2007-169号修订,2008年1月14日生效
  • 孔卡尼语(kok)
  • 科米语(kom)
  • 刚果语(kon)
  • 库尔德语(kur)
  • 拉亨达语(lah)
  • Luyia(luy)自2007-171号修订,2008年1月14日生效
  • 曼丁哥语(man)
  • 蒙古语(mon)
  • 马尔瓦利语(mwr)
  • 挪威语(nor)
  • 奥克语(oci) 由2007年3月14日取消
  • 奥吉布瓦语(oji)
  • 奥洛莫语(orm)
  • 普什图语(pus)
  • 凯楚亚语(que)
  • 拉贾斯坦语(raj)
  • 吉普赛语(rom)
  • 阿尔巴尼亚语(sqi)
  • 撒丁语(srd)
  • 斯瓦希里语(swa)
  • 古叙利亚语(syr)
  • 塔马奇克语(tmh)
  • 乌兹别克语(uzb)
  • 依地语(yid)
  • 萨波特克语(zap)
  • 扎扎其语(zza)

集合语言

通过对七千多种语言检查后,发现11种被列在 ISO 639-2的语言,它们之下所包含的语言并非属于同一语种,故在ISO 639-3中被删除。

列表参看ISO 639-2下的“用来代表集合语言的代码”段。

参考来源

  1. [ ], , --