词条 | ISO 639-3 |
释义 | ISO 639-3 是个国际语种代号标准,在2007年2月5日出版。它延伸了 ISO 639-2 里的 Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是 ISO 639-1 的超集合。 ISO 639-3 是 ISO 639-2 个别语言的超集合,但是因为 ISO 639-3 没有 ISO 639-2 的语言集合,所以 ISO 639-3 不是整个 ISO 639-2 的超集合。 自2005年7月30日发布的计划草案,共有 7,602 个语言条目,这些语言的来源有三个:基本资料来自 ISO 639-2 所收录的个别语言,和取自《民族语》里的现代语言调查资料。而过去历史的各类语言及古老的语言和人工语言,则是出自 the Linguist List 的资料。 编码空间因为这是采用 3 个字母,所以这套 3 字母编码理论上最多可代表 26×26×26 = 17,576 种语言。但是,因 ISO 639-2 定义了4个特别代码、 520个预留区域和23个 B 类代码,故此 ISO 639-3 可用的编码只有 17,576 − 547 = 17,030 个。 其中有4个代码用来代表特殊情况: mis──“uncoded languages”(未编码语言); mul──“multiple languages”(多语种); und──“undetermined language”(未确定的语种); zxx──“no linguistic content”。标准中亦有一个供私人使用的范围: qaa-qtz。 大语言在 ISO 639-3 代码中,以下的语言被视为是某些其他语言的大语言 (macrolanguage),即这些语言可再细分为数种以上的语言。就以汉语为例,SIL 就把汉语细分为 14 种语言。 * 阿坎语(aka) * 阿拉伯语(ara) * 艾马拉语(aym) * 阿塞拜疆语(aze) * 俾路支语(bal) * 比科尔语(bik) * 布里亚特语(bua) * 马里语(chm) * 克里语(cre) * 特拉华语(del) * 史拉维语(den) * 丁卡语(din) * 多格拉语(doi) * 爱沙尼亚语(est)自2008-043号修订,2009年1月16日生效 * 波斯语(fas) * 弗里西亚语(fry) * 富拉语(ful) * 巴亚语(gba) * 贡德语(gon) * 格列博语(grb) * 瓜拉尼语(grn) * 海达语(hai) * 塞尔维亚-克罗地亚语(hbs) * 苗语(hmn) * 因纽特语(iku) * 依努庇克语(ipk) * 犹太-阿拉伯语(jrb) * 卡努里语(kau) * Kalenjin(kln)自2007-169号修订,2008年1月14日生效 * 孔卡尼语(kok) * 科米语(kom) * 刚果语(kon) * 克佩勒语(kpe) * 库尔德语(kur) * 拉亨达语(lah) * Luyia(luy)自2007-171号修订,2008年1月14日生效 * 曼丁哥语(man) * 马达加斯加语(mlg) * 蒙古语(mon) * 马来语(msa) * 马尔瓦利语(mwr) * 挪威语(nor) * 奥克语(oci) 由2007年3月14日取消 * 奥吉布瓦语(oji) * 奥洛莫语(orm) * 普什图语(pus) * 凯楚亚语(que) * 拉贾斯坦语(raj) * 吉普赛语(rom) * 阿尔巴尼亚语(sqi) * 撒丁语(srd) * 斯瓦希里语(swa) * 古叙利亚语(syr) * 塔马奇克语(tmh) * 乌兹别克语(uzb) * 依地语(yid) * 萨波特克语(zap) * 壮语(zha) * 汉语(zho) * 扎扎其语(zza) 集合语言SIL 在检视过七千多种语言之后,发现以下 11 种被列在 ISO 639-2 的语言,它们之下所包含的语言,并非属于同一语种,故在 ISO 639-3 代码中被删除。 列表参看ISO 639-2下的“用来代表集合语言的代码”段。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。