常用国字标准字体表


1972年,交通大学教授林树和资讯科学学者谢清俊合作,发表《中文电脑基本用字》的研究。该研究整理了过去十一种关于中文字的用字统计资料,并以社会通用语料为范畴,共计搜集了8532个不同的中文字(另有异体字作为参照字形,计597字)。依出现频率,划分为四个等级:最常用字1857字、次常用字2068字、间用字2182字,以及罕用字2425字[17][18][19]。

1973 年,中华文化复兴运动推行委员会成立“标准行书研究委员会”,研订手写简笔字(称为行书)的标准。于1977年完成《标准行书范本》,后交由台湾书店印行。1979年由教育部公告,试用三年后启用。《范本》列出4010个常用字(实收3998字),并旁附印刷楷体字形[20][21][22][23]。

1993年,中央研究院中文词知识库小组利用“中文新闻语料库”(撷取1990-91年的联合报、中国时报、自由时报及天下杂志)编制了《新闻语料字频统计表》,并依注音编制成索引,于1995年出版《注音检索现代汉语字频表》,共计5666字[24][25]。

1996年,教育部公布《常用国字标准字体笔顺手册》。2008年,教育部公布“常用国字标准字体笔顺学习网”试用版,2010年发布正式版,收录4808个常用字及37个注音符号的笔顺。2020年参酌《国语辞典简编本》扩充至6057字,并更名为“国字标准字体笔顺学习网”。2024年参酌《国语小字典》,再扩充至6063字[26]。

1997年,教育部出版《国语辞典简编本编辑资料字词频统计报告》,该研究是为编辑《国语辞典简编本》而抽取1992-93年的报刊杂志、畅销书和国中小国文课本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。该份统计报告的字频表共收录了5731字[27]。

1998年,教育部出版《八十四年常用语词调查报告书》,搜集了民国八十四年(1995年)之语料样本,进行字频和词频统计,并和《常用国字标准字体表》加以比较。教育部之后陆续出版民国八十五年、八十六年、八十七年之《常用语词调查报告书》[28]。1999年又出版《八十七年口语语料调查报告书》,搜集口语语料样本,其字频表收字3788字[29]。

2000年,教育部出版《国小学童常用字词调查报告书》[30],该研究对当时(1998-99年)国小学童的常用读物进行字频和词频统计,并和《常用国字标准字体表》加以比较,其字频表共收录5021字。该报告书后来编纂为《教育部常用字库辞典》,成为教育部识字量测验的数据库来源。

2012年,中华文化总会推出中华语文知识库,其“汉字源流汇编”收录常用汉字3000字,并依次列举甲骨文、金文、 战国文字、小篆、隶书、楷书六种字体,说明汉字形体之演变[31]。

2013年,教育部委托国家教育研究院推动“建置应用语料库及标准体系”的华语文教育计划。研究团队召开多次学者专家的咨询会议,又依据“台湾华语文语料库”的统计成果并征求资深华语文教师的意见,在2020年完成了“台湾华语文能力基准”的订定,作为非母语人士学习华语的能力指标及分级标准之凭据。该指标分为三等七级,其字表部分总计收录3100字[32][33]。

2018年,国家教育研究院出版《九十九年常用语词调查报告书》和《一○○至一○四年常用语词调查报告书》,采录民国99年(2010年),以及民国100至104年的语料,进行字频和词频统计,并和《常用国字标准字体表》加以比较。以2015年为例,其字频表收录5289字,字频10以上的字数为3404字,而《常用国字标准字体表》未收录但字频达10以上之高频字,共计117字。另外,在2010年至2015年各年度的字频表中,字频10以上的字数,介于3269字至3410字之间。与教育部《常用国字标准字体表》比较,每年均出现而未收录于该表的高频字有21个[34]。

2020年,国家教育研究院出版《解读新闻字词:新闻媒体常用语词调查(105-107年)》,将常用语词调查从多类型文本的抽样转变为对新闻文本的大数据分析,针对报导文章进行字频和词频统计。国教院陆续出版了后续年度的《解读新闻字词:新闻媒体常用语词调查》,其中有些年度调查会和《常用国字标准字体表》加以比较。“2010年至2015年”与“2016年至2020年”两期间的调查,虽采样来源和规模不同,但各年度常用字仍大致在3300字至3400字左右。2010年至2020年的共同常用字为2861字,再和《常用国字标准字体表》比较,两者的共同收录字为2824字[35]。

10月5日生日书(天秤座)
Vinfall@Geekademy