「是嗎?」周至說道:「那為何我研究過一些關於文字系統的論述,結果發現一般中文應用系統,也需要一萬三千個左右的漢字;而大型的中文應用系統,則需要兩萬三千個左右的漢字;政府機關的專用中文應用系統,則需要四萬八千個左右的漢字;而大型圖書館用的中文應用系統,需要的漢字可能超過十萬呢?」
「哪裏這麼誇張?」李紅江是計算機信息技術的大拿,然而對漢字編碼也是半路出家,對於編碼算法,字庫編程,函數耦合等技術性的東西有豐富的經驗,然而大型圖書館需要超過十萬的漢字這種概念,也徹底顛覆了他的認知。
「的確有這麼誇張。」辜老說話了:「光康熙字典,就有四萬七千零三十五個漢字,也就是說,如果我們圖書館要對康熙字典進行數字化採集,你們這個還沒有投入的gb13000,將有一半的漢字,在系統當中顯示不出來。」
辜振鐸也開口了:「我主持編纂的《漢語大字典》,收入的單字也有五萬六千個,如果用gb2312標準,只夠一個零頭,如果用gb13000,也只夠一小半。」
旦增大師作為歷史系的重要人物,今天也參與了這個會議,這時候也說道:「大家不要忘了,我們祖國是一個多民族的國家,除了漢語以外,還有藏文,蒙文,壯文,維吾爾文等十多種文字,這些少數民族文字的信息化編碼工作,也是應該要納入考慮的。」
辜振鐸聽着都覺得有些過分,這最大最主要的語種都還沒有搞定呢,哪裏顧得到其他,於是說道:「這個要求也實在太苛刻了,得讓搞信息技術的同志們一步步來嘛」
「還不止這些啊!」旦增不退反進:「除了少數民族文字,還有古代文字呢,比如甲骨文,啊甲骨文不算,可以算作一種字體,但是突厥文,回鶻文、于闐文、西夏文,這些不能不算吧?」
「旦增主任,我們先解決主要矛盾,主要矛盾。」麥主任聽得頭都大了:「次要矛盾先放一放」
「不用放,無解。」李紅江將手一攤:「碼位就好像放字的盒子,碼位就那麼多,因此能放的字也就那麼多,gb13000標準兩萬一千零三個漢字,是我們經過辛苦的研究才搞出來的。」
「況且我們使用gb2312編碼這麼久了,除了一些生僻字以外,還是基本能夠滿足需要的嘛,這麼多年都這麼過來了,現在又擴展了這麼多,應該滿足絕大多數應用場景了嘛。」
「哈哈哈哈」辜幼文聽到這個說法,不禁沒有生氣,反而像聽到一個懵懂的孩童講出無忌的童言那般給逗樂了:「小王是理科生,以前是搞數學的是吧?所以你有這個想法我們也不怪你。」
「我給大家講一個歷史故事吧。」
「大禹治水的故事,大家都知道吧?」
所有人都是點頭。
「那大禹的父親,因為治水失敗而被舜殛死於羽山的鯀,大家知道嗎?」
這下理科參會者那邊,點頭的就少了一半。
「大禹的父親,名字叫鯀,鯀字有三種寫法,大家知道嗎?」
這回連文科這邊的教授都有不清楚的了。
「肘子,你來講。」辜老將裝逼的機會留給了周至。
周至只好接着:「鯀字有三種寫法,一種是大家熟悉的,一個魚,一個系;第二種是一個魚,一個玄;第三種是一個骨,一個系。」
「鯀是禹的父親,相傳為顓頊之子,一說顓頊五世孫,姒姓,字熙。居於今河南嵩山一帶,當時是崇地,所以稱有崇氏,又稱崇伯。」
「堯時洪水泛濫,鯀受四岳推薦治水,用築堤堵水之法,九年不成,被舜殛死於羽山,其子大禹改堵為疏,最終治水成功,到後來將天下傳給兒子啟,開啟了華夏『家天下』的時代,這就是夏朝。」
「辜老想說這個故事,我想是因為另一個生僻字。」
「很多記載,說堯令祝融殺鯀於羽山,鯀化為黃能,沉入羽淵。」
「關於這個字,有很多記載,《歸藏·啟筮》云:『化為黃龍。』《左傳·昭公十七年》云:『化為黃熊。』《國語·晉語八》云:『化為黃能。』《拾遺記·卷二》云:『化為玄魚。』」
第七百四十一章 生僻字的重要性